«Литературные шкатулки» в дистрибутивно-семантических и вероятностных тематических моделях языка: методика исследования
Ольга Александровна Митрофанова
Докладчик
доцент
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
Ключевые слова, аннотация
Дистрибутивная семантика, тематическое
моделирование, художественный корпус, моделирование сюжета, метаповествование.
Тезисы
В докладе
обсуждается методика исследования сюжетных характеристик художественных
текстов, основанная на алгоритмах дистрибутивной семантики и тематического
моделирования. В фокусе исследования находятся так называемые «литературные
шкатулки» — тексты, созданные с помощью рекурсивной художественной техники
метаповествования. Гипотеза исследования состоит в том, что неоднородность
сюжетной организации текста должна найти отражение в его квантитативных моделях.
Методологической базой исследования является интеграция тематических моделей
типа LDA и
дистрибутивно-семантических моделей типа Word2Vec. Эксперименты проводятся
на материале «шкатулочных» романов: «Мастер и Маргарита»
М. А. Булгакова, «Хитроумный идальго Дон Кихот Ламанчский» М. де Сервантеса, «Рукопись,
найденная в Сарагосе» Я. Потоцкого, «Мельмонт Скиталец» Ч. Метьюрина, «Хромая
судьба» А. и Б. Стругацких и ряда других. Тематическое моделирование позволяет идентифицировать отдельные темы или группы
тем, связанные с компонентами рамочной структуры исследуемых текстов как в
оригинале, так и в переводе (переводах). Извлечение ассоциатов для
лексем-тематизаторов с помощью дистрибутивно-семантических моделей дополняет
результаты тематического моделирования. В докладе также обсуждаются вопросы введения
конструкций в униграммные тематические модели, процедуры выбора обобщающих меток
для тем и ряд других.