49th International Philological Conference (IPC 2020) in Homage to Professor Ludmila Verbitskaya (1936-2019)

«Литературные шкатулки» в дистрибутивно-семантических и вероятностных тематических моделях языка: методика исследования

Ольга Александровна Митрофанова
Докладчик
доцент
Санкт-Петербургский государственный университет

Ключевые слова, аннотация

Дистрибутивная семантика, тематическое моделирование, художественный корпус, моделирование сюжета, метаповествование.

Тезисы

В докладе обсуждается методика исследования сюжетных характеристик художественных текстов, основанная на алгоритмах дистрибутивной семантики и тематического моделирования. В фокусе исследования находятся так называемые «литературные шкатулки» — тексты, созданные с помощью рекурсивной художественной техники метаповествования. Гипотеза исследования состоит в том, что неоднородность сюжетной организации текста должна найти отражение в его квантитативных моделях. Методологической базой исследования является интеграция тематических моделей типа LDA и дистрибутивно-семантических моделей типа Word2Vec. Эксперименты проводятся на материале «шкатулочных» романов: «Мастер и Маргарита» М. А. Булгакова, «Хитроумный идальго Дон Кихот Ламанчский» М. де Сервантеса, «Рукопись, найденная в Сарагосе» Я. Потоцкого, «Мельмонт Скиталец» Ч. Метьюрина, «Хромая судьба» А. и Б. Стругацких и ряда других. Тематическое моделирование позволяет  идентифицировать отдельные темы или группы тем, связанные с компонентами рамочной структуры исследуемых текстов как в оригинале, так и в переводе (переводах). Извлечение ассоциатов для лексем-тематизаторов с помощью дистрибутивно-семантических моделей дополняет результаты тематического моделирования. В докладе также обсуждаются вопросы введения конструкций в униграммные тематические модели, процедуры выбора обобщающих меток для тем и ряд других.