46th International Philological Research Conference

О текстовых иллюстрациях в прикладном семантическом словаре

Софья Юльевна Семенова
Докладчик
старший научный сотрудник
Институт научной информации по общественным наукам РАН, РГГУ

210
2017-03-13
17:00 - 17:20

Ключевые слова, аннотация

Компьютерный семантический словарь, текстовые иллюстрации в словаре, обновление иллюстративного материала, структурирование словарной статьи.

Тезисы

Сообщение посвящено вопросам иллюстрирования семантического словаря для автоматического анализа текста. Рассматривается русский компьютерный словарь РУСЛАН, создававшийся на рубеже 1990–2000-х гг. в НИВЦ МГУ под руководством Н. Н. Леонтьевой при участии автора [Леонтьева, Семенова, 2003]. Статьи составлены на символьном метаязыке, разработанном Н. Н. Леонтьевой. В настоящее время возникла потребность модернизации словаря РУСЛАН, при сохранении, в основном, его структуры и метаязыка. В задачи модернизации входят расширение и статистически выверенное выравнивание словника, уточнение описаний полисемии и валентностей, формализованное описание ситуаций-денотатов предикатных слов, развитие зоны текстовых иллюстраций. Изначально словарные статьи не иллюстрировались в базе данных словаря (а лишь в бумажных черновиках), затем база стала пополняться примерами, преимущественно модельными, показывающими насыщение валентностей. Далее предполагается обновление контекстов, а также структуризация зоны иллюстраций, разделение на поля, демонстрирующие разные аспекты поведения слова (лексемы): заполнение валентностей (с указанием основной иллюстрируемой валентности), употребление фразеологизмов, примеры с нечетко выделяемыми лексемами, полные и усеченные варианты цитат. Основной источник примеров — НКРЯ. Основная стратегия — отбор контекстного окружения, наиболее типичного для лексемы (с перспективой использования примеров при дизамбигуации). В сообщении будет затронута экспериментальная работа с корпусным материалом.
Литература
Леонтьева Н. Н., Семенова С. Ю. Семантический словарь РУСЛАН как инструмент компьютерного понимания // Понимание в Коммуникации. Материалы научно-практической конференции. 5–6 марта 2003 г. М.: МГГИИ, 2003. С. 41–46.