О текстовых иллюстрациях в прикладном семантическом словаре
Софья Юльевна Семенова
Докладчик
старший научный сотрудник
Институт научной информации по общественным наукам РАН, РГГУ
Институт научной информации по общественным наукам РАН, РГГУ
210
2017-03-13
17:00 -
17:20
Ключевые слова, аннотация
Компьютерный семантический словарь, текстовые иллюстрации в словаре, обновление иллюстративного материала, структурирование словарной статьи.
Тезисы
Сообщение посвящено вопросам иллюстрирования семантического
словаря для автоматического анализа
текста. Рассматривается русский
компьютерный словарь РУСЛАН, создававшийся на рубеже 1990–2000-х гг. в НИВЦ
МГУ под руководством Н. Н. Леонтьевой при участии автора [Леонтьева, Семенова,
2003]. Статьи составлены на символьном метаязыке, разработанном Н. Н.
Леонтьевой. В настоящее
время возникла потребность модернизации словаря РУСЛАН, при сохранении, в
основном, его структуры и метаязыка. В задачи модернизации входят расширение и статистически выверенное выравнивание
словника, уточнение описаний полисемии и
валентностей, формализованное описание ситуаций-денотатов предикатных
слов, развитие зоны текстовых иллюстраций. Изначально
словарные статьи не иллюстрировались в базе данных словаря (а лишь в бумажных
черновиках), затем база стала пополняться примерами, преимущественно модельными,
показывающими насыщение валентностей. Далее предполагается обновление контекстов,
а также структуризация зоны иллюстраций, разделение на поля, демонстрирующие
разные аспекты поведения слова (лексемы): заполнение валентностей (с указанием
основной иллюстрируемой валентности), употребление фразеологизмов, примеры с
нечетко выделяемыми лексемами, полные и усеченные варианты цитат. Основной источник примеров — НКРЯ. Основная
стратегия — отбор контекстного окружения, наиболее типичного для лексемы (с перспективой
использования примеров при дизамбигуации). В сообщении будет затронута экспериментальная работа с корпусным
материалом.
Литература
Леонтьева Н. Н., Семенова С. Ю. Семантический словарь РУСЛАН как инструмент компьютерного понимания // Понимание в Коммуникации. Материалы научно-практической конференции. 5–6 марта 2003 г. М.: МГГИИ, 2003. С. 41–46.
Литература
Леонтьева Н. Н., Семенова С. Ю. Семантический словарь РУСЛАН как инструмент компьютерного понимания // Понимание в Коммуникации. Материалы научно-практической конференции. 5–6 марта 2003 г. М.: МГГИИ, 2003. С. 41–46.