К модернизации русского прикладного семантического словаря: поле семантических характеристик и его локальный метаязык
Софья Юльевна Семенова
Докладчик
старший научный сотрудник
Институт научной информации по общественным наукам РАН, РГГУ
Институт научной информации по общественным наукам РАН, РГГУ
191
2018-03-20
16:40 -
17:00
Ключевые слова, аннотация
Русский прикладной семантический словарь, формальный
метаязык, унификация словарных описаний
Тезисы
Сообщение посвящено вопросам модернизации русского
семантического словаря РУСЛАН для автоматического анализа текста. Первые
версии словаря созданы в1990-е—2000-е
гг. под руководством Н. Н. Леонтьевой при участии
автора. С 2017 г. начались работы по обновлению и расширению этой лексикографической системы, поддержанные
грантом РФФИ (РГНФ): проект №17-04-00594 «Автоматический словарь РУСЛАН:
обновленная концепция, новая лексика».
Поле семантических
характеристик (СХ) — обязательное. В
нем указывается таксономический класс
слова. В метаязыке словаря, разработанном Леонтьевой, предусмотрено около 50
стандартных СХ: ПРЕДМЕТ, ВЕЩЕСТВО, ДЕЙСТВИЕ и др., и около 70 смысловых
отношений (СО): ВРЕМЯ (A, B), ЧАСТЬ (A, B) и др. СО используются прежде всего для описания актантов, но могут
фигурировать как обычные СХ. Во многих случаях смысл слова описывается в форме
конъюнкции дескрипторов: СХ (филиал)
= ОРГАНИЗАЦИЯ & ЧАСТЬ. Конъюнкции моделируют компонентную структуру слова. Работа
по модернизации словаря включает редактирование
поля СХ (с теоретическим осмыслением реального
использования метаязыковых средств).
Редактирование направлено в т.ч. на унификацию применения дескрипторов
при описании семантически близких сущностей;
напр., частеречных коррелятов (авария — аварийный). Важный момент при
отражении компонентной структуры — часто
имеющая место неравнозначность конъюнктов. Для ее отражения сложился свой «малый» синтаксис: некоторые дескрипторы
играют роль операторов; их сфера действия распространяется на стоящие справа
дескрипторы. Так, СО СВЯЗАН
используется для понижения ранга соседа справа. Напр., запись СХ (бензин) = ВЕЩЕСТВО & СВЯЗАН &
ЭНЕРГИЯ означает, что бензин относится к классу веществ. А пара СВЯЗАН &
ЭНЕРГИЯ - что вещество
является энергоносителем. Уделяется внимание
унификации применения подобных формул. Работа с полем СХ помогает выявить экстенсионал дескрипторов как лексических единиц.