Некоторые свойства переходных глаголов (на примере семантико-синтаксического анализатора SemSin)
Кирилл Кириллович Боярский
Докладчик
доцент
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики
193
2014-03-13
14:45 -
15:05
Ключевые слова, аннотация
Доклад посвящен проблемам снятия морфологической
омонимии с использованием некоторых свойств переходных глаголов. В
семантико-синтаксическом анализаторе SemSin определение связей глагола
начинается с поиска прямого дополнения. Иногда это приводит к ошибкам в случае
совпадения родительного и винительного падежей. Во многих случаях проблему
удается разрешить за счет предварительного поиска генитивной или предложной
группы, или инфинитивного оборота, которые могут выступать в качестве прямого
дополнения у ряда глаголов.
Тезисы
При автоматическом разборе
предложений русского языка с неизбежностью возникает проблема снятия
морфологической неоднозначности. В данном сообщении мы хотим обсудить некоторые
пути решения этой задачи, использованные авторами при разработке
семантико-синтаксического анализатора SemSin.
В ряде случаев, как, например,
при определении падежей, формальные подходы не приводят к желаемому результату,
т.к. отсутствуют четкие критерии правильности разбора. В результате дерево
оказывается построено, висячие вершины отсутствуют, а смысл с точки зрения
человека отсутствует тоже. Таково, например, предложение:
Мусор следует сжигать в
специально отведённых местах.
Здесь мусор – Им. или Вин.,
подлежащее или дополнение?
Предлагаемый нами подход
базируется на двух принципах: тщательное определение порядка применения правил
и максимальное использование словарной информации.
После нахождения предиката
программа пытается определить связи глагола. В каноническом случае переходной
глагол имеет не только прямое дополнение, но и подлежащее. С учетом падежной
омонимии одно и то же существительное может быть или подлежащим, или прямым
дополнением, или генитивной группой. В нашем случае, прежде всего, делается
попытка найти прямое дополнение. При этом учитывается, какие семантические
классы существительных могут присоединяться к данному глаголу.
Реализация данного подхода выразилась в организации
четырех последовательно проводимых поисков прямого дополнения вправо и влево от
предиката.
Для правильного разбора отдельных предложений нам пришлось
ввести две группы глаголов, выпадающих из семантических классов. Это переходные
глаголы, которые «слабо хотят» прямое дополнение (типа бить, показать,
пройти) и которые «сильно хотят» прямое дополнение (автоматизировать,
снять).
Однако этого оказалось
недостаточно, так что нам пришлось ввести дополнительный контроль на
присутствие таких синтаксических конструкций, как генитивная и предложная
группы или инфинитивный оборот.