XLIII Международная филологическая научная конференция

Некоторые свойства переходных глаголов (на примере семантико-синтаксического анализатора SemSin)

Кирилл Кириллович Боярский
Докладчик
доцент
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики

193
2014-03-13
14:45 - 15:05

Ключевые слова, аннотация

Доклад посвящен проблемам снятия морфологической омонимии с использованием некоторых свойств переходных глаголов. В семантико-синтаксическом анализаторе SemSin определение связей глагола начинается с поиска прямого дополнения. Иногда это приводит к ошибкам в случае совпадения родительного и винительного падежей. Во многих случаях проблему удается разрешить за счет предварительного поиска генитивной или предложной группы, или инфинитивного оборота, которые могут выступать в качестве прямого дополнения у ряда глаголов.

Тезисы

При автоматическом разборе предложений русского языка с неизбежностью возникает проблема снятия морфологической неоднозначности. В данном сообщении мы хотим обсудить некоторые пути решения этой задачи, использованные авторами при разработке семантико-синтаксического анализатора SemSin. В ряде случаев, как, например, при определении падежей, формальные подходы не приводят к желаемому результату, т.к. отсутствуют четкие критерии правильности разбора. В результате дерево оказывается построено, висячие вершины отсутствуют, а смысл с точки зрения человека отсутствует тоже. Таково, например, предложение: Мусор следует сжигать в специально отведённых местах. Здесь мусор – Им. или Вин., подлежащее или дополнение? Предлагаемый нами подход базируется на двух принципах: тщательное определение порядка применения правил и максимальное использование словарной информации. После нахождения предиката программа пытается определить связи глагола. В каноническом случае переходной глагол имеет не только прямое дополнение, но и подлежащее. С учетом падежной омонимии одно и то же существительное может быть или подлежащим, или прямым дополнением, или генитивной группой. В нашем случае, прежде всего, делается попытка найти прямое дополнение. При этом учитывается, какие семантические классы существительных могут присоединяться к данному глаголу. Реализация данного подхода выразилась в организации четырех последовательно проводимых поисков прямого дополнения вправо и влево от предиката. Для правильного разбора отдельных предложений нам пришлось ввести две группы глаголов, выпадающих из семантических классов. Это переходные глаголы, которые «слабо хотят» прямое дополнение (типа бить, показать, пройти) и которые «сильно хотят» прямое дополнение (автоматизировать, снять). Однако этого оказалось недостаточно, так что нам пришлось ввести дополнительный контроль на присутствие таких синтаксических конструкций, как генитивная и предложная группы или инфинитивный оборот.