44th International Philological Research Conference

О синтаксической связи в числовых конструкциях

Кирилл Кириллович Боярский
Докладчик
доцент
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики
Наталья Алексеевна Авдеева
Докладчик
старший лаборант
Санкт-Петербургский Экономико-математический институт

193
2015-03-12
14:20 - 14:40

Ключевые слова, аннотация

Доклад посвящен автоматической обработке числительных русского языка. Для числовых конструкции характерна «асимметрия прямых и косвенных падежей»: в именительном или винительном падеже числительное управляет существительным, а в косвенных падежах — согласуется с ним в числе и падеже (а иногда и в роде). Разбираются различные конструкции с числительными и возможные пути их синтаксического анализа с использование подхода, основанного на данной «асимметрии».

Тезисы

Сложность разбора числовых конструкций связана, в первую очередь, с нехарактерным способом связи числительных с другими частями речи – «асимметрией прямых и косвенных падежей». Она проявляется в том, что в прямых падежах (именительном или винительном) определенно-количественное числительное формально управляет существительным, а в остальных согласуется с ним. Например,
Он взял две
(вин.п.) книги (род. п., ед.ч.).

Он взял семь
(вин.п.) книг (род.п., мн.ч.).

В гостиной стоял стеллаж с девятью
(тв.п.) книгами (тв.п., мн.ч.).

Часть лингвистов считает, что вершиной данной конструкции всегда является существительное [3], другие же вершиной определяют числительное [2;4]. Исключением является числительное один, которое всегда согласуется с существительным. Кроме того, числительные в прямом падеже иногда изменяют морфологические характеристики связанных с ними единиц таким образом, что нарушается связь этих единиц с другими. Например, в конструкции с числительными существительные могут сочетаться с несогласованными прилагательными:
Они заказали три
(вин.п.) круглых (род.п., мн.ч.) стола (род.п., ед.ч.).

Еще одним пример – ситуация, когда числительное выступает в качестве подлежащего. В этом случае сказуемое может употребляться в единственном или множественном числе («вошло семь студентов», «вошли семь студентов»). Причем в подобных случаях подлежащим иногда выступает предложная группа. Это также характерно только для предложений с числительными:

С 1898 года выполнено около 550 экспериментальных работ.

С другой стороны, числительные могут быть записаны в виде цифры, что усложняет процесс их обработки, особенно, если с ними связано существительное в сокращенной форме:
Работа оператора будет стоить 2-5 долл.

Их морфологические характеристики и синтаксические связи могут быть установлены только по анализу контекста («не менее 75 млн.»).

Анализ предложений с числовыми конструкциями проводился с помощью парсера SemSin, который построен на основе грамматики зависимостей [1].
При разработке правил обработки числительных нами было выбрано альтернативное решение, основанное на «асимметрии падежей»: в прямых падежах числительное управляет существительным, а в косвенных — зависит от него. Первая группа правил применяется в самом начале анализа предложения для анализа числительных в прямых падежах. В результате существительное связывается с числительным по родительному падежу. Вторая группа, обрабатывающая числительные в косвенных падежах, используется в середине разбора. Такой порядок обусловлен тем, что конструкции с числительным в прямом падеже необходимо находить в первую очередь. Иначе могут возникнуть определенные несоответствия форм. Например, при связывании прилагательного и существительного им может быть приписан неверный падеж: спелые груши (им./вин. п.), но две спелые груши (род. п., ед. ч.), две спелых груши (род. п., ед. ч.).
Таким образом, в результате разбора отображаются два разных типа связи:
1. «Род», для числительных в прямых падежах: ТРИ > (Род)> СТУЛА;

2. «Сколько», для числительных в косвенных падежах:
СТУЛЬЯМИ>(Сколько)>ДВУМЯ.


Литература:
1.
Боярский, К.К. Каневский Е.А. Семантико-синтаксический анализатор SemSin // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной Международной конференции «Диалог-2012». – М.: Изд-во РГГУ, 2012. [Электронный ресурс].
URL: http://www.dialog-21.ru/digests/dialog2012/materials/pdf/Kanevsky.pdf
2.
Исакадзе, Н. В. Отражение морфологии и референциальной семантики именной группы в формальном синтаксисе. М.: МГУ, 1998.

3.
Мельчук, И. А. Поверхностный синтаксис русских числовых выражений. Wien: Wiener Slawistisher Almanach, 1985.

4.
Corbett, G. G. The head of Russian numeral expressions / G.G. Corbett // Heads in Grammatical Theory.