О синтаксической связи в числовых конструкциях
Кирилл Кириллович Боярский
Докладчик
доцент
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики
Наталья Алексеевна Авдеева
Докладчик
старший лаборант
Санкт-Петербургский Экономико-математический институт
Санкт-Петербургский Экономико-математический институт
193
2015-03-12
14:20 -
14:40
Ключевые слова, аннотация
Доклад
посвящен автоматической обработке числительных русского языка. Для числовых
конструкции характерна «асимметрия прямых и косвенных падежей»: в именительном
или винительном падеже числительное управляет существительным, а в косвенных
падежах — согласуется с ним в числе и падеже (а иногда и в роде). Разбираются
различные конструкции с числительными и возможные пути их синтаксического
анализа с использование подхода, основанного на данной «асимметрии».
Тезисы
Сложность
разбора числовых конструкций связана, в первую очередь, с нехарактерным
способом связи числительных с другими частями речи – «асимметрией прямых и
косвенных падежей». Она проявляется в том, что в прямых падежах (именительном
или винительном) определенно-количественное числительное формально управляет существительным,
а в остальных согласуется с ним. Например,
Он взял две (вин.п.) книги (род. п., ед.ч.).
Он взял семь (вин.п.) книг (род.п., мн.ч.).
В гостиной стоял стеллаж с девятью (тв.п.) книгами (тв.п., мн.ч.).
Часть лингвистов считает, что вершиной данной конструкции всегда является существительное [3], другие же вершиной определяют числительное [2;4]. Исключением является числительное один, которое всегда согласуется с существительным. Кроме того, числительные в прямом падеже иногда изменяют морфологические характеристики связанных с ними единиц таким образом, что нарушается связь этих единиц с другими. Например, в конструкции с числительными существительные могут сочетаться с несогласованными прилагательными:
Они заказали три (вин.п.) круглых (род.п., мн.ч.) стола (род.п., ед.ч.).
Еще одним пример – ситуация, когда числительное выступает в качестве подлежащего. В этом случае сказуемое может употребляться в единственном или множественном числе («вошло семь студентов», «вошли семь студентов»). Причем в подобных случаях подлежащим иногда выступает предложная группа. Это также характерно только для предложений с числительными:
С 1898 года выполнено около 550 экспериментальных работ.
С другой стороны, числительные могут быть записаны в виде цифры, что усложняет процесс их обработки, особенно, если с ними связано существительное в сокращенной форме:
Работа оператора будет стоить 2-5 долл.
Их морфологические характеристики и синтаксические связи могут быть установлены только по анализу контекста («не менее 75 млн.»).
Анализ предложений с числовыми конструкциями проводился с помощью парсера SemSin, который построен на основе грамматики зависимостей [1]. При разработке правил обработки числительных нами было выбрано альтернативное решение, основанное на «асимметрии падежей»: в прямых падежах числительное управляет существительным, а в косвенных — зависит от него. Первая группа правил применяется в самом начале анализа предложения для анализа числительных в прямых падежах. В результате существительное связывается с числительным по родительному падежу. Вторая группа, обрабатывающая числительные в косвенных падежах, используется в середине разбора. Такой порядок обусловлен тем, что конструкции с числительным в прямом падеже необходимо находить в первую очередь. Иначе могут возникнуть определенные несоответствия форм. Например, при связывании прилагательного и существительного им может быть приписан неверный падеж: спелые груши (им./вин. п.), но две спелые груши (род. п., ед. ч.), две спелых груши (род. п., ед. ч.).
Таким образом, в результате разбора отображаются два разных типа связи:
1. «Род», для числительных в прямых падежах: ТРИ > (Род)> СТУЛА;
2. «Сколько», для числительных в косвенных падежах:
СТУЛЬЯМИ>(Сколько)>ДВУМЯ.
Литература:
1. Боярский, К.К. Каневский Е.А. Семантико-синтаксический анализатор SemSin // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной Международной конференции «Диалог-2012». – М.: Изд-во РГГУ, 2012. [Электронный ресурс]. URL: http://www.dialog-21.ru/digests/dialog2012/materials/pdf/Kanevsky.pdf
2. Исакадзе, Н. В. Отражение морфологии и референциальной семантики именной группы в формальном синтаксисе. М.: МГУ, 1998.
3. Мельчук, И. А. Поверхностный синтаксис русских числовых выражений. Wien: Wiener Slawistisher Almanach, 1985.
4. Corbett, G. G. The head of Russian numeral expressions / G.G. Corbett // Heads in Grammatical Theory.
Он взял две (вин.п.) книги (род. п., ед.ч.).
Он взял семь (вин.п.) книг (род.п., мн.ч.).
В гостиной стоял стеллаж с девятью (тв.п.) книгами (тв.п., мн.ч.).
Часть лингвистов считает, что вершиной данной конструкции всегда является существительное [3], другие же вершиной определяют числительное [2;4]. Исключением является числительное один, которое всегда согласуется с существительным. Кроме того, числительные в прямом падеже иногда изменяют морфологические характеристики связанных с ними единиц таким образом, что нарушается связь этих единиц с другими. Например, в конструкции с числительными существительные могут сочетаться с несогласованными прилагательными:
Они заказали три (вин.п.) круглых (род.п., мн.ч.) стола (род.п., ед.ч.).
Еще одним пример – ситуация, когда числительное выступает в качестве подлежащего. В этом случае сказуемое может употребляться в единственном или множественном числе («вошло семь студентов», «вошли семь студентов»). Причем в подобных случаях подлежащим иногда выступает предложная группа. Это также характерно только для предложений с числительными:
С 1898 года выполнено около 550 экспериментальных работ.
С другой стороны, числительные могут быть записаны в виде цифры, что усложняет процесс их обработки, особенно, если с ними связано существительное в сокращенной форме:
Работа оператора будет стоить 2-5 долл.
Их морфологические характеристики и синтаксические связи могут быть установлены только по анализу контекста («не менее 75 млн.»).
Анализ предложений с числовыми конструкциями проводился с помощью парсера SemSin, который построен на основе грамматики зависимостей [1]. При разработке правил обработки числительных нами было выбрано альтернативное решение, основанное на «асимметрии падежей»: в прямых падежах числительное управляет существительным, а в косвенных — зависит от него. Первая группа правил применяется в самом начале анализа предложения для анализа числительных в прямых падежах. В результате существительное связывается с числительным по родительному падежу. Вторая группа, обрабатывающая числительные в косвенных падежах, используется в середине разбора. Такой порядок обусловлен тем, что конструкции с числительным в прямом падеже необходимо находить в первую очередь. Иначе могут возникнуть определенные несоответствия форм. Например, при связывании прилагательного и существительного им может быть приписан неверный падеж: спелые груши (им./вин. п.), но две спелые груши (род. п., ед. ч.), две спелых груши (род. п., ед. ч.).
Таким образом, в результате разбора отображаются два разных типа связи:
1. «Род», для числительных в прямых падежах: ТРИ > (Род)> СТУЛА;
2. «Сколько», для числительных в косвенных падежах:
СТУЛЬЯМИ>(Сколько)>ДВУМЯ.
Литература:
1. Боярский, К.К. Каневский Е.А. Семантико-синтаксический анализатор SemSin // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной Международной конференции «Диалог-2012». – М.: Изд-во РГГУ, 2012. [Электронный ресурс]. URL: http://www.dialog-21.ru/digests/dialog2012/materials/pdf/Kanevsky.pdf
2. Исакадзе, Н. В. Отражение морфологии и референциальной семантики именной группы в формальном синтаксисе. М.: МГУ, 1998.
3. Мельчук, И. А. Поверхностный синтаксис русских числовых выражений. Wien: Wiener Slawistisher Almanach, 1985.
4. Corbett, G. G. The head of Russian numeral expressions / G.G. Corbett // Heads in Grammatical Theory.