О семантике русских предлогов
Виктор Павлович Захаров
Докладчик
доцент
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
193
2019-03-22
14:45 -
15:05
Ключевые слова, аннотация
Русские
предлоги, предложные конструкции, семантика предлогов, корпусная лингвистика,
корпусная статистика.
Тезисы
В докладе ставится вопрос о семантике предлогов и
способах ее описания для использования при автоматизированной обработке
текста. Предлоги в русском
языке не пользуются особым вниманием со стороны специалистов по
автоматическому анализу текста. Данная заявка является частью большого проекта по
описанию предложных конструкций, направленного на решение ряда задач.
Методология — корпусный подход в сочетании с
дистрибутивно-статистическим анализом. Экспериментальный материал — различные корпусы, в том числе, созданные специально для целей исследования.
Основные задачи проекта:
- Описание совокупности русских предлогов как связанной синонимичной системы. Русские предлоги в основном полисемичны. Отношение между их планом выражения и планом содержания описывается как «многие ко многим»: почти каждый предлог является многозначным, и каждое значение может быть выражено разными предлогами, причем не только первообразными.
- Описание частотности употребления предлогов в том или ином значении. Описывается технология обработки корпусных данных, а именно, отбор по запросам собственно предложных конструкций и подсчет частот значений каждого предлога в текстах разных жанров. Отдельный вопрос — что такое значение предлога. Одновременно собирается статистика о семантических классах главных и зависимых слов.
- Описание семантики предлогов как элемента реализации синтаксических связей между знаменательными словами. Предложные конструкции реализуют связь двух знаменательных слов, уточняя и конкретизируя ее с учетом соединяющего их предлога. Семантика предлога определяется лексико-семантическими и морфологическими характеристиками главного и зависимого слова. Значения предлогов определяются как функция от семантических классов главного и зависимого слова, а могут быть и пустыми. Данный подход позволит описывать предложные конструкции в терминах глубинного синтаксиса.