Разработка базы данных по семантике русских предлогов
            Екатерина Владимировна Еникеева
        
        
        Докладчик
        
        
        аспирант
Санкт-Петербургский государственный университет
    Санкт-Петербургский государственный университет
            Анна Денисовна Москвина
        
        
        Докладчик
        
        
        аспирант
Санкт-Петербургский государственный университет
    Санкт-Петербургский государственный университет
193
2019-03-21
16:50 -
        17:10
    Ключевые слова, аннотация
    Русские предлоги, предложные конструкции, значение предлогов, корпусная лингвистика, база данных.
Тезисы
    База данных — удобная форма представления систематизированной информации, ее обработки и оценки. Наш проект направлен на корпусно-ориентированное квантитативное описание системы русских предлогов. Отбор предложных конструкций начинается с составления и оптимизации запросов к корпусам с последующим ручным анализом и разметкой полученных конструкций, списки которых хранятся в виде таблиц. Запросы учитывают управление предлога определенным падежом, разрывность конструкций, частеречную принадлежность главных и зависимых слов. Каждой конструкции приписывается ее частота, реализованное в ней значение предлога, данные об их частотности, семантические классы главных и зависимых слов. Работа ведется параллельно на нескольких корпусах с целью получить усредненные параметры для всего языка и изучить «поведение» предлогов применительно к разным функциональным стилям. Мы используем и храним такую информацию, как все допустимые в русском языке значения конкретного предлога; падежи, которыми он управляет; отношения синонимии; расширенные списки контекстов в качестве примеров употребления. Формат базы данных позволяет автоматизировать часть задач, связанных с подсчетом количественных показателей (частота, проценты, ipm), упростить установление связей между семантическими и структурными свойствами конструкций, а также обеспечивает прямой доступ к отдельным интересующим нас данным, как, например, все случаи употребления предлога «в» в значении локатива. С точки зрения пользователя, разрабатываемая база данных позволит посмотреть примеры употребления и статистику, связанные с любым конкретным предлогом, где в качестве ключа поиска могут выступать падеж, тип, значение, корпус, семантический класс хозяев и слуг, а также любые их комбинации.