49th International Philological Conference (IPC 2020) in Homage to Professor Ludmila Verbitskaya (1936-2019)

Диалектный корпус и словарь: задачи интеграции

Мария Михайловна Угрюмова
Докладчик
доцент
Томский государственный университет

Ключевые слова, аннотация

Диалектный корпус, электронный словарь, говоры Среднего Приобья, цифровая диалектология.

Тезисы

Одной из главных тенденций развития диалектологической науки на современном этапе является цифровизация. В качестве особого направления в разработке цифровых диалектологических ресурсов выделяется корпусная диалектология, имеющая целью исследование синхронной вариативности языка и народной культуры. В настоящее время разработано несколько диалектных корпусов русского языка, в том числе Томский диалектный корпус (http://losl.tsu.ru/?q=corpus). Он базируется на экспедиционных материалах 70-летнего изучения среднеобских говоров. Общий объем ресурса на сегодняшний день — более 1 500 000 словоупотреблений. Создаваемый текстоориентированный корпус одновременно можно охарактеризовать как лексикоориентированный, т. к. одним из центральных объектов анализа среднеобских говоров на протяжении всего периода их изучения является лексика. Создание удобного формата представления диалектной лексики, функционирующей в тексте, возможно путем интеграции диалектного словаря и корпуса. Объектом интеграции является «Словарь русских старожильческих говоров средней части бассейна р. Оби» под ред. В. В. Палагиной (1964–1967), 2 дополнения к нему (1975 г.), 2 части «Среднеобского словаря» (1983–1986). Всего более 20 000 словарных статей. Планируется, что после интеграции пользователи получат следующие возможности:

1. Демонстрация  информации о диалектной единице (при наведении курсора на слово):
  • Начальная форма с ударением.
  • Морфологическая характеристика слова.
  • Пометы.
  • Толкование значения.
2. Поиск по лексико-семантическим категориям на основе словарных помет («усилительное», «уменьшительно-ласкательное», «снисходительное», «смягчительное», «женское» и др.).