46th International Philological Research Conference

Ядро и периферия частотного словаря устной повседневной речи

Григорий Яковлевич Мартыненко
Докладчик
профессор
Санкт-Петербургский государственный университет

193
2017-03-16
15:35 - 15:55

Ключевые слова, аннотация

Математическая лингвистика, квантитативная лингвистика, частотный словарь, ядро, периферия, устная повседневная речь, правило сложения дисперсий.

Тезисы

Предлагается метод формального расчленения частотного словаря устной речи на ядро и периферию двумя методами, основанными на приеме скольжения по частотному распределению от минимальных значений к максимальным и фиксации на каждом шаге значений двух статистик: средних величин в левой и правой частях распределения и эмпирического корреляционного отношения между правой и левой частями. Вторая характеристика вычисляется на основе правила сложения дисперсий (правила прямоугольного треугольника), согласно которому общая дисперсия расщепляется на среднюю групповых дисперсий и межгрупповую дисперсию средних, а эмпирическое корреляционное отношение есть корень квадратный из отношения межгрупповой дисперсии к общей дисперсии. Метод апробирован на материале речевого корпуса ОРД, существенное расширение которого было осуществлено при поддержке гранта РНФ N 14-18-02070 «Русский язык повседневного общения: особенности функционирования в разных социальных группах». В итоге получены  ряды, отражающие «движение» величины рассматриваемых показателей от минимальной частоты, равной единице, до максимальной. Характерные точки кривой (точки перегиба и точки экстремума) этого динамического ряда дают возможность точно определить границу между ядром частотного словаря и его периферией. Так, в 100-тысячном частотном словаре повседневной речи объем ядра составил лишь 38 лемм, на которые приходится 39%  словоупотреблений (на периферию 61%). Это позволяет сделать вывод о существенно большей лексической концентрации в словаре повседневной речи в сравнении со словарями, построенными на материале текстов различных жанров письменной речи.