Корпус русского рассказа начала XX в. как инструмент лингвостатистического анализа
Татьяна Георгиевна Скребцова
Докладчик
доцент
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
Александр Олегович Гребенников
Докладчик
доцент
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
Ключевые слова, аннотация
Электронный
корпус текстов, русский рассказ, литературный жанр, стилеметрия, частотный
словарь.
Тезисы
На
настоящий момент на материале русского языка создан ряд частотных словарей
отдельных писателей (Андреева, Чехова, Куприна, Бунина), дающих представление о
ключевых темах их творчества и особенностях авторского стиля. Однако вплоть до
последнего времени научное сообщество было лишено возможности делать подобные
заключения относительно произведений разных авторов, относящихся к одной эпохе,
поскольку отсутствовал репрезентативный, хорошо сбалансированный электронный
корпус соответствующих текстов. Эту лакуну восполняет создаваемый в СПбГУ «Корпус
русских рассказов 1900–1930-х гг.», насчитывающий несколько тысяч единиц и
включающий произведения как известных, так и второстепенных писателей.
Настоящее исследование строится на базе выборки из 100 рассказов, датированных
1900–1916 гг. Работа направлена на анализ данной выборки с точки зрения
жанровых особенностей. Выявление тематической, композиционной и стилистической
специфики материала вскрывает отраженную в рассказе языковую картину мира,
позволяя судить об общественно-политической атмосфере предреволюционной поры. Для
указанной выборки был построен частотный словарь, который сравнивается с
данными частотных словарей отдельных авторов и частотного словаря русского
языка. Строгость сопоставления обеспечивается опорой на ранги знаменательных
слов, а не на их абсолютную частоту. Анализ верхних рангов частотного списка
выявил ряд знаменательных слов, отличающихся повышенной частотностью на фоне
данных как авторских словарей, так и словаря общего языка (например, толпа,
дети, душа, сердце, чувство, бог, мысль, молчать). Показано, что это
связано с тематикой рассказов или, чаще, способом подачи содержательного
материала.