46th International Philological Research Conference

Лексическая разметка в Корпусе «Один речевой день»: структура и методика исследования

Мария Денисовна Королькова
Докладчик
научный сотрудник
Институт лингвистических исследований РАН

129
2017-03-16
17:00 - 17:30

Ключевые слова, аннотация

Русская устная спонтанная речь, Звуковой корпус, лексическая разметка, пометы, социолингвистические исследования.

Тезисы

Доклад посвящен лексической разметке в Корпусе «Один речевой день». Целью лексической разметки является описать некоторые особенности словарного состава разговорной речи современных городских носителей русского языка и выявить основные параметры, по которым явно видны различия в речи говорящих разного возраста и социального положения.
На данном этапе исследования выделены следующие лексические пометы: хронологические (NEO — неологизмы, OLD — устаревшие), фразеологические (IDIOM — устойчивые выражения), функциональные (SPESH — специальная лексика), стилистические (OFST — официальный, NOF — неофициальный, SRV — стилистически сниженная лексика, EUPH — эвфемизм, BRAN — бранное), прагматические (ETI — этикетные формы), словообразовательные (DIM — диминутив, AUG — аугментатив, SING — единичные, NA — nomina agentis (имена деятеля), NF — женские формы деятеля).
Классификация является фасетной, т. е. одно и то же слово может иметь несколько помет. Пометы расставляются вручную, последовательно по всем расшифровкам Корпуса, так как при расстановке помет учитывается значение слов, которое может зависеть от контекста. Кроме того, список слов, имеющих те или иные пометы, является открытым, т. е. пополняется в процессе осуществления разметки. Функциональные и стилистические пометы на данном этапе выделяются обобщенно, что обеспечивает базу для создания более подробной и точной классификации.
В настоящий момент получены предварительные результаты особенностей речи информантов различных возрастных и профессиональных групп в корпусе ОРД.
Исследование проведено на материале социолингвистического расширения корпуса ОРД, выполненного в рамках проекта «Русский язык повседневного общения: особенности функционирования в разных социальных группах» (грант РНФ № 14-18-02070).