Анализ структурных особенностей нефразеологизированных коллокаций
Виктория Дмитриевна Баринова
Докладчик
студент 3 курса
Национальный исследовательский университет «Высшая школа экономики»
Национальный исследовательский университет «Высшая школа экономики»
Ключевые слова, аннотация
В докладе представлены результаты исследования структурных особенностей и особенностей функционирования нефразеологизированных коллокаций в современной речи на материале корпуса «Один речевой день», а также устного подкорпуса и подкорпуса «Социальные сети» Национального корпуса русского языка. Кроме того, обсуждается вопрос применимости термина «коллокация» к единицам, функционирующим в устной речи. Особое внимание уделено описанию этого класса устойчивых неоднословных единиц, с одной стороны, и корректировке конкретных единиц, в него вошедших, с другой.
Тезисы
Ключевые слова: нефразеологизированные коллокации; устойчивые неоднословные единицы; статистические метрики
В работе исследуются структурные особенности нефразеологизированных коллокаций (НК) как подкласса устойчивых неоднословных единиц (УНЕ) с опорой на автоматическую разметку и статистические данные. Актуальность исследования обусловлена отсутствием четких критериев выделения НК в рамках корпусного анализа устной речи, а также терминологическими неточностями, возникающими при детальном рассмотрении единиц, вошедших в класс НК.
Целью исследования является выявление структурных и прагматических особенностей НК посредством анализа автоматической разметки и статистического анализа, что позволяет уточнить критерии выделения НК, а также пересмотреть необходимость отнесения определенных единиц к НК.
Методологическая база исследования включает корпусный анализ с использованием данных корпуса «Один речевой день» (ОРД), содержащего звукозаписи повседневной речевой коммуникации, устного подкорпуса и подкорпуса «Социальные сети» Национального корпуса русского языка (НКРЯ) .
Анализ проведен с применением количественных и качественных методов, включая анализ автоматической разметки и статистическую обработку данных при помощи следующих метрик: MI3, T-score, Log-likelihood, Dice и др. Количественные методы применялись при систематизации накопленной теоретической базы относительно определений термина «коллокация».
Практическая значимость исследования заключается в возможности его применения для дальнейшей систематизации УНЕ в рамках изучения устной повседневной речи на материале ОРД.
Полученные результаты могут быть использованы при создании лингвистических словарей, совершенствовании алгоритмов обработки естественного языка и обучении русскому языку как иностранному.
Таким образом, данное исследование позволяет более точно охарактеризовать особенности нефразеологизированных коллокаций, уточняя понятия «устойчивость» и «нефразеологизированность», ставит под вопрос допустимость употребления термина «коллокация» применительно к единицам устной речи, что привносит вклад в описание единиц, функционирующих в устной повседневной речи. Кроме того, в процессе работы был уточнен список единиц, относящихся к классу НК.
В работе исследуются структурные особенности нефразеологизированных коллокаций (НК) как подкласса устойчивых неоднословных единиц (УНЕ) с опорой на автоматическую разметку и статистические данные. Актуальность исследования обусловлена отсутствием четких критериев выделения НК в рамках корпусного анализа устной речи, а также терминологическими неточностями, возникающими при детальном рассмотрении единиц, вошедших в класс НК.
Целью исследования является выявление структурных и прагматических особенностей НК посредством анализа автоматической разметки и статистического анализа, что позволяет уточнить критерии выделения НК, а также пересмотреть необходимость отнесения определенных единиц к НК.
Методологическая база исследования включает корпусный анализ с использованием данных корпуса «Один речевой день» (ОРД), содержащего звукозаписи повседневной речевой коммуникации, устного подкорпуса и подкорпуса «Социальные сети» Национального корпуса русского языка (НКРЯ) .
Анализ проведен с применением количественных и качественных методов, включая анализ автоматической разметки и статистическую обработку данных при помощи следующих метрик: MI3, T-score, Log-likelihood, Dice и др. Количественные методы применялись при систематизации накопленной теоретической базы относительно определений термина «коллокация».
Практическая значимость исследования заключается в возможности его применения для дальнейшей систематизации УНЕ в рамках изучения устной повседневной речи на материале ОРД.
Полученные результаты могут быть использованы при создании лингвистических словарей, совершенствовании алгоритмов обработки естественного языка и обучении русскому языку как иностранному.
Таким образом, данное исследование позволяет более точно охарактеризовать особенности нефразеологизированных коллокаций, уточняя понятия «устойчивость» и «нефразеологизированность», ставит под вопрос допустимость употребления термина «коллокация» применительно к единицам устной речи, что привносит вклад в описание единиц, функционирующих в устной повседневной речи. Кроме того, в процессе работы был уточнен список единиц, относящихся к классу НК.