XXI Открытая конференция студентов-филологов в СПбГУ

Анализ употребления цветных слов в русском языке на материале поэтического, газетного и устного подкорпусов НКРЯ

Наталья Николаевна Новикова
Докладчик
студент 2 курса
Санкт-Петербургский государственный университет

Холл 2-го этажа
2018-04-16
15:00 - 15:10

Ключевые слова, аннотация

Целью исследования является сравнение и анализ употребления слов с семой «цвет» в поэтическом, устном и газетном корпусах НКРЯ. При сопоставлении количества словоупотреблений «цветных» прилагательных выяснилось, что в поэтическом корпусе их ipm практически в 7 раз выше, чем в двух других корпусах («цветные» слова составляют здесь 0,913% объема, показатели для газетного и устного корпусов равны 0,143% и 0,122%). В число пяти наиболее частотных лемм во всех корпусах входят прилагательные «белый», «черный» и «красный». Интерес для дальнейших исследований представляют слова с неоднозначностью.

Тезисы

Целью исследования является сравнение и анализ употребления слов с семой «цвет» в Национальном корпусе русского языка. В качестве материала выступают поэтический, газетный и устный подкорпуса НКРЯ. Методика исследования заключается в последовательном сравнении и анализе объема и релевантности выдачи в каждом из подкорпусов прилагательных, наречий и непредметных существительных с семой «цвет». Большое внимание уделяется также ошибкам в разметке текстов и анализу причин выдачи нерелевантных контекстов. К примеру, при поиске прилагательных выдавались такие результаты, как: …на днях электрик (сема — цвет) дядя Федя и его помощник… и многие другие.
При сопоставлении в данных трех подкорпусах НКРЯ количества словоупотреблений слов, обозначающих цвет, подтверждается предположение, что в поэтическом корпусе их ipm значительно выше, чем в двух других корпусах. «Цветные» слова в поэтическом корпусе составляют 0,913% объема, показатели для газетного и устного корпусов равны 0,143% и 0,122% соответственно. Среднее значение ipm для отобранных прилагательных в поэтическом корпусе примерно в 7 раз превышает эти значения в газетном и устном корпусах. При этом в число пяти наиболее частотных лемм во всех корпусах входят прилагательные белый, черный и красный.
Интерес для следующих исследований представляют слова с морфологической неоднозначностью, например, многократно повторяемое в газетных текстах слово СИЗО, которому ошибочно приписывается лемма «сизый», а также многозначные названия цветов, как, например, слова красные, белые, обозначающие в данном контексте не цвет, а группу лиц с определенными политическими убеждениями, фамилии, производные от названий цветов (Андрей Белый), а также спорные случаи разметки текстов в Национальном корпусе русского языка.