Словарь абстрактных/конкретных слов русского языка
Валерий Дмитриевич Соловьев
Докладчик
главный научный сотрудник
Казанский (Приволжский) федеральный университет
Казанский (Приволжский) федеральный университет
Ключевые слова, аннотация
Русский
язык, словари, конкретность, абстрактность, психосемантические эксперименты,
корпусы.
Тезисы
В
различных исследованиях в лингвистике, психологии, нейрофизиологии, клинической
медицине важно различение абстрактных и конкретных слов. Для английского языка путем
опроса носителей языка созданы обширные словари (до 40 тыс. слов) с указанием
степени абстрактности/конкретности (http://crr.ugent.be/papers/Concreteness_ratings_ Brysbaert_et_al_BRM.xlsx). В
нашем проекте мы создаем аналогичные словари для русского языка. Проведен
психосемантический эксперимент, в котором носителям языка предлагалось оценить по
шкале от 1 до 5 степень абстрактности/конкретности слов. На текущий момент
получен словарь из 1000 слов (существительных), планируется его расширение до
2000 слов. Для каждого слова мы получили не менее 40 оценок с последующим
усреднением. В опросах принимали участие студенты КФУ и БГПУ (Минск). Однако
этот подход очень трудозатратен.
Другой
подход состоит в автоматическом извлечении оценок абстрактности/конкретности слов
из корпуса текстов. Использовался подкорпус русского языка из Google Books Ngram (https://books.google.com/ngrams). Основная идея
алгоритма состоит в том, что абстрактные слова употребляются вместе с абстрактными,
а конкретные с конкретными. Построен словарь, содержащий 88 тыс. словоформ. Этим
методом обнаружены конкретные и абстрактные слова, пропущенные в соответствующих
томах Русского семантического словаря под редакцией Н. Ю. Шведовой. Созданные
нами словари с экспертной и автоматической оценками размещены на сайте проекта по
адресу https://kpfu.ru/tehnologiya-sozdaniya-semanticheskih-elektronnyh.html.