Работает как часы: база данных на материале сравнительных конструкций вида V как N
Мария Александровна Объедкова
Докладчик
студент 3 курса
Национальный исследовательский университет «Высшая школа экономики»
Национальный исследовательский университет «Высшая школа экономики»
Татьяна Больгина
Докладчик
студент 3 курса
Национальный исследовательский университет «Высшая школа экономики»
Национальный исследовательский университет «Высшая школа экономики»
Ольга Андреевна Брускова
Докладчик
студент 3 курса
Национальный исследовательский университет «Высшая школа экономики»
Национальный исследовательский университет «Высшая школа экономики»
Елена Емельянова
Докладчик
студент 3 курса
Национальный исследовательский университет «Высшая школа экономики»
Национальный исследовательский университет «Высшая школа экономики»
193
2016-04-20
13:00 -
13:20
Ключевые слова, аннотация
Доклад посвящен созданию базы данных конструкций «V как N». В теоретической части работы анализируются
наиболее частотные русские конструкции «V как N»
(например, блестеть как алмаз, лететь как
стрела) с точки зрения классов глаголов и существительных. В технической
части работы была создана база данных с возможностью поиска и просмотра
закономерностей классов. Благодаря анализу конструкций и возможностям базы
данных получилось выявить определенные закономерности между классами глаголов и
существительных в конструкциях, а также некоторые интересные классы конструкций
в русском языке.
Тезисы
В последние годы на фоне
развития корпусных ресурсов появились принципиально новые возможности для
анализа данных о сочетаемости и частотности языковых единиц. Подобные коллекции
хранятся в виде словарей и баз данных, позволяющих пользователю строить
различные поисковые запросы. Настоящая работа посвящена базе данных, содержащей
конструкции вида «V как N» (краснеть как рак, устать как собака и т. д.).
Работа состоит из двух
частей: теоретической и практической. Теоретическая часть работы заключалась в
анализе 245 наиболее частотных конструкций «V как N», взятых из Национального
Корпуса Русского Языка. Конструкции отбирались с точки зрения их частотности и
релевантности для исследования (нас интересовали только конструкции, где
сравнение происходит с объектом). Для каждой конструкции были выделены
возможные виды глагольного субъекта (субъектом не всегда является человек, ср.
глаза блестели как алмазы), а для эталонов сравнения отмечалось, является ли он
расширенной именной группой или именем, стоящим в косвенном падеже. Все
глаголы, встречающиеся в конструкциях, были расклассифицированы по
таксономическим и акциональным классам, а эталоны сравнения — по семантическим
классам. В итоге мы получили упорядоченные данные, необходимые для создания
базы данных.
В практической части была
реализована база данных, которая позволяет осуществлять поиск по самим
конструкциям, а также по глаголам и существительным, входящим в их состав.
Кроме того, в базе данных можно посмотреть автоматически выявляемые
закономерности (например, какие классы глаголов тяготеют к каким классам
эталонов сравнения).
В ходе анализа собранного
материала и благодаря возможностям базы данных были выявлены определенные
закономерности, касающиеся сочетаемости тех или иных классов глаголов с
классами эталонов сравнения, а также целый ряд своеобразных конструкций
русского языка. Ниже приведены некоторые из полученных сочетаемостных
закономерностей:
- глаголы зрительного восприятия присоединяют к себе «физические свойства или состояния» (смотреть как завороженный);
- глаголы ненаправленного движения тоже присоединяют к себе «физические свойства или состояния» (бежать как угорелый) и различных животных (вертеться как белка в колесе, летать как птица);
- глаголы постепенного изменения состояния или признака присоединяют к себе природные объекты (расти как сорняки, таять как снег);
- глаголы света присоединяют к себе драгоценные материалы (блестеть как бриллиант) или природные объекты (светиться как звезда);
- глаголы звука присоединяют к себе «ментальные свойства человека» (орать как умалишенный), животных (петь как соловей) и детей (визжать как ребенок);
- глаголы эмоции присоединяют к себе «ментальные свойства человека» (орать как умалишенный) и детей (радоваться как дитя).