XLVIII Международная филологическая научная конференция

Формирование списка писателей и каталога их произведений для корпуса русского рассказа первой трети XX в.

Татьяна Юрьевна Шерстинова
Докладчик
доцент
НИУ ВШЭ СПб

193
2019-03-21
17:15 - 17:35

Ключевые слова, аннотация

Корпусная лингвистика, русская литература, русский рассказ, база данных персоналий, каталогизация текстов.

Тезисы

При составлении списка авторов и их произведений указанного периода используется системный подход, предложенный русским писателем и ученым-словесником Ю. Н. Тыняновым. Этот подход основан на стремлении к максимально полной каталогизации авторов и их произведений, т. е. на описании всей литературы данной эпохи. Это означает, что Тыняновский подход отвергает концентрацию внимания исследователя исключительно на выдающихся авторах и их лучших произведениях. Тынянов предлагает обратить внимание также на творчество периферийных писателей, образующих литературный «быт» конкретной эпохи. Именно в нем, быть может, на самой далекой периферии, рождаются ростки нового, которые пышным цветом расцветают в эпоху, следующую за данной. Тыняновский подход являлся несомненно революционным, однако по сути — декларативным, так как отличаясь безусловной размашистостью, он не мог в то время быть реально выполненным, хотя бы из-за отсутствия необходимых технических средств. Отправной точкой построения корпуса, разрабатываемого на кафедре математической лингвистики СПбГУ, является составление представительного перечня авторов, писавших в рассматриваемую эпоху (1900–1930 гг.). В докладе рассматриваются принципы построения базы данных персоналий (максимально полного перечня авторов-прозаиков), биографической информации о писателях и каталога рассказов, опубликованных в исследуемый период. При формировании списка авторов используется энциклопедическая информация, существующие библиографические указатели, каталоги библиотек и интернет-источники. На момент подготовки доклада перечень авторов включает 2700 имен, для 300 из них собрана биографическая информация. Каталог рассказов, для которых существуют цифровые версии, насчитывает 4200 произведений и продолжает пополняться. Ведется работа по оцифровке произведений «забытых» писателей.
Исследование выполнено при поддержке Российского фонда фундаментальных исследований, грант № 17-29-09173 офи_м «Русский язык на рубеже радикальных исторических перемен: исследование языка и стиля предреволюционной, революционной и постреволюционной художественной прозы методами математической и компьютерной лингвистики (на материале русского рассказа)».