Формирование списка писателей и каталога их произведений для корпуса русского рассказа первой трети XX в.
Татьяна Юрьевна Шерстинова
Докладчик
доцент
НИУ ВШЭ СПб
НИУ ВШЭ СПб
193
2019-03-21
17:15 -
17:35
Ключевые слова, аннотация
Корпусная
лингвистика, русская литература, русский рассказ, база данных персоналий,
каталогизация текстов.
Тезисы
При составлении списка авторов и их произведений указанного
периода используется системный подход, предложенный русским писателем и
ученым-словесником Ю. Н. Тыняновым. Этот подход основан на стремлении к максимально
полной каталогизации авторов и их произведений, т. е. на описании всей
литературы данной эпохи. Это означает, что Тыняновский подход отвергает
концентрацию внимания исследователя исключительно на выдающихся авторах и их лучших
произведениях. Тынянов предлагает обратить внимание также на творчество периферийных писателей, образующих
литературный «быт» конкретной эпохи.
Именно в нем, быть может, на самой далекой периферии, рождаются ростки нового,
которые пышным цветом расцветают в эпоху, следующую за данной. Тыняновский
подход являлся несомненно революционным, однако по сути — декларативным, так
как отличаясь безусловной размашистостью, он не мог в то время быть реально
выполненным, хотя бы из-за отсутствия необходимых технических средств. Отправной точкой построения корпуса, разрабатываемого на кафедре математической лингвистики СПбГУ, является составление
представительного перечня авторов, писавших в рассматриваемую эпоху (1900–1930
гг.). В докладе рассматриваются принципы построения базы данных персоналий (максимально
полного перечня авторов-прозаиков), биографической информации о писателях и каталога
рассказов, опубликованных в исследуемый период. При формировании списка авторов
используется энциклопедическая информация, существующие библиографические
указатели, каталоги библиотек и интернет-источники. На момент подготовки
доклада перечень авторов включает 2700 имен, для 300 из них собрана
биографическая информация. Каталог рассказов, для которых существуют цифровые
версии, насчитывает 4200 произведений и
продолжает пополняться. Ведется работа по оцифровке произведений «забытых»
писателей.
Исследование выполнено при поддержке Российского фонда фундаментальных исследований, грант № 17-29-09173 офи_м «Русский язык на рубеже радикальных исторических перемен: исследование языка и стиля предреволюционной, революционной и постреволюционной художественной прозы методами математической и компьютерной лингвистики (на материале русского рассказа)».
Исследование выполнено при поддержке Российского фонда фундаментальных исследований, грант № 17-29-09173 офи_м «Русский язык на рубеже радикальных исторических перемен: исследование языка и стиля предреволюционной, революционной и постреволюционной художественной прозы методами математической и компьютерной лингвистики (на материале русского рассказа)».