XLIV Международная филологическая научная конференция

Представление хорватских глаголических текстов в электронном формате

Marica Cuncic
Докладчик
директор
Staroslavenski institut

4-У
2015-03-13
11:05 - 11:30

Ключевые слова, аннотация

В процессе дигитализации хорватских глаголических текстов в Старославянском институте в Загребе используется целый ряд программ, которые будут представлены в докладе. Особое значение имеет программа транслитерации на латиницу и средневековую кириллицу, дополненная возможностями вводить конкретные сведения о памятнике, странице или листе, строках, буквах и лексемах. Основной единицей информации при описании всех памятников нашего корпуса является слово, описываемое по релевантным параметрам, по которым возможен поиск, и включаемое в базу данных.

Тезисы

Старославянский институт в Загребе располагает целым рядом компьютерных программ, создававшихся в течение нескольких последних лет для обработки отдельных баз данных по хранящимся в институте материалам в рамках руководимого автором научно-исследовательского проекта по глаголической палеографии.  Дигитализация была бы невозможна без участия высококвалифицированного специалиста по информационным технологиям Антония Магдича, который владеет изучаемым в институте материалом и, в качестве сотрудника, адаптирует к этому материалу все компьютерные программы.
Раньше других были начаты работы над программой "Библиография чтений хорватских глаголических миссалов и бревиариев" (Bibliografija čitanja hrvatskoglagoljskih misala i brevijara), позволяющей  собирать и обрабатывать сведения о библейских отрывках; затем была создана программа "Источники" (Izvori), содержащая все сведения о глаголических памятниках, их оригиналах и копиях, электронных копиях и публикациях в Интернете. Программа "Словарь церковнославянского языка хорватской редакции" (Rječnik crkvenoslavenskoga jezika hrvatske redakcije) включает в свой состав сканированные рукописные карточки алфавитного каталога и каталога адресов чтений, распознавание которых производится применением особой технологии OCR. Программа "Миниатюры" (Minijature) представляет список и
многоуровневое описание большого количества миниатюр глаголическх рукописей.
Одной из самых сложных является программа "Транслитерации"
(Transliteracije), посредством которой вводятся  сведения о конкретном
памятнике, странице или листе, о цвете и размере букв, инициалах и месте лексемы в строке. Глаголические буквы транслитерируются на латиницу и средневековую кириллицу. Единицей информации является слово хорватского церковнославянского языка, которое описывается по более чем ста грамматическим параметрам, по которым возможен дальнейший поиск. Все лексемы корпуса включаются в базу данных для составления словаря отдельного памятника или корпуса нескольких памятников. Существует возможность введения греческих и латинских параллелей, лексемы которых также вносятся в базу данных. Возможности программ будут продемонстрированы на примерах памятников хорватского церковнославянского языка XI-XIII вв. (Konavoski natpis, Natpis Župe dubrovačke,  Baščanska ploča, Mihanovićev fragment apostola, Splitski fragment misala).
В 2014-м году Старославянский институт получил статус Научного
excellent-центра по изучению хорватского глаголитизма, в который входят почти все сотрудник института, коллеги из иных хорватских и зарубежных университетов и научно-исследовательских учреждений. В частности, центр решает задачу дигитализации текстов хорватских глаголических литургических кодексов, созданных в Бераме в Истрии на хорватском церковнославянском языке и хранящихся в Любляне. Создается база данных, позволяющая осуществлять максимально детальный поиск как по всему корпусу, так и по тексту отдельного памятника: по всем изменяемым и неизменяемым частям речи, по максимальному числу грамматических категорий (падеж, число, время, вид и др.), по лигатурам, орфографическим знакам, миниатюрам, инициалам, цвету букв и проч. Программа требует больших коллективных усилий при внесении данных. Но чем больше лексем уже внесено в базу, тем легче ее пополнение, поскольку уже внесенные ранее слова предлагаются в качестве возможного варианта. Мы надеемся на новые ценные результаты, которые позволят самыми современными методами изучать хорватский церковнославянский язык, литературу, палеографию, литургию, миниатюры и историю хорватского глаголического наследия.