Методы обработки материалов корпуса разных исторических периодов немецкого языка (на примере слова Tugend)
Татьяна Андреевна Лазарева
Докладчик
старший преподаватель
Московский государственный институт международных отношений
Московский государственный институт международных отношений
201
2023-03-16
18:00 -
18:15
Ключевые слова, аннотация
Ключевые слова: корпусная лингвистика; лексикология; диахрония; историческая семантика; дискурс
Аннотация: В исследовании рассматривается вопрос о методах обработки данных корпуса различных периодов истории немецкого языка. Материалом служат тексты средневерхненемецкого и современного периодов, ключевым словом выступает лексема Tugend. Анализ выполняется с учетом принципа историзма.
Key words: corpus linguistics, lexicology, diachrony, historical semantics, discourse
Abstract: The study deals with the issue of data processing methods in the corpus of various periods of the history of the German language. The research material contains the texts of the Middle High German and modern period, the lexeme Tugend is the key word. The analysis is carried out according to the principle of historicism.
Аннотация: В исследовании рассматривается вопрос о методах обработки данных корпуса различных периодов истории немецкого языка. Материалом служат тексты средневерхненемецкого и современного периодов, ключевым словом выступает лексема Tugend. Анализ выполняется с учетом принципа историзма.
Key words: corpus linguistics, lexicology, diachrony, historical semantics, discourse
Abstract: The study deals with the issue of data processing methods in the corpus of various periods of the history of the German language. The research material contains the texts of the Middle High German and modern period, the lexeme Tugend is the key word. The analysis is carried out according to the principle of historicism.
Тезисы
Исследование
посвящено методам работы с данными корпусов двух периодов истории немецкого
языка — средневерхненемецкого и нововерхненемецкого — и о различиях, которые
лежат в основе составления и обработки корпуса с точки зрения принципа
историзма[1].
В
качестве ресурсов для работы с современным немецким языком используется портал
Мангеймского корпуса немецкого языка[2], а
источником материалов для средневерхненемецкого периода служит портал Bibliotheca Augustana[3].
Заявленная
тема не сводится к решению технических вопросов, связанных с обзором ресурсов и
способов работы с ними. Проблема обработки лексики в диахронии представляется намного
шире, чем оцифровка средневековых источников с учетом их орфографических
особенностей, поскольку необходимо принимать во внимание особенности эпохи, в
которую создаются исторические тексты.
Принципиальные
отличия в содержании понятий освещаются в рамках концепции истории понятий (Begriffsgeschichte), предложенной Р. Козеллеком. Особенно
важным представляется «переломный» момент, в который часть абстрактной лексики,
значимой для социальной жизни, подвергается переосмыслению, т.е. она начинает
описывать не реальное, а потенциальное содержание, необходимое
для формирования будущего, которое должно реализоваться благодаря новшествам
грядущей эпохи [Koselleck 1995: 113].
Слово Tugend с этой точки зрения переосмыслено не только
в XVIII–XIX вв.; уже к началу средневерхненемецкого
периода (XI в.)
оно претерпело расширение значения, превратившись из обозначения силы и пригодности
воина к битве в обозначение совокупности нравственных или придворных добродетелей,
что семантически отражено и в конституентах поля tugent в средневерхненемецком.
Процесс
дальнейшего расширения значения, начавшийся в XIX столетии, не завершен до сих пор, поэтому
методологический подход к работе с корпусом XIX–ХХ веков остается единообразным, в то время
как анализ корпуса средневерхненемецкого периода выполняется более точечно в
плане морфологии и словообразования, а также установления парадигматических
связей внутри поля tugent с учетом таких особенностей, как дискурс и социальная история.
Состав
двух корпусов сильно различается по содержанию и объему.
В состав
средневерхненемецкого корпуса вошли 64 произведения в период с 1070 по 1350
гг., в которых лексема tugent упоминается 1381 раз. В избранном материале можно назвать несколько
ключевых дискурсов. Духовная поэзия, изложения Священного Писания, трактаты
мистиков и переводы богословской литературы составляют религиозный дискурс;
рыцарский роман, эпический роман, миннезанг, кодексы чести, хроники Крестовых
походов и войн составляют дискурс придворной культуры. Лексема tugent, таким образом, встречается в таких темах,
как жизнь Церкви, мораль и духовная жизнь в рамках религиозного дискурса
и нормы поведения, служение, подвиги, любовь, война в рамках дискурса придворной
культуры.
Современный
корпус охватывает период с 1772 по 2021 гг., включает в себя 78902 текста, в
которых слово Tugend упоминается 95164 раза. Материал автоматически разделен в общей
сложности по 49 тематическим рубрикам. Темы в соответствии с рубриками можно
объединить «вручную»: например, Politik: Inland; Politik: Ausland или Kultur: Filme; Kultur: Musik. Тогда можно говорить о 12 укрупненных
темах, в число которых вошли: Kultur, Politik, Sport, Wirtschaft-Finanzen и
ряд других. Эти темы отражают существующие дискурсы, в рамках которых лексема Tugend продолжает свое семантическое развитие: культурный, социальный,
политический, спортивный, дискурс развлечений, экономический, технический,
научный, дискурс здоровья и питания, экологии, и пр.
Различия в объемах и содержании двух корпусов
обусловливают необходимость применения принципа историзма при исследовании
лексики обеих эпох, а также анализ не только лингвистических параметров, но и
социально-исторического фона создания текстов. Такой подход предполагает
следующие способы обработки данных: подсчет частотности словесного окружения лексемы Tugend с помощью инструментов электронного
корпуса для установления ее
семантической эволюции в каждом дискурсе;анализ лексической семантики, обусловленной не только
внутренней формой слова, которая важна в свн. корпусе и утрачивает значение в
нвн. (при помощи компонентного и
морфологического анализа), но и меняющейся под влиянием смены дискурсов (при
помощи составления семантического поля и анализа его конституентов).
Список литературы
1. Koselleck R. Vergangene Zukunft. Zur Semantik geschichtlicher Zeiten, Frankfurt am Main: Suhrkamp, 1995. S. 107-143.
2. DeReKo. URL: https://www.ids-mannheim.de/digspra/kl/projekte/korpora/ 3. Bibliotheca Augustana. URL: https://www.hs-augsburg.de/~harsch/germanica/Chronologie/d_chrono.html
4. Новая философская энциклопедия: в 4 т. / Институт философии РАН; Национальный общественно-научный фонд. URL: https://iphlib.ru/library/collection/newphilenc/page/about
Список литературы
1. Koselleck R. Vergangene Zukunft. Zur Semantik geschichtlicher Zeiten, Frankfurt am Main: Suhrkamp, 1995. S. 107-143.
2. DeReKo. URL: https://www.ids-mannheim.de/digspra/kl/projekte/korpora/ 3. Bibliotheca Augustana. URL: https://www.hs-augsburg.de/~harsch/germanica/Chronologie/d_chrono.html
4. Новая философская энциклопедия: в 4 т. / Институт философии РАН; Национальный общественно-научный фонд. URL: https://iphlib.ru/library/collection/newphilenc/page/about
[1]
Новая философская энциклопедия: в 4 т. / Институт философии РАН; Национальный
общественно-научный фонд
https://iphlib.ru/library/collection/newphilenc/page/about