XLVIII Международная филологическая научная конференция

Использование корпусов параллельных текстов во фразеографии (на материале немецкого языка)

Ирина Сергеевна Парина
Докладчик
доцент
Нижегородский государственный лингвистический университет им. Н. А. Добролюбова

171
2019-03-21
14:40 - 14:55

Ключевые слова, аннотация

Параллельный корпус, фразеология, фразеография.

Тезисы

Доклад посвящен использованию корпусов немецко-русских и русско-немецких параллельных текстов, входящих в состав НКРЯ (http://www.ruscorpora.ru/search-para-de.html), для исследования и словарного описания фразеологизмов.
Параллельный корпус представляет собой корпус текстов, в котором оригинальные тексты представлены вместе с переводами на один или несколько языков. Результаты поиска в параллельном корпусе выглядят как фрагмент текста, содержащий искомую единицу, и соответствующий ему фрагмент перевода. Корпус снабжен метаразметкой, включающей в себя информацию об авторе, переводчике, времени создания произведения и перевода. Это позволяет использовать его для социолингвистических и литературоведческих исследований — но, в первую очередь, для исследований в области сопоставительной лексикологии, лексикографии и переводоведения.
Во фразеографии параллельный корпус может находить различное применение:
  • как источник иллюстративных примеров для словарной статьи;
  • как материал для подбора словарных соответствий;
  • как материал, на основе которого может проводиться поиск лингвоспецифичных фразеологизмов.
Под лингвоспецифичными фразеологизмами, по аналогии с лингвоспецифичными лексемами (Шмелев, 2015), понимаются фразеологические единицы, обладающие сложной семантической конфигурацией и поэтому не имеющие точного словарного эквивалента в языке, с которым ведется сопоставление.
В то же время, объем корпуса накладывает некоторые ограничения на возможности его использования. По мнению Р. Мун, для получения достаточной информации о фразеологизмах используемый корпус должен содержать не менее 50 миллионов слов, а оптимальным является объем в 100 миллионов слов (Moon, 2007). Сейчас корпус русской классики в переводах на немецкий язык включает в себя около 5 миллионов слов, а немецко-русский подкорпус — около 4 миллионов слов, поэтому для некоторых фразеологизмов в нем не находится примеров употребления.
Кроме того, многие переводческие решения зависят от контекста, поэтому не каждое соответствие может быть использовано в качестве эквивалента для словарной статьи.

Литература
Шмелев А. Д. Русские лингвоспецифичные лексические единицы в параллельных корпусах: возможности исследования и «подводные камни» Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Москва, 27–30 мая 2015 г.). Вып. 14 (21): В 2 т. Т. 1: Основная программа конференции. М.: Изд-во РГГУ, 2015.
Moon R. Corpus linguistic approaches with English corpora // Phraseologie/Phraseology. Ein internationales Handbuch der zeitgenössischen Forschung / An International Handbook of Contemporary Research. Berlin, N. Y.: de Gruyter, 2007. P. 1045–1059.