Использование корпусов параллельных текстов во фразеографии (на материале немецкого языка)
Ирина Сергеевна Парина
Докладчик
доцент
Нижегородский государственный лингвистический университет им. Н. А. Добролюбова
Нижегородский государственный лингвистический университет им. Н. А. Добролюбова
171
2019-03-21
14:40 -
14:55
Ключевые слова, аннотация
Параллельный корпус, фразеология, фразеография.
Тезисы
Доклад посвящен использованию корпусов немецко-русских
и русско-немецких параллельных текстов, входящих в состав НКРЯ
(http://www.ruscorpora.ru/search-para-de.html), для исследования и словарного описания
фразеологизмов.
Параллельный корпус представляет собой корпус текстов, в котором оригинальные тексты представлены вместе с переводами на один или несколько языков. Результаты поиска в параллельном корпусе выглядят как фрагмент текста, содержащий искомую единицу, и соответствующий ему фрагмент перевода. Корпус снабжен метаразметкой, включающей в себя информацию об авторе, переводчике, времени создания произведения и перевода. Это позволяет использовать его для социолингвистических и литературоведческих исследований — но, в первую очередь, для исследований в области сопоставительной лексикологии, лексикографии и переводоведения.
Во фразеографии параллельный корпус может находить различное применение:
В то же время, объем корпуса накладывает некоторые ограничения на возможности его использования. По мнению Р. Мун, для получения достаточной информации о фразеологизмах используемый корпус должен содержать не менее 50 миллионов слов, а оптимальным является объем в 100 миллионов слов (Moon, 2007). Сейчас корпус русской классики в переводах на немецкий язык включает в себя около 5 миллионов слов, а немецко-русский подкорпус — около 4 миллионов слов, поэтому для некоторых фразеологизмов в нем не находится примеров употребления.
Кроме того, многие переводческие решения зависят от контекста, поэтому не каждое соответствие может быть использовано в качестве эквивалента для словарной статьи.
Литература
Шмелев А. Д. Русские лингвоспецифичные лексические единицы в параллельных корпусах: возможности исследования и «подводные камни» Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Москва, 27–30 мая 2015 г.). Вып. 14 (21): В 2 т. Т. 1: Основная программа конференции. М.: Изд-во РГГУ, 2015.
Moon R. Corpus linguistic approaches with English corpora // Phraseologie/Phraseology. Ein internationales Handbuch der zeitgenössischen Forschung / An International Handbook of Contemporary Research. Berlin, N. Y.: de Gruyter, 2007. P. 1045–1059.
Параллельный корпус представляет собой корпус текстов, в котором оригинальные тексты представлены вместе с переводами на один или несколько языков. Результаты поиска в параллельном корпусе выглядят как фрагмент текста, содержащий искомую единицу, и соответствующий ему фрагмент перевода. Корпус снабжен метаразметкой, включающей в себя информацию об авторе, переводчике, времени создания произведения и перевода. Это позволяет использовать его для социолингвистических и литературоведческих исследований — но, в первую очередь, для исследований в области сопоставительной лексикологии, лексикографии и переводоведения.
Во фразеографии параллельный корпус может находить различное применение:
- как источник иллюстративных примеров для словарной статьи;
- как материал для подбора словарных соответствий;
- как материал, на основе которого может проводиться поиск лингвоспецифичных фразеологизмов.
В то же время, объем корпуса накладывает некоторые ограничения на возможности его использования. По мнению Р. Мун, для получения достаточной информации о фразеологизмах используемый корпус должен содержать не менее 50 миллионов слов, а оптимальным является объем в 100 миллионов слов (Moon, 2007). Сейчас корпус русской классики в переводах на немецкий язык включает в себя около 5 миллионов слов, а немецко-русский подкорпус — около 4 миллионов слов, поэтому для некоторых фразеологизмов в нем не находится примеров употребления.
Кроме того, многие переводческие решения зависят от контекста, поэтому не каждое соответствие может быть использовано в качестве эквивалента для словарной статьи.
Литература
Шмелев А. Д. Русские лингвоспецифичные лексические единицы в параллельных корпусах: возможности исследования и «подводные камни» Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Москва, 27–30 мая 2015 г.). Вып. 14 (21): В 2 т. Т. 1: Основная программа конференции. М.: Изд-во РГГУ, 2015.
Moon R. Corpus linguistic approaches with English corpora // Phraseologie/Phraseology. Ein internationales Handbuch der zeitgenössischen Forschung / An International Handbook of Contemporary Research. Berlin, N. Y.: de Gruyter, 2007. P. 1045–1059.