XVIII Международная конференция студентов-филологов

Существует ли язык, или Что и как мы исследуем с помощью корпуса?

Михаил Вячеславович Копотев
Докладчик
профессор
Хельсинский университет

25
2015-04-07
12:20 - 13:20

Ключевые слова, аннотация

Современная корпусная лингвистика стала основой «количественной революции», происходящей на наших глазах в науке о языке. Новые методы и технологии приводят к необходимости пересмотра теоретических представлений об объекте исследования. Постулаты, сформулированные лингвистикой в XX веке, нуждаются в переосмыслении. В частности, существует ли язык (в его противопоставленности речи)? Существует ли жесткая иерархия языковой структуры от звукового до синтаксического уровней?



Тезисы

Современная корпусная лингвистика стала основой «количественной революции», происходящей на наших глазах в науке о языке. Лингвисты все больше отходят от опоры на собственную интуицию и анализ конкретных текстов и переходят к обработке big data — таких объемов лингвистических данных, которые невозможно ни прочитать, ни даже просто просмотреть. Что принципиально нового дает корпус объемом в сотни миллионов слов? Какие методы и технологии могут справиться с таким огромным массивом данных? В докладе я расскажу о трех подходах, которые выработала корпусная лингвистика:
  • Анализ, использующий корпус (англ. corpus-informed analysis)
  • Анализ, основанный на корпусе (англ. corpus-based analysis)
  • Анализ, направляемый корпусом (англ. corpus-driven analysis)
Особое внимание будет уделено последнему подходу. Я приведу конкретные примеры исследований и покажу, что он не просто уточняет наши знания о языке, но приводит к необходимости пересмотра теоретических представлений об объекте исследования. Постулаты, сформулированные лингвистикой в XX веке, нуждаются в переосмыслении. В частности, существует ли язык (в его противопоставленности речи)? Существует ли жесткая иерархия языковой структуры от звукового до синтаксического уровней? В свете новых (корпусных и не только) данных ответы на эти вопросы не столь очевидны, как это казалось в прошлом веке.