XXVII Открытая конференция студентов-филологов в СПбГУ

Устный и письменный текст сквозь призму выделения ключевых выражений

Дарья Дмитриевна Гусева
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет

157
2024-04-27
15:50 - 16:05

Ключевые слова, аннотация

В докладе представлены результаты исследования восприятия ключевых выражений в письменном и устном текстах. В качестве материала использованы аудиозаписи выступлений лекторов проекта «Постнаука». Были проведены эксперименты с определением фонетически (просодически) выделенных слов в устном тексте, а также с выделением ключевых выражений из устного и письменного текста. Результаты показали неоднозначность связи между наборами ключевых выражений и фонетически выделенных слов. В работе также представлен анализ различий в восприятии текстов информантами, относящимися к разным возрастным группам.

Тезисы

Ключевые слова: восприятие речи; устный текст; письменный текст; выделение ключевых выражений; фонетически выделенные слова

В докладе обсуждается проблема восприятия ключевых выражений в письменном и устном текстах. Процесс передачи информации может происходить посредством устной и письменной речи, которые не считаются равноправными. Устная речь первична по отношению к письменной и представляет собой более естественную реализацию языка в процессе общения.
Существует целый ряд работ, исследующих проблемы, связанные с производством и восприятием как устной, так и письменной речи. Различия восприятия содержания письменного и устного текста проявляются на разных уровнях компонентов коммуникации и понимания текста, в т. ч. на уровне выделения ключевых выражений. Под ключевыми выражениями понимаются самостоятельные языковые единицы, которые представляют наиболее важную информацию о тексте в компактном формате, тем самым способствуя структурированию текстов, их классификации, кластеризации, суммаризации и конспектированию. Цель данного исследования заключается в сопоставлении различий, возникающих при восприятии одного и того же текста, представленного в письменной и устной формах. В качестве материала исследования использованы аудиозаписи лекций русскоязычных дикторов, опубликованных в открытом доступе в рамках проекта «Постнаука». В докладе представлены результаты перцептивных экспериментов.
Был проведён эксперимент с определением фонетически (просодически) выделенных слов по методике Н. Д. Светозаровой и А. С. Штерн [Светозарова, Штерн, 1989]. Процедура обработки результатов заключалась в сопоставлении полученного набора фонетически (просодически) выделенных слов, для получения которого были привлечены эксперты-фонетисты, с набором выделенных из текстов ключевых выражений.
Из письменного текста ключевые выражения были извлечены как автоматически, так и вручную. Для автоматического выделения были применены следующие методы: 1) статистические (Хи-квадрат, Log-Likelihood, PMI-test, T-test); 2) гибридные (RAKE, RuTermExtract, SpaCy); 3) с использованием машинного обучения (KeyBERT); 4) ChatGPT, языковая модель на базе искусственного интеллекта. Из устного текста ключевые выражения выделялись только с помощью ручной разметки, полученной в результате серии перцептивных экспериментов.
В экспериментах с извлечением ключевых выражений аудиторы должны были после прочтения или прослушивания текста выделить 10 ключевых выражений, ранжируя их от самого важного к менее важному. В эксперименте с привлечением экспертов-фонетистов необходимо было во время прослушивания записи отметить в тексте фонетически (просодически) выделенные слова. Под просодически выделенными словами подразумеваются слова, имеющие акцентное выделение, которое является «обозначением активной для восприятия выделенности просодическими средствами какого-либо слова во фразе» [Николаева, 1982: 3].
Результаты показали неоднозначность связи между наборами ключевых выражений и фонетически (просодически) выделенных слов. В работе также представлен анализ различий в восприятии текстов информантами, относящимися к разным возрастным группам: 1) лица младше 18 лет включительно; 2) лица старше 18 лет.

Литература:
Николаева Т. М. Семантика акцентного выделения. М., 1982.
Светозарова Н. Д., Штерн А. С. Ключевые и фонетически выделенные слова текста // Экспериментальная фонетика. Автоматический анализ и синтез речи. М. 1989. С. 157­—170.