Устный и письменный текст сквозь призму выделения ключевых выражений
Дарья Дмитриевна Гусева
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
157
2024-04-27
15:50 -
16:05
Ключевые слова, аннотация
В докладе представлены результаты исследования восприятия ключевых выражений в письменном и устном текстах. В качестве материала использованы аудиозаписи выступлений лекторов проекта
«Постнаука». Были проведены эксперименты с
определением фонетически (просодически) выделенных слов в устном тексте, а
также с выделением ключевых выражений из устного и письменного текста. Результаты
показали неоднозначность связи между наборами ключевых выражений и фонетически
выделенных слов. В работе также представлен анализ различий в восприятии
текстов информантами, относящимися к разным возрастным группам.
Тезисы
Ключевые
слова: восприятие речи; устный текст; письменный текст;
выделение ключевых выражений; фонетически выделенные слова
В докладе обсуждается проблема восприятия ключевых выражений в письменном и устном текстах. Процесс передачи информации может происходить посредством устной и письменной речи, которые не считаются равноправными. Устная речь первична по отношению к письменной и представляет собой более естественную реализацию языка в процессе общения.
Литература:
Николаева Т. М. Семантика акцентного выделения. М., 1982.
Светозарова Н. Д., Штерн А. С. Ключевые и фонетически выделенные слова текста // Экспериментальная фонетика. Автоматический анализ и синтез речи. М. 1989. С. 157—170.
В докладе обсуждается проблема восприятия ключевых выражений в письменном и устном текстах. Процесс передачи информации может происходить посредством устной и письменной речи, которые не считаются равноправными. Устная речь первична по отношению к письменной и представляет собой более естественную реализацию языка в процессе общения.
Существует целый ряд работ,
исследующих проблемы, связанные с производством и восприятием как устной, так и
письменной речи. Различия восприятия содержания письменного и устного текста
проявляются на разных уровнях компонентов коммуникации и понимания текста, в
т. ч. на уровне выделения ключевых выражений. Под ключевыми выражениями
понимаются самостоятельные языковые единицы, которые представляют наиболее
важную информацию о тексте в компактном формате, тем самым способствуя
структурированию текстов, их классификации, кластеризации, суммаризации и
конспектированию. Цель данного исследования
заключается в сопоставлении различий, возникающих при восприятии одного и того
же текста, представленного в письменной и устной формах. В качестве материала
исследования использованы аудиозаписи лекций русскоязычных дикторов,
опубликованных в открытом доступе в рамках проекта «Постнаука». В докладе представлены результаты перцептивных экспериментов.
Был проведён эксперимент с
определением фонетически (просодически) выделенных слов по методике Н. Д.
Светозаровой и А. С. Штерн [Светозарова, Штерн, 1989]. Процедура обработки
результатов заключалась в сопоставлении полученного набора фонетически (просодически)
выделенных слов, для получения которого были привлечены эксперты-фонетисты, с
набором выделенных из текстов ключевых выражений.
Из письменного текста ключевые
выражения были извлечены как автоматически, так и вручную. Для автоматического
выделения были применены следующие методы: 1) статистические (Хи-квадрат,
Log-Likelihood, PMI-test, T-test); 2) гибридные (RAKE, RuTermExtract, SpaCy); 3) с использованием машинного обучения (KeyBERT); 4) ChatGPT, языковая модель
на базе искусственного интеллекта. Из устного текста ключевые выражения выделялись только с помощью ручной разметки, полученной в результате серии
перцептивных экспериментов.
В экспериментах с извлечением
ключевых выражений аудиторы должны были после прочтения или прослушивания
текста выделить 10 ключевых выражений, ранжируя их от самого важного к менее
важному. В эксперименте с привлечением экспертов-фонетистов необходимо было во
время прослушивания записи отметить в тексте фонетически (просодически)
выделенные слова. Под просодически выделенными словами подразумеваются слова,
имеющие акцентное выделение, которое является «обозначением активной для
восприятия выделенности просодическими средствами какого-либо слова во фразе»
[Николаева, 1982: 3].
Результаты показали
неоднозначность связи между наборами ключевых выражений и фонетически
(просодически) выделенных слов. В работе также представлен
анализ различий в восприятии текстов информантами, относящимися к разным
возрастным группам: 1) лица младше 18 лет включительно; 2) лица старше 18
лет.
Литература:
Николаева Т. М. Семантика акцентного выделения. М., 1982.
Светозарова Н. Д., Штерн А. С. Ключевые и фонетически выделенные слова текста // Экспериментальная фонетика. Автоматический анализ и синтез речи. М. 1989. С. 157—170.