XXVIII Открытая конференция студентов-филологов в СПбГУ

Разработка системы лингвистического аннотирования корпуса устной речи людей, переживших травмирующий опыт

Екатерина Евгеньевна Межорина
Докладчик
студент 3 курса
НИУ ВШЭ СПб

Ключевые слова, аннотация

Доклад посвящен разработке системы лингвистического аннотирования для изучения «языка травмы» в устной речи жертв сексуализированного насилия. В исследовании было проанализировано 12 видеозаписей. Использовались ручная фонетическая и автоматическая семантическая разметка для выявления особых лингвистических коррелятов, отражающих когнитивные изменения и «память травмы» у говорящего. Разработанная система позволяет различать маркеры обычной эмоциональной речи и те, которые связаны с внутренней травмой.

Тезисы

Ключевые слова: язык травмы; система аннотирования; система разметки; лингвистические корреляты

Доклад посвящен проблемам создания и использования систем лингвистического аннотирования для решения междисциплинарных научных вопросов, связанных с исследованиями в области психологической травмы. Современные системы разметки могут служить инструментом для проведения когнитивных исследований в сфере психологии, но далеко не все из них могут четко разграничивать лингвистические корреляты, характерные для беглой, эмоционально нагруженной устной речи в целом и характерные исключительно для «языка травмы» [Уолинн, 2021]. Исходя из необходимости научиться видеть эту разницу, целью настоящей работы стало создание системы разметки, которая позволит обнаруживать в устной речи людей, переживших травмирующий опыт, особые лингвистические корреляты, которые бы отразили потенциальные параметры выделения «языка травмы» и, соответственно, «памяти травмы». Эти многоаспектные понятия связывают между собой когнитивные изменения в мозгу человека вследствие переживания травматического опыта и язык. Изменения в лингвистическом репертуаре жертвы оправданы неким подсознательным, которое хранит множество контекстов, как бы обрамляющих восприятие ситуации травмы на момент ее свершения [Van der Kolk et al., 1991].
Можно предположить, что разметка материала покажет, как меняется внутреннее состояние людей в момент говорения о травме и как это отражается на лексическом и просодическом уровнях языка. Под травмирующим опытом в настоящем исследовании подразумевается сексуализированное насилие. Соответственно, материалом исследования послужили 12 видеозаписей (общей продолжительностью 4 часа), в которых жертвы насилия рассказывают о том, как с ними произошли травматичные события и как они их переживали. Все респонденты — женщины. Объем текстовых расшифровок включил в себя 20632 токена.
Первоначально ручная фонетическая разметка данных проводилась в программе ELAN с использованием специальных знаков аннотации корпуса ОРД. Этот метод помог проанализировать аспекты эмоциональной просодики устной речи людей, переживших насилие, в процессе рассказа о нем, а также провести их подсчет. Затем была проведена автоматическая семантическая разметка данных с помощью специально написанного кода на языке Python, который помог распределить лексику из корпуса на несколько лексико-тематических групп. Напр., среди них были выделены следующие: лексика, связанная с правовыми процессами (9,1%), лексика, характеризующая состояние жертвы (13,1%) и еще 6 групп (в скобках указано процентное отношение конкретной лексико-тематической группы к объему всей тематической лексики).
По результатам исследования была разработана система лингвистического аннотирования, которая позволяет проводить анализ «языка травмы» на лексическом и просодическом уровнях и отличать маркеры обычной эмоционально нагруженной речи от тех, которые отсылают к внутренней травме говорящего.

Литература:
Уолинн М. Это началось не с тебя. Как мы наследуем негативные сценарии нашей семьи и как остановить их влияние / Пер. с англ. Е. Цветковой. М., 2021.
Van der Kolk B. A., Van der Hart O. The intrusive past: The flexibility of memory and the engraving of trauma // American imago. 1991. Т. 48. №4. P. 425—454.