XXVII Открытая конференция студентов-филологов в СПбГУ

Сбор и подготовка материала для автоматического распознавания иронии в русском языке

Рада Донатовна Герман
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет

157
2024-04-27
15:20 - 15:35

Ключевые слова, аннотация

Автоматическое выявление иронии является важной задачей в контексте повышенного влияния иронии в онлайн-средах. Поэтому предметом исследования являются различные акустические характеристики иронии и методы их вычленения, применяемые в области нейросетевых технологий. Важно обратить внимание на то, какие особенности иронического высказывания следует учитывать при разработке соответствующих моделей. В рамках данного исследования был собран датафрейм с акустическими характеристиками, который будет использоваться для обучения нейросетевой модели распознавания иронии.

Тезисы

Ключевые слова: ирония; акустические характеристики; длительность; MFCC; нейросетевые технологии

Основываясь на проведенных ранее исследованиях [Кочеткова, 2022; Скрелин, 2021; Skrelin, 2020], можно установить список акустических характеристик иронии в русском языке, таким образом исследование по распознаванию иронии с использованием нейросетевых технологий приобретает важное значение в свете современных требований к обработке информации и автоматизированному анализу аудио данных. Материалом исследования служит корпус иронической речи, созданный на кафедре фонетики и методики преподавания иностранных языков СПбГУ в рамках проекта «Акустические характеристики иронии при реализации функциональных интонационных моделей» и поддержанный грантом РФФИ № 20-012-00552 [Kochetkova, 2021]. В данном корпусе содержаться целевые фрагменты, подразумевающие ироническое или нейтральное прочтение, а также их контексты. Запись дикторов проводилась в студийных условиях, в лаборатории кафедры фонетики и методики преподавания иностранных языков Санкт-Петербургского государственного университета.
Каждый аудиофайл размечен в программе Praat на следующих уровнях: (1) фраза, (2) целевой фрагмент, (3) ударный гласный, (4) ударный слог . Затем на языке python был написан код, позволяющий получить данные о характеристиках, отвечающих за выражение иронии в русском языке (интенсивность, длительность и частота основного тона). В результате чего был собран датафрейм, содержащий следующие акустические характеристики для каждого сигнала:
1. длительность ударного гласного;
2. длительность ударного слога;
3. интенсивность ударного гласного;
4. интенсивность ударного слога;
5. средняя частота основного тона;
6. диапазон частоты основного тона;
7. MFCC (Mel Frequency Cepstral Coefficients);
8. скорость речи.
Полученный датафрейм планируется использовать для обучения нейросетевой модели, для выявления наиболее весомых с точки зрения распознавания акустических характеристик или добавления новых.

Литература:
Кочеткова У. Е. Выражение иронии в различных языках: в поиске универсальных и специфических акустических характеристик // Кочеткова У. Е., Скрелин П. А., Евдокимова В. В., Новоселова Д. Д., Герман Р. Д. Фонетика в контексте языковых контактов: Сборник научных статей. Минск, 2022. С. 71­—76.
Скрелин П. А. Просодические характеристики иронических высказываний в русском и французском языках // Скрелин П. А., Кочеткова У. Е., Евдокимова В. В., Новоселова Д. Д., Герман Р. Д. // Анализ разговорной русской речи (АР3—2021), 2021. СПб., 2021. С. 81­—86.
Kochetkova U. The Speech Corpus for Studying Phonetic Properties of Irony // Kochetkova U., Skrelin P., Evdokimova V., Novoselova D. // Language, Music and Gesture: Informational Crossroads: LMGIC 2021. Singapore, 2021. P. 203­—214.
Skrelin P. Can we detect irony in speech using phonetic characteristics only? — looking for a methodology of analysis // Skrelin P., Kochetkova U., Evdokimova V., Novoselova D. International Conference on Speech and Computer. Cham, 2020. P. 544­—553.