Сбор и подготовка материала для автоматического распознавания иронии в русском языке
Рада Донатовна Герман
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
157
2024-04-27
15:20 -
15:35
Ключевые слова, аннотация
Автоматическое выявление иронии является важной
задачей в контексте повышенного влияния иронии в онлайн-средах. Поэтому
предметом исследования являются различные акустические характеристики иронии и
методы их вычленения, применяемые в области нейросетевых технологий. Важно
обратить внимание на то, какие особенности иронического высказывания следует
учитывать при разработке соответствующих моделей. В рамках данного исследования
был собран датафрейм с акустическими характеристиками, который будет использоваться
для обучения нейросетевой модели распознавания иронии.
Тезисы
Ключевые слова: ирония; акустические характеристики; длительность; MFCC; нейросетевые технологии
Основываясь на проведенных ранее исследованиях [Кочеткова, 2022; Скрелин, 2021; Skrelin, 2020], можно установить список акустических характеристик иронии в русском языке, таким образом исследование по распознаванию иронии с использованием нейросетевых технологий приобретает важное значение в свете современных требований к обработке информации и автоматизированному анализу аудио данных. Материалом исследования служит корпус иронической речи, созданный на кафедре фонетики и методики преподавания иностранных языков СПбГУ в рамках проекта «Акустические характеристики иронии при реализации функциональных интонационных моделей» и поддержанный грантом РФФИ № 20-012-00552 [Kochetkova, 2021]. В данном корпусе содержаться целевые фрагменты, подразумевающие ироническое или нейтральное прочтение, а также их контексты. Запись дикторов проводилась в студийных условиях, в лаборатории кафедры фонетики и методики преподавания иностранных языков Санкт-Петербургского государственного университета.
Kochetkova U. The Speech Corpus for Studying Phonetic Properties of Irony // Kochetkova U., Skrelin P., Evdokimova V., Novoselova D. // Language, Music and Gesture: Informational Crossroads: LMGIC 2021. Singapore, 2021. P. 203—214.
Skrelin P. Can we detect irony in speech using phonetic characteristics only? — looking for a methodology of analysis // Skrelin P., Kochetkova U., Evdokimova V., Novoselova D. International Conference on Speech and Computer. Cham, 2020. P. 544—553.
Основываясь на проведенных ранее исследованиях [Кочеткова, 2022; Скрелин, 2021; Skrelin, 2020], можно установить список акустических характеристик иронии в русском языке, таким образом исследование по распознаванию иронии с использованием нейросетевых технологий приобретает важное значение в свете современных требований к обработке информации и автоматизированному анализу аудио данных. Материалом исследования служит корпус иронической речи, созданный на кафедре фонетики и методики преподавания иностранных языков СПбГУ в рамках проекта «Акустические характеристики иронии при реализации функциональных интонационных моделей» и поддержанный грантом РФФИ № 20-012-00552 [Kochetkova, 2021]. В данном корпусе содержаться целевые фрагменты, подразумевающие ироническое или нейтральное прочтение, а также их контексты. Запись дикторов проводилась в студийных условиях, в лаборатории кафедры фонетики и методики преподавания иностранных языков Санкт-Петербургского государственного университета.
Каждый аудиофайл размечен в программе Praat на
следующих уровнях:
(1) фраза, (2) целевой фрагмент, (3) ударный гласный,
(4) ударный слог
. Затем на языке python был написан код, позволяющий получить
данные о характеристиках, отвечающих за выражение иронии в русском языке (интенсивность,
длительность и частота основного тона). В результате чего был собран датафрейм,
содержащий следующие акустические характеристики для каждого сигнала:
1. длительность
ударного гласного;
2. длительность
ударного слога;
3. интенсивность
ударного гласного;
4. интенсивность
ударного слога;
5. средняя
частота основного тона;
6. диапазон
частоты основного тона;
7. MFCC
(Mel Frequency Cepstral Coefficients);
8. скорость
речи.
Полученный датафрейм
планируется использовать для обучения нейросетевой модели, для выявления
наиболее весомых с точки зрения распознавания акустических характеристик или добавления новых.Литература:
Кочеткова
У. Е. Выражение иронии в различных языках: в поиске универсальных и
специфических акустических характеристик // Кочеткова У. Е., Скрелин П. А., Евдокимова В. В., Новоселова Д. Д., Герман Р. Д. Фонетика в контексте языковых
контактов: Сборник научных статей. Минск, 2022. С. 71—76.
Скрелин
П. А. Просодические характеристики иронических высказываний в русском и
французском языках // Скрелин П. А., Кочеткова У. Е., Евдокимова В. В., Новоселова Д. Д., Герман Р. Д. // Анализ разговорной русской речи (АР3—2021), 2021. СПб., 2021. С.
81—86.Kochetkova U. The Speech Corpus for Studying Phonetic Properties of Irony // Kochetkova U., Skrelin P., Evdokimova V., Novoselova D. // Language, Music and Gesture: Informational Crossroads: LMGIC 2021. Singapore, 2021. P. 203—214.
Skrelin P. Can we detect irony in speech using phonetic characteristics only? — looking for a methodology of analysis // Skrelin P., Kochetkova U., Evdokimova V., Novoselova D. International Conference on Speech and Computer. Cham, 2020. P. 544—553.