XXV Открытая конференция студентов-филологов в СПбГУ

Автоматическое определение конца утвердительного высказывания в спонтанной диалогической речи

Алена Юрьевна Громова
Докладчик
студент 4 курса
Санкт-Петербургский государственный университет

Фонетика (онлайн)
2022-04-22
14:40 - 15:00

Ключевые слова, аннотация

Исследование посвящено автоматическому определению конца утвердительного высказывания. Материалом послужили записи из корпуса спонтанной диалогической речи SibLing с автоматической разметкой на слова. Были выявлены признаки, позволяющие отличить мелодику утвердительных высказываний от неутвердительных: мелодический диапазон; положение абсолютного минимума частоты основного тона в конце синтагмы; преобладание уменьшения тона на последнем участке синтагмы, а также небольшая скорость мелодического движения. На основании полученных данных был построен классификатор по методу опорных векторов.

Тезисы

В рамках данного исследования была поставлена задача разработки алгоритма автоматического выделения конца утвердительных высказываний. На начальном этапе было необходимо выявить признаки мелодики утвердительных высказываний, которые позволили бы отличить её от неутвердительных высказываний. Экспериментальный материал составили звуковые файлы из корпуса спонтанной диалогической речи SibLing, в котором уже присутствовала автоматическая разметка на слова. Для первого эксперимента было отобрано 9 диалогов, содержащих записи 2 целевых дикторов. Общая длительность звукового материала составила 1 час 46 минут.
В каждой реплике каждого диктора были выделены конечные синтагмы и получены значения частоты основного тона. Значения были взяты в полутонах относительно максимального значения частоты основного тона в первом фонетическом слове синтагмы. На основании этих данных были получены мелодические кривые. Синтагмы группировались по интонационному контуру (по системе Н. Б. Вольской) и количеству слов в синтагме. В особую группу выделялись интонационные конструкции 01, 01а и 01б, соответствующие интонации завершённости. Графики были нормализованы по длительности. У всех контуров, расположенных на одном графике, была выделена точка начала ударного гласного в ядре синтагмы так, чтобы у всех графиков она располагалась в одном месте.
Путём сопоставления полученных графиков друг с другом было выявлено 4 признака, позволяющие отделить целевые конструкции от остальных: мелодический диапазон; положение абсолютного минимума частоты основного тона в конце синтагмы; преобладание уменьшения тона на последнем участке синтагмы, а также небольшая скорость мелодического движения.
По данным признакам был построен классификатор по методу опорных векторов (Support Vector Machine). Кросс-валидация для проверки успешности модели показала среднее значение f1=0,76 при k=5.