XXI Открытая конференция студентов-филологов в СПбГУ

Автоматическое определение интонационно выделенных слов в речи

Алла Павловна Меньшикова
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет

ауд. 157
2018-04-19
15:00 - 15:20

Ключевые слова, аннотация

В докладе представлен метод автоматического определения интонационно выделенных слов в речи, опирающийся на использование акустических (мелодических, темпоральных, динамических) и текстовых (лексических, грамматических, синтаксических) признаков, а также признаков, указывающих на вероятность близкого расположения синтагматической границы. В качестве экспериментальных данных использовались материалы речевого корпуса CORPRES. Статистический классификатор был реализован на основе метода опорных векторов.

Тезисы

Целью исследования было создание системы автоматического определения интонационно выделенных слов в речи. Интонационным выделением в рамках работы считается перцептивно значимое подчеркивание части высказывания, осуществляемое с помощью просодических средств. Поскольку интонационное выделение имеет яркую фонетическую манифестацию, выражаемую изменением мелодического, темпорального и динамического контуров выделяемого слова на фоне контуров других слов высказывания, для его определения использовался ряд акустических признаков. К мелодическим признакам относились: максимальная и минимальная частота основного тона на протяжении слова, нормализованные для диктора; интервал частоты основного тона для слова; скорость изменения частоты основного тона на участке с наибольшим по величине движением основного тона; последовательность из трёх мелодических движений с максимальной суммой модулей значений. В качестве темпоральных и динамических признаков использовались значения максимальной, минимальной и средней нормализованной длительности/интенсивности звуков внутри слова.
Для разделения слов с дополнительным выделением и интонационных центров, которые оформляются с помощью тех же просодических средств, а также для отсеивания начальных слов синтагм, выделяемых восходящим движением основного тона, учитывалась вероятностная оценка того, что после данного слова и соседних с ним проходит синтагматическая граница. Оценка
 была получена с помощью метода, описанного в (Kocharov D., Kachkovskaia T., Mirzagitova A., Skrelin P. Combining Syntactic and Acoustic Features for Prosodic Boundary Detection in Russian // International Conference on Statistical Language and Speech Processing. — Springer, Cham, 2016. — С. 68-79.).
Место интонационного выделения связано с семантикой высказывания, поэтому при автоматическом определении выделенных слов также использовались результаты их классификации на основе текстовых признаков: грамматических (части речи слова и соседних с ним), синтаксических (статистический параметр, указывающий на вероятность инверсии в синтаксической конструкции с данным словом), лексических (лексема; принадлежность слова и соседних с ним слов к одному из лексических классов, притягивающих выделение).
В качестве экспериментальных данных использовались материалы речевого корпуса CORPRES, содержащего около 30 часов речи с орфографической, фонетической и просодической разметкой. Автоматическое определение выделенных слов проводилось с помощью метода опорных векторов. Результаты показали, что наиболее значимыми являются мелодические признаки, в частности интервал частоты основного тона и последовательность мелодических движений. Применение результатов текстовой классификации помогает повысить точность за счет отделения семантически неподходящих для выделения слов.