Автоматическое определение интонационно выделенных слов в речи
Алла Павловна Меньшикова
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
ауд. 157
2018-04-19
15:00 -
15:20
Ключевые слова, аннотация
В докладе представлен метод автоматического определения
интонационно выделенных слов в речи, опирающийся на использование акустических
(мелодических, темпоральных, динамических) и текстовых (лексических,
грамматических, синтаксических) признаков, а также признаков, указывающих на
вероятность близкого расположения синтагматической границы. В качестве экспериментальных
данных использовались материалы речевого корпуса CORPRES. Статистический классификатор
был реализован на основе метода опорных векторов.
Тезисы
Целью исследования было
создание системы автоматического определения интонационно выделенных слов в
речи. Интонационным выделением в рамках работы считается перцептивно значимое
подчеркивание части высказывания, осуществляемое с помощью просодических
средств. Поскольку интонационное выделение имеет яркую фонетическую
манифестацию, выражаемую изменением мелодического, темпорального и
динамического контуров выделяемого слова на фоне контуров других слов
высказывания, для его определения использовался ряд акустических признаков. К
мелодическим признакам относились: максимальная и минимальная частота основного
тона на протяжении слова, нормализованные для диктора; интервал частоты
основного тона для слова; скорость изменения частоты основного тона на участке
с наибольшим по величине движением основного тона; последовательность из трёх
мелодических движений с максимальной суммой модулей значений. В качестве
темпоральных и динамических признаков использовались значения максимальной,
минимальной и средней нормализованной длительности/интенсивности звуков внутри
слова.
Для разделения слов с дополнительным выделением и интонационных центров, которые оформляются с помощью тех же просодических средств, а также для отсеивания начальных слов синтагм, выделяемых восходящим движением основного тона, учитывалась вероятностная оценка того, что после данного слова и соседних с ним проходит синтагматическая граница. Оценка была получена с помощью метода, описанного в (Kocharov D., Kachkovskaia T., Mirzagitova A., Skrelin P. Combining Syntactic and Acoustic Features for Prosodic Boundary Detection in Russian // International Conference on Statistical Language and Speech Processing. — Springer, Cham, 2016. — С. 68-79.).
Место интонационного выделения связано с семантикой высказывания, поэтому при автоматическом определении выделенных слов также использовались результаты их классификации на основе текстовых признаков: грамматических (части речи слова и соседних с ним), синтаксических (статистический параметр, указывающий на вероятность инверсии в синтаксической конструкции с данным словом), лексических (лексема; принадлежность слова и соседних с ним слов к одному из лексических классов, притягивающих выделение).
В качестве экспериментальных данных использовались материалы речевого корпуса CORPRES, содержащего около 30 часов речи с орфографической, фонетической и просодической разметкой. Автоматическое определение выделенных слов проводилось с помощью метода опорных векторов. Результаты показали, что наиболее значимыми являются мелодические признаки, в частности интервал частоты основного тона и последовательность мелодических движений. Применение результатов текстовой классификации помогает повысить точность за счет отделения семантически неподходящих для выделения слов.
Для разделения слов с дополнительным выделением и интонационных центров, которые оформляются с помощью тех же просодических средств, а также для отсеивания начальных слов синтагм, выделяемых восходящим движением основного тона, учитывалась вероятностная оценка того, что после данного слова и соседних с ним проходит синтагматическая граница. Оценка была получена с помощью метода, описанного в (Kocharov D., Kachkovskaia T., Mirzagitova A., Skrelin P. Combining Syntactic and Acoustic Features for Prosodic Boundary Detection in Russian // International Conference on Statistical Language and Speech Processing. — Springer, Cham, 2016. — С. 68-79.).
Место интонационного выделения связано с семантикой высказывания, поэтому при автоматическом определении выделенных слов также использовались результаты их классификации на основе текстовых признаков: грамматических (части речи слова и соседних с ним), синтаксических (статистический параметр, указывающий на вероятность инверсии в синтаксической конструкции с данным словом), лексических (лексема; принадлежность слова и соседних с ним слов к одному из лексических классов, притягивающих выделение).
В качестве экспериментальных данных использовались материалы речевого корпуса CORPRES, содержащего около 30 часов речи с орфографической, фонетической и просодической разметкой. Автоматическое определение выделенных слов проводилось с помощью метода опорных векторов. Результаты показали, что наиболее значимыми являются мелодические признаки, в частности интервал частоты основного тона и последовательность мелодических движений. Применение результатов текстовой классификации помогает повысить точность за счет отделения семантически неподходящих для выделения слов.