Моделирование длительности фонетических слов для синтеза речи
Александр Владимирович Шипило
Докладчик
старший лаборант
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
157
2016-03-16
15:20 -
15:40
Ключевые слова, аннотация
В настоящем докладе представлена модель изменения длительности фонетических слов (ФС) русского языка. Длительность фонетического слова задается функцией изменения длительностей формирующих его слогов. Длительность звуков соотносится с их средними длительностями по материалу. Таким образом, появляется возможность оценить соотношения длительностей аллофонов внутри конкретного слога при изменении длительности ФС под влияние разных интонационных факторов.
Тезисы
Исследованию
временной организации фонетических
слов в потоке речи посвящено большое
количество исследований на материале
разных языков. Настоящая работа работа
посвящена анализу изменения длительности
слогов, формирующих длительность
фонетических слов (ФС). Материал для
исследования — корпус CORPRES.
На первом этапе исследования для этого корпуса автоматически был порожден уровень разметки на фонетические слова (на основании информации о степени редукции гласных аллофонов и границ слов). Затем был порожден уровень слогов. Слогоделение осуществлялось строго внутри фонетических слов. В качестве базовой модели слогоделения использовалась модель мускульного напряжения, разработанная Л. В. Щербой. Непосредственные правила для слогоделения были взяты из «Фонетики современного русского языка» М. И. Матусевич.
Изменение абсолютной длительности фонетического слова осуществляется путем изменения длительностей формирующих его слогов. Текущая длительность слога определяется как произведение средней по материалу длительности слога на коэффициент отклонения от средней. Таким же образом рассчитывается длительность звуков внутри слога. Алгоритм расчета коэффициентов длительности звуков в слоге. Пусть необходимо вычислить коэффициенты длительности звуков для ударного слога [b a]. Определяется средняя длительность [b] в материале, средняя длительность ударной реализации фонемы /a/ в материале. Длительность слога равна сумме длительностей составляющих его звуков. Вклад длительности каждого звука вычисляется в процентах от длительности слога.
На первом этапе исследования для этого корпуса автоматически был порожден уровень разметки на фонетические слова (на основании информации о степени редукции гласных аллофонов и границ слов). Затем был порожден уровень слогов. Слогоделение осуществлялось строго внутри фонетических слов. В качестве базовой модели слогоделения использовалась модель мускульного напряжения, разработанная Л. В. Щербой. Непосредственные правила для слогоделения были взяты из «Фонетики современного русского языка» М. И. Матусевич.
Изменение абсолютной длительности фонетического слова осуществляется путем изменения длительностей формирующих его слогов. Текущая длительность слога определяется как произведение средней по материалу длительности слога на коэффициент отклонения от средней. Таким же образом рассчитывается длительность звуков внутри слога. Алгоритм расчета коэффициентов длительности звуков в слоге. Пусть необходимо вычислить коэффициенты длительности звуков для ударного слога [b a]. Определяется средняя длительность [b] в материале, средняя длительность ударной реализации фонемы /a/ в материале. Длительность слога равна сумме длительностей составляющих его звуков. Вклад длительности каждого звука вычисляется в процентах от длительности слога.