Вариативность темпа речи в чтении
Анастасия Денисовна Ананьева
Докладчик
студент 4 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
Ключевые слова, аннотация
Настоящий доклад посвящен исследованию факторов, влияющих на темп речи, и
механизмов
изменения темпа. Исследование проводилось на основе записей чтения текста.
Результаты показали, что темп речи может зависеть от возраста говорящего. Увеличение
скорости происходит в первую очередь за счет длительности гласных звуков. Долю пауз в речи можно
назвать еще одним фактором, от которого зависит темп.
Тезисы
Ключевые
слова: темп речи; артикуляционный темп; полный темп
Темп — одна из характеристик речи, связанная с интонацией. Темп речи может зависеть от множества факторов, в том числе и от личности самого говорящего. Цель работы — выяснить, какие социальные характеристики влияют на то, с какой скоростью говорит человек, и за счет чего происходит изменение темпа речи. Проведенная работа позволит получить общие представления о тенденциях, которые способствуют увеличению темпа речи без ущерба для восприятия. Впоследствии это может быть полезно для создания программ по ускорению записей, в меньшей степени влияющих на их качество. Для исследования были использованы 53 звуковых файла, содержащих записанный на кафедре фонетики СПбГУ фонетически представительный текст «Был тихий, серый вечер» носителями русского языка, проживающими в Санкт-Петербурге. В них была проведена сегментация на отрезки речи, паузы и фальстарты в программе WaveAssistant. На языке Python была написана программа для подсчета полных длительностей файла, длительностей без учета фальстартов, без учета как фальстартов, так и пауз, полного и артикуляторного темпа речи, длительностей и количества пауз, длительностей фонем и фонетических слов. Темп речи можно разделить на артикуляционный и полный. В первом случае скорость произнесения элементов измеряется без учета пауз. Артикуляторный темп колеблется между 4,7 слога в секунду и 8, а полный 3,7 и 6,3. В ходе работы проверялось влияние пола и возраста диктора на темп с помощью дисперсионного анализа в Exсel. Выяснилось, что фактор пола не значим (p=0,66). Для проверки гипотезы о влиянии возраста, полученные данные были разделены на 3 группы: от 16 до 30 лет (ср. знач. для полного темпа — 5,2, артикуляторного — 6,6), от 31 до 45 (ср. знач. для полного темпа — 5, артикуляторного — 6,4), от 46 до 77 (ср. знач. для полного темпа — 4,6, артикуляторного — 5,7). Возраст оказался значимым как для данных артикуляционного темпа (p=0,004), так и для полного (p=0,0001). Более того, проведение сравнения между группами показало, что наибольшее влияние возраста на артикуляционный темп заметно в 1 и 3 группой, а на полный темп как между 1 и 3, так и 2 и 3. Наибольшие значения темпа наблюдаются в группе 16-30 и составляют 6,3 для полного темпа и 8 для артикуляторного, наименьшие — в группе 46—77, 3,7 и 4,7 слогов в секунду. Эти результаты подтверждают явления, описанные Трувеном [Trouvain, 2003: 10—11]. Для исследования механизмов изменения темпа речи были выбраны 4 файла: с самым высоким и самым низким артикуляционным и полным темпом соответственно. Разница в длительностях фонем, реализованных в одном и том же месте, в большинстве случаев была положительной (отрицательная разница составила около 16% для артикуляторного темпа и 24% для полного). Таким образом, наблюдается тенденция увеличения длительностей фонем. Как правило, наибольшая разница встречается у гласных (в среднем 47%), а два самых больших значения соответствуют ударным (70% и 81%). Кроме того, была подтверждена гипотеза о связи полного темпа с долей пауз. Коэффициент корреляции составил —0,298 (p=0,0302), что говорит о наличии обратной зависимости: чем медленнее темп, тем больше в речи пауз.
Литература:
Trouvain J. Tempo Variation in Speech Production. Implications for Speech Synthesis. PhD Dissertation, Germany, 2003.
Темп — одна из характеристик речи, связанная с интонацией. Темп речи может зависеть от множества факторов, в том числе и от личности самого говорящего. Цель работы — выяснить, какие социальные характеристики влияют на то, с какой скоростью говорит человек, и за счет чего происходит изменение темпа речи. Проведенная работа позволит получить общие представления о тенденциях, которые способствуют увеличению темпа речи без ущерба для восприятия. Впоследствии это может быть полезно для создания программ по ускорению записей, в меньшей степени влияющих на их качество. Для исследования были использованы 53 звуковых файла, содержащих записанный на кафедре фонетики СПбГУ фонетически представительный текст «Был тихий, серый вечер» носителями русского языка, проживающими в Санкт-Петербурге. В них была проведена сегментация на отрезки речи, паузы и фальстарты в программе WaveAssistant. На языке Python была написана программа для подсчета полных длительностей файла, длительностей без учета фальстартов, без учета как фальстартов, так и пауз, полного и артикуляторного темпа речи, длительностей и количества пауз, длительностей фонем и фонетических слов. Темп речи можно разделить на артикуляционный и полный. В первом случае скорость произнесения элементов измеряется без учета пауз. Артикуляторный темп колеблется между 4,7 слога в секунду и 8, а полный 3,7 и 6,3. В ходе работы проверялось влияние пола и возраста диктора на темп с помощью дисперсионного анализа в Exсel. Выяснилось, что фактор пола не значим (p=0,66). Для проверки гипотезы о влиянии возраста, полученные данные были разделены на 3 группы: от 16 до 30 лет (ср. знач. для полного темпа — 5,2, артикуляторного — 6,6), от 31 до 45 (ср. знач. для полного темпа — 5, артикуляторного — 6,4), от 46 до 77 (ср. знач. для полного темпа — 4,6, артикуляторного — 5,7). Возраст оказался значимым как для данных артикуляционного темпа (p=0,004), так и для полного (p=0,0001). Более того, проведение сравнения между группами показало, что наибольшее влияние возраста на артикуляционный темп заметно в 1 и 3 группой, а на полный темп как между 1 и 3, так и 2 и 3. Наибольшие значения темпа наблюдаются в группе 16-30 и составляют 6,3 для полного темпа и 8 для артикуляторного, наименьшие — в группе 46—77, 3,7 и 4,7 слогов в секунду. Эти результаты подтверждают явления, описанные Трувеном [Trouvain, 2003: 10—11]. Для исследования механизмов изменения темпа речи были выбраны 4 файла: с самым высоким и самым низким артикуляционным и полным темпом соответственно. Разница в длительностях фонем, реализованных в одном и том же месте, в большинстве случаев была положительной (отрицательная разница составила около 16% для артикуляторного темпа и 24% для полного). Таким образом, наблюдается тенденция увеличения длительностей фонем. Как правило, наибольшая разница встречается у гласных (в среднем 47%), а два самых больших значения соответствуют ударным (70% и 81%). Кроме того, была подтверждена гипотеза о связи полного темпа с долей пауз. Коэффициент корреляции составил —0,298 (p=0,0302), что говорит о наличии обратной зависимости: чем медленнее темп, тем больше в речи пауз.
Литература:
Trouvain J. Tempo Variation in Speech Production. Implications for Speech Synthesis. PhD Dissertation, Germany, 2003.