XXV Открытая конференция студентов-филологов в СПбГУ

Модификация речевого сигнала с целью увеличения темпа речи при сохранении ее разборчивости

Александра Максимовна Бакалина
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет

Фонетика (онлайн)
2022-04-22
14:20 - 14:40

Ключевые слова, аннотация

Целью настоящего исследования является модификация речевого сигнала с целью увеличения темпа речи при сохранении ее разборчивости. В качестве материала исследования были использованы записи из корпуса спонтанных диалогов CoRuSS. Модификация и анализ сигнала осуществлялись в программе Wave Assistant и разработанной в рамках данного исследования программой, написанной на языке Python. В результате проведенных экспериментов был выявлен ряд модификаций, которые позволяют увеличить темп речи, сохраняя при этом ее разборчивость, а также обнаружены те модификации, которые вредят разборчивости речи.

Тезисы

Цель настоящего исследования — модификация речевого сигнала с целью увеличения темпа речи при сохранении ее разборчивости. Задачи, выполненные в рамках исследования, заключаются в выявлении модификаций, которые можно применить для увеличения темпа речи, и обнаружении среди них тех модификаций, которые позволяют сохранить ее разборчивость.
В качестве материала исследования использовались записи корпуса спонтанных диалогов CoRuSS. На первом этапе происходила ручная модификация сигнала в программе Wave Assistant и разработка специальной программы на Python, автоматизирующей процесс модификации сигнала. Далее проводились перцептивные эксперименты для оценки модифицированного сигнала. В качестве респондентов (15 человек), принимавших участие в перцептивных экспериментах, были выбраны носители русского языка от 18 до 50 лет.
При проведении перцептивных экспериментов оценка модифицированного сигнала осуществлялась с помощью специальной шкалы степени разборчивости:
1. Все понятно.
2. Понятно почти все.
3. Понятно больше половины.
4. Понятна половина.
5. Понятно меньше половины.
6. Почти ничего не понятно.
7. Ничего не понятно.
При предъявлении записей респондентам одна и та же по-разному модифицированная запись каждый раз оценивалась разными респондентами.
После проведения экспериментов были получены следующие результаты.
1. Полное удаление всех пред-предударных гласных (первый звук [a] в слове [vazrazhala]), всех заударных гласных (не в открытых конечных слогах) не вредит разборчивости: 5 записей, 5/5 респондентов, время звучания уменьшилось на 31%.
2. Полное удаление пауз не вредит разборчивости.
3. Полное удаление союза «и» (заударная позиция) не вредит разборчивости: 2 записи, 5/5 респондентов восстановили союз.
4. Полное удаление не вредящих звуку участков (смычка смычных согласных, стационарный участок щелевых согласных) глухих и некоторых звонких согласных («z», «z’», «zh», «g», «g’», «b», «b’», «d», «d’») не вредит разборчивости: 5 записей, 5/5 респондентов, время звучания сокращено на 15%.
5. Удаление всех предударных гласных 1-ой степени редукции и согласного «r» вредит разборчивости.
6. Сокращение количества периодов звонких согласных (до 5, 6, 8 периодов в зависимости от изначального количества) не вредит разборчивости: 5 записей, 5/5 респондентов, время звучания уменьшается на 18%.
Из всех экспериментов с применением одновременно всех модификаций самый высокий показатель разборчивости был при удалении возможных для модификации участков глухих и звонких согласных, сокращении количества периодов звонких согласных (до 5, 6, 8 периодов), сокращении количества периодов всех заударных гласных (до 3 периодов), предударных гласных (до 4, 6 периодов), ударных гласных (до 5, 8, 10 периодов), время звучания уменьшается на 61%; 5 записей, 5/5 респондентов («Все понятно»).