47th International Philological Research Conference

Schwa 2.0. Библиотека для фонетического анализа речевого сигнала

Александр Владимирович Шипило
Докладчик
старший лаборант
Санкт-Петербургский государственный университет

157
2018-03-20
16:30 - 16:45

Ключевые слова, аннотация

автоматический анализ речи, экспериментальный анализ, интонационный анализ, извлечение полезных признаков из сигнала, статистический анализ, сегментация, транскрипция, визуализация данных

Тезисы

Существует большое количество программных продуктов для анализа и визуалиции данных. Однако, на сегодняшний день не существует легко масштабируемой программы/программной библиотеки для фонетического анализа. Известная и широко используемая программа Praat, несмотря на свои преимущества (кроссплатформенность, встроенный язык программирования) имеет очень важные недостатки: 1)      Отсутствие современного отладчика для языка программирования Praat делает трудным и времязатратным процесс разработки скрипта для проведения фонетического анализа. 2)      Интерфейс Praat слабо или совсем не менялся за последние 20 лет, графические библиотеки, на которых написан Praat устарели. 3)      Praat сильно ограничивает пользователя в возможностях настройки интерфейса «под себя». Например, невозможно изменить встроенные комбинации клавиш под нужды пользователя. Программная оболочка Schwa написана на языке программирования Python, имеет модульную архитектуру, что позволяет легко модифицировать программу под свои нужды, а такие системы отладки, как, например, PyCharm максимально упрощают этот процесс. Кроме того, под Python написано большое количество библиотек для анализа данных (pandas), визуализации (matplotlib), машинного обучения (scikit-learn, tensor flow), которые легко могут быть использованы в работе. Schwa представляет собой набор модулей, скриптов на языке Python. Настоящая версия включает в себя модули для извлечения акустических признаков из речевого сигнала по границам сегментных единиц. В настоящий момент поддерживается работа с файлами дескрипторами программы Praat и WaveAssistant. Для использования корпусов с аннотацией, сделанных в других программах, достаточно только создать функцию чтения этих файлов дескрипторов во внутренний формат программы Schwa.