Интервальные отношения между формантами гласного как инвариантный признак гласного (и вокалической системы)
Данила Владимирович Гомулькин
Докладчик
преподаватель
Teachers' Lab, языковая школа
Teachers' Lab, языковая школа
157
2015-03-12
14:50 -
15:20
Ключевые слова, аннотация
Рассмотрение высоты
формант гласных в логарифмической шкале
обнаруживает постоянство
интервальных отношений между
формантами
гласного. Независимость интервальной
структуры гласного от высоты основного
тона и физиологических особенностей
горящего открывает новые возможности
для сравнения вокалических систем,
синтеза гласных и автоматического
определения диалектной принадлежности
диктора.
Тезисы
Терренс Нири (Nearey,
1976), основываясь на данных Петерсона и
Барни (Peterson and Barney, 1952), обратил внимание
на совпадение размеров и формы построенных
в логарифмической шкале трапециодов
гласных мужчин, женщин и детей. Однако
исследователя более заинтересовало
смещение трапециодов в плоскости F1/F2
как функция длины вокалического тракта,
чем само равенство размеров трапециодов.
Между тем, неизменность расстояний между формантами гласных в логарифмической шкале, которая соответствует перцептивной шкале восприятия человеком высотных интервалов, указывает на важности интервальных отношений в спектре гласного, обеспечивающим его узнавание независимо от высоты основного тона и физиологических особенностей говорящего (длины речевого тракта).
Данные позднейших исследований формант американского варианта английского языка (Hillerbrand et al, 1995; Hagiwara, 1997) и русского языка (Соркин, Цыплихин 2004, Сорокин, Леонов, Макаров, 2009) подтверждают важность интервального устройства вокалических систем и позволяют проследить некоторые закономерности.
Методика
Высота формант (F1-3) и основного тона (F0, при наличии данных) для серий гласных откладывалась в полутоновой (логарифмической) шкале и транспонировались до максимального совпадения между сериями гласных. Для пересчета из Герц в полутоны использовалась формула: y = 12*log2((x)/440)+69, где x – значение высоты в Герцах, а y – номер клавиши MIDI-клавиатуры.
В отличие от существующих методов нормализации гласных (Thomas, 20012), метод транспонирования в полутоновой шкале не искажает интервальные отношения между формантами гласных и позволяет сравнивать вокалические системы в отношении их интервальной организации.
Результаты
Результаты исследования сводятся к следующим положениям:
Между тем, неизменность расстояний между формантами гласных в логарифмической шкале, которая соответствует перцептивной шкале восприятия человеком высотных интервалов, указывает на важности интервальных отношений в спектре гласного, обеспечивающим его узнавание независимо от высоты основного тона и физиологических особенностей говорящего (длины речевого тракта).
Данные позднейших исследований формант американского варианта английского языка (Hillerbrand et al, 1995; Hagiwara, 1997) и русского языка (Соркин, Цыплихин 2004, Сорокин, Леонов, Макаров, 2009) подтверждают важность интервального устройства вокалических систем и позволяют проследить некоторые закономерности.
Методика
Высота формант (F1-3) и основного тона (F0, при наличии данных) для серий гласных откладывалась в полутоновой (логарифмической) шкале и транспонировались до максимального совпадения между сериями гласных. Для пересчета из Герц в полутоны использовалась формула: y = 12*log2((x)/440)+69, где x – значение высоты в Герцах, а y – номер клавиши MIDI-клавиатуры.
В отличие от существующих методов нормализации гласных (Thomas, 20012), метод транспонирования в полутоновой шкале не искажает интервальные отношения между формантами гласных и позволяет сравнивать вокалические системы в отношении их интервальной организации.
Результаты
Результаты исследования сводятся к следующим положениям:
- Интервальные отношения между формантами гласных (F1, F2, F3) дикторов одного регионального диалекта обыкновенно совпадают при транспонировании независимо от различия в высоте отставного тона и физиологических особенностей говорящего (длины речевого тракта). (Peterson and Barney, 1952, Hillenbrand et al., 1995).
- При транспонировании в одну тональность, высота основного тона (F0) мужчин отстоит от остальных формант на 3 тона ниже, чем у женщин и детей – что можно объяснить различием в положении и размере гортани. Указанное различие может служить надежным акустическим признаком половозрелого самца, не зависящим от высоты основного тона диктора (Peterson and Barney, 1952, Hillenbrand et al., 1995)
- Форманты гласных могут последовательно совпадать с гармониками основного тона (Peterson and Barney, 1952, мужчины, передние гласные)
- Интервальные отношения между формантами гласных индивидуальны для территориальных диалектов, различие носит ступенчатый характер, позволяя говорить об использовании различных ступеней интервальной шкалы или использовании различных интервальных шкал (Peterson and Barney, 1952; Hillenbrand et al., 1995; Hagiwara, 1997).
- Интервальные отношения гласных мужчин могут различаться, при этом различие носит ступенчатый характер и выражается в пропусках отдельных ступеней интервальной шкалы (Hagiwara, 1997).