XXVII Открытая конференция студентов-филологов в СПбГУ

Автоматическое распознавание английских заимствований в русской речи (на примере сферы IT)

Сергей Владимирович Силков
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет

157
2024-04-27
17:00 - 17:15

Ключевые слова, аннотация

Исследование посвящено улучшению автоматического распознавания речи (ASR) через интеграцию и дообучение с использованием корпуса английских заимствований, актуальных в контексте IT-сферы. Основываясь на анализе жаргона и англицизмов в русской речи, исследование стремится повысить точность и надежность ASR, адаптировав его к особенностям многоязычной и профессиональной речи. Разработанная методология включает создание специализированного корпуса англицизмов, его интеграцию и дообучение модели Wav2vec, последующее тестирование и анализ эффективности.

Тезисы

Ключевые слова: автоматическое распознавание речи (ASR); интеграция и дообучение модели wav2vec; особенности использования жаргона в IT-сфере; корпус английских заимствований в русском языке; многоязычная и профессиональная речь

Данное исследование направлено на анализ и улучшение систем автоматического распознавания речи (ASR), с фокусом на интеграцию англицизмов, которые широко используются в IT-сфере. В начале работы был проведен глубокий анализ существующих научных исследований для определения ключевых аспектов автоматического распознавания речи и его эволюции, что позволило выявить существующие проблемы и определить направления для дальнейшего развития. Особое внимание было уделено жаргону и английским заимствованиям как значительному лингвистическому явлению, которое играет важную роль в профессиональной коммуникации в IT-секторе. Создание аудиокорпуса англицизмов, включающего сбор и систематизацию примеров из русской речи в контексте IT, стало ключевой задачей для обеспечения материала для дообучения и интеграции в системы ASR.
В исследовании использовались современные технические инструменты и методологии обработки естественного языка для анализа и обработки собранных данных. Это позволило не только качественно подготовить аудиокорпус, но и обеспечить его максимальную релевантность и представительность в контексте задачи. Завершающий этап работы охватывает интеграцию собранного корпуса в систему ASR на базе модели wav2vec, нацеленную на адаптацию к особенностям русской речи с англицизмами. Существенной частью исследования стало дообучение модели wav2vec, используя корпус англицизмов для увеличения точности распознавания. Процесс включал тестирование и оценку эффективности модели после интеграции корпуса и дообучения, что позволило оценить достигнутые улучшения и определить дальнейшие направления развития.
Исследование подчеркивает важность адаптации систем автоматического распознавания речи к многоязычной и профессиональной речи, открывая новые перспективы для их применения в специализированных областях. Выводы исследования могут быть использованы для улучшения существующих систем ASR, а также служить основой для разработки новых решений, нацеленных на эффективную работу в условиях современного многоязычного информационного пространства.