Автоматизированное исправление канцеляризмов
Варвара Дмитриевна Михайлова
Докладчик
магистрант 1 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
2-у
2014-04-11
14:30 -
14:50
Ключевые слова, аннотация
Цель работы — разработка программного обеспечения
для автоматизированного исправления канцеляризмов в письменных текстах. Описывается создание параллельного корпуса, левую
часть которого составляют примеры канцелярской речи, приведенные в книгах Норы
Галь, Корнея Чуковского и Бориса Тимофеева, а правую — примеры того, как
специалисты по стилистике предлагают исправить эти тексты. Предложена попытка формализации правил исправления канцеляризмов на
базе созданного корпуса. Формализованные правила интегрируются в программу на
языке C#.
Тезисы
Опыт ежедневного обращения к устным и
письменным текстам показывает, что «чиновничий жаргон» уже давно перестал быть
атрибутом официально-делового стиля. Канцеляризмами «заражены» передовицы
газет, рекламные лозунги, школьные сочинения и даже лирические письма. Именно
это заставило нас заняться проблемой автоматизированного исправления
канцеляризмов и разработать соответствующее программное обеспечение.
Теоретическая часть работы содержит
обобщенное и дополненное описание существующих типов канцеляризмов
и рекомендации по их исправлению. В этой части мы опираемся на работы Н.
Галь, К. Чуковского, И. Голуб, Б. Тимофеева и других специалистов в области
языковой стилистики.
Практическая часть работы — это
создание и выравнивание параллельного корпуса стилистически маркированных и
немаркированных текстов, описание формальных правил исправления канцеляризмов и
построение программы стилистической коррекции на языке C#.
При создании параллельного корпуса мы
заполняли левую часть фрагментами канцелярской речи, приведенными в указанных
работах по стилистике, а правую — примерами того, как специалисты предлагают
исправить эти тексты. Далее мы вычленяли из текстов конкретные слова и
конструкции, которые делают предложение тяжеловесным. Например, выражение
«произвести + отглагольное существительное» регулярно заменяется однокоренным
глаголом («произвести выстрел» — «выстрелить»). На основании таких данных мы
создали формальные правила и заложили их в программу, которая ищет в тексте
канцеляризмы и подсказывает пользователю, как их можно исправить.
Тестирование программы на случайных
текстах художественного и публицистического стилей показало, что она может быть
полезна как редактору, так и рядовому пользователю, но заложенные в ней правила
требуют контекстной корректировки, так как одни и те же слова, словосочетания и
конструкции не всегда требуют исправления. Для исправления канцеляризмов также
требуются мощные синтаксически и семантические анализаторы.