XXI Открытая конференция студентов-филологов в СПбГУ

Проблема автоматического создания каламбуров

Евгения Вячеславовна Чертоусова
Докладчик
студент 4 курса
Санкт-Петербургский государственный университет

ауд. 193
2018-04-19
12:40 - 12:55

Ключевые слова, аннотация

В докладе приводится описание системы для автоматического создания слов-каламбуров в контексте газетных заголовков. В рамках исследования была создана собственная методология разметки слов, проведен сравнительный анализ разных систем морфологического разбора. Проверена гипотеза о том, использует ли человек бессознательно морфологический анализ слов в такой уникальной разговорной ситуации.

Тезисы

Моделирование юмора — это задача, целью которой является упрощение общения на естественном языке между компьютером и человеком. На нынешнем этапе развития искусственного интеллекта особенно важно создать максимально комфортные условия для пользователя, это значит, машина должна стать «человечней» и понимать шутки. Понятие шутки оценивается субъективно, поэтому для моделирования был выбрана одна из самых простых разновидностей юмора, основанная на использовании сходно звучащих слов, имеющих различные значения, — каламбур. В качестве источника контекста были выбраны газетные заголовки как максимально емкие, броские и законченные высказывания. В рамках исследования была проведена систематизация естественных методов, которыми человек, сознательно или бессознательно, пользуется при создании такого рода шуток, их исследование и категоризация. Вопрос о том, использует ли человек морфологическое деление при создании подобного рода шуток, остался дискуссионным, и для подтверждения одной из выдвинутых гипотез было решено сделать модель для каждой из них и сравнить результаты. На этих материалах была создана трехступенчатая система обработки слов. На первом этапе происходит морфологическая, фонетическая и семантическая разметка слов. На втором по результатам разметки подбирается ряд слов-кандидатов для замещения. На третьем — замена и собственно генерация каламбура.