Проблема автоматического создания каламбуров
Евгения Вячеславовна Чертоусова
Докладчик
студент 4 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
ауд. 193
2018-04-19
12:40 -
12:55
Ключевые слова, аннотация
В докладе приводится описание системы для автоматического создания слов-каламбуров в контексте газетных заголовков. В рамках исследования была создана собственная методология разметки слов, проведен сравнительный анализ разных систем морфологического разбора. Проверена гипотеза о том, использует ли человек бессознательно морфологический анализ слов в такой уникальной разговорной ситуации.
Тезисы
Моделирование юмора — это задача, целью которой является упрощение общения на естественном языке между компьютером и человеком. На нынешнем этапе развития искусственного интеллекта особенно важно создать максимально комфортные условия для пользователя, это значит, машина должна стать «человечней» и понимать шутки. Понятие шутки оценивается субъективно, поэтому для моделирования был выбрана одна из самых простых разновидностей юмора, основанная на использовании сходно звучащих слов, имеющих различные значения, — каламбур. В качестве источника контекста были выбраны газетные заголовки как максимально емкие, броские и законченные высказывания. В рамках исследования была проведена систематизация естественных методов, которыми человек, сознательно или бессознательно, пользуется при создании такого рода шуток, их исследование и категоризация. Вопрос о том, использует ли человек морфологическое деление при создании подобного рода шуток, остался дискуссионным, и для подтверждения одной из выдвинутых гипотез было решено сделать модель для каждой из них и сравнить результаты. На этих материалах была создана трехступенчатая система обработки слов. На первом этапе происходит морфологическая, фонетическая и семантическая разметка слов. На втором по результатам разметки подбирается ряд слов-кандидатов для замещения. На третьем — замена и собственно генерация каламбура.