XX Открытая конференция студентов-филологов в СПбГУ

Принципы работы русскоязычного чат-бота «Театрал» для обслуживания интернет-афиш

Евгения Вячеславовна Чертоусова
Докладчик
студент 4 курса
Санкт-Петербургский государственный университет

129
2017-04-20
14:50 - 15:05

Ключевые слова, аннотация

В докладе рассказывается о технологиях создания чат-бота «Театрал» для общения с клиентами, которых интересует расписание театров и концертных залов. В его основе лежит принцип реагирования на фразы и слова-шаблоны. В рамках доклада представлен экспериментальный чат-бот, созданный с использованием языка описания сценариев ChatScript.

Тезисы

В докладе рассказывается о технологиях и проблемах создания чат-бота «Театрал» для общения с клиентами, которых интересует расписание театров и концертных залов. Чат-бот получает сообщение пользователя, упрощает синтаксис предложения, затем анализирует получившиеся данные, сравнивает их с введенными разработчиком шаблонами и подбирает максимально подходящий ответ.
«Театрал» использует четыре основные темы: ~place (для той части беседы, где бот узнает пользователя хочет он пойти в кино, театр, цирк и т. д.), ~genre (для того, чтобы узнать, выбирает ли он комедию, драму, мюзикл, ледовое шоу и т. д.), ~date (для того, чтобы подобрать удобный день недели) и ~booking (для бронирования билета онлайн). Кроме того, используется порядка десяти вспомогательных подтем, которые помогают сделать чат-бот более гибким в общении с пользователем. 
Для обработки нестандартных реплик созданы дополнительные темы: ~help (если пользователь попросить помочь с выбором — эта тема учитывает наличие детей, желаемое время и т. п.) и ~small_talk (если пользователь попытается завести беседу, не связанную с выбором спектакля). 
Каждой теме присвоены свои ключевые слова, с помощью которых чат-бот выбирает нужный ответ. Кроме того, был написан контрольный скрипт и несколько гамбитных правил на случай, если в реплике не встретиться ни одного ключевого слова. Они помогают чат-боту решить, какое правило использовать, или выводят дополнительные вопросы. 
При разработке чат-бота необходимо использовать сторонние ресурсы, словари и тезаурусы, чтобы максимально точно учесть запрос пользователя. В частности широко используется тезаурус WordNet и встроенный парсер. Для решений неоднозначностей (например, в теме ~help драмой может быть и театральная постановка, и фильм) используются гамбитные правила.