Разработка чат-бота-библиотекаря, рекомендующего книги на основе истории запросов пользователя
Вероника Максимовна Ахапкина
Докладчик
студент 3 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
Будетляне. Гипотеза в филологии (онлайн)
2022-04-18
16:40 -
17:00
Ключевые слова, аннотация
В работе описывается методология и процесс разработки рекомендательной системы, имеющей в качестве интерфейса чат-бот, написанный на языке программирования Kotlin. В качестве базы книг была использована библиотека Максима Мошкова (портал «Lib.ru»). Были отобраны наиболее четко противопоставленные жанры из рубрикатора библиотеки, внутри них был выделен сегмент, сбалансированный относительно метаданных. В результате работы чат-бота-библиотекаря пользователь получает подборку книг. Продукт оценивается как с точки зрения качества рекомендаций, так и со стороны пользовательского интерфейса.
Тезисы
Процесс поиска
литературного произведения в соответствии с личными вкусами читателя способен
отнять большое количество сил и времени у пользователя. Множество факторов
влияет на принятие человеком решения о выборе определенного произведения.
Каждое отдельное произведение обладает набором признаков, выделяемых
статистически или содержащихся в метаданных. Релевантные признаки также
вводятся в метаразметку корпуса, например, на уровне деления текстов по жанрам
и авторам.
Количество возможных комбинаций различных признаков очень велико. Вследствие этого принятие решения о том, какие из признаков являются релевантными касательно литературных вкусов конкретного пользователя, может становиться несоразмерно трудозатратным.
Целью данной работы является создание удобной в использовании и не требующей от пользователя временных и интеллектуальных затрат системы рекомендации текстов. Данная цель также предполагает, что полученная рекомендательная система будет легко подстраиваться под пользователя и одновременно выдавать релевантные рекомендации.
Существует также проблема излишнего таргетирования рекомендаций, при которой пользователю не предоставляется возможность выйти за рамки привычного круга жанров и авторов. Эта проблема была решена добавлением возможности указать степень соответствия рекомендуемых текстов данным о пользовательских предпочтениях.
Эти данные включают в себя жанр текста, личность автора и его гендерную принадлежность, год написания и тематику текста. Информация о темах, представленных в тексте, извлекается с помощью алгоритмов тематического моделирования.
В целях определения предпочтений пользователя чат-бот предлагает ему список жанров на выбор, затем список авторов, а потом список тем произведений. После этого на оценку пользователю предлагается несколько фрагментов из различных произведений, соответствующих собранным данным настолько, насколько предполагает выбранный уровень свободы рекомендательной системы.
В результате работы чат-бота-библиотекаря пользователь получает подборку книг и имеет возможность оценить каждый рекомендованный ему текст в соответствии с тем, насколько он удовлетворяет его предпочтениям. Данные об ответах пользователя сохраняются и используются в будущих итерациях процесса рекомендации.
Результаты работы продукта оцениваются как с точки зрения качества рекомендаций, то есть их субъективной полезности и объективной обоснованности, так и со стороны удобства пользовательского интерфейса.
Количество возможных комбинаций различных признаков очень велико. Вследствие этого принятие решения о том, какие из признаков являются релевантными касательно литературных вкусов конкретного пользователя, может становиться несоразмерно трудозатратным.
Целью данной работы является создание удобной в использовании и не требующей от пользователя временных и интеллектуальных затрат системы рекомендации текстов. Данная цель также предполагает, что полученная рекомендательная система будет легко подстраиваться под пользователя и одновременно выдавать релевантные рекомендации.
Существует также проблема излишнего таргетирования рекомендаций, при которой пользователю не предоставляется возможность выйти за рамки привычного круга жанров и авторов. Эта проблема была решена добавлением возможности указать степень соответствия рекомендуемых текстов данным о пользовательских предпочтениях.
Эти данные включают в себя жанр текста, личность автора и его гендерную принадлежность, год написания и тематику текста. Информация о темах, представленных в тексте, извлекается с помощью алгоритмов тематического моделирования.
В целях определения предпочтений пользователя чат-бот предлагает ему список жанров на выбор, затем список авторов, а потом список тем произведений. После этого на оценку пользователю предлагается несколько фрагментов из различных произведений, соответствующих собранным данным настолько, насколько предполагает выбранный уровень свободы рекомендательной системы.
В результате работы чат-бота-библиотекаря пользователь получает подборку книг и имеет возможность оценить каждый рекомендованный ему текст в соответствии с тем, насколько он удовлетворяет его предпочтениям. Данные об ответах пользователя сохраняются и используются в будущих итерациях процесса рекомендации.
Результаты работы продукта оцениваются как с точки зрения качества рекомендаций, то есть их субъективной полезности и объективной обоснованности, так и со стороны удобства пользовательского интерфейса.