Компьютерная генерация кулинарных рецептов с помощью марковских моделей
Вероника Максимовна Ахапкина
Докладчик
студент 2 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
Ключевые слова, аннотация
В докладе описывается
серия экспериментов по компьютерной
генерации кулинарных
рецептов
с помощью марковских моделей.
Для эксперимента были собраны тексты
рецептов с самых крупных интернет-платформ
для размещения
рецептов в рунете. Тексты
были приведены к общему формату и
распределены по категориям. Было создано
несколько моделей генерации рецептов
при
помощи модуля
markovify
для
языка программирования python
с
различными параметрами генерации. После
этого была проведена оценка как текстов
сгенерированных рецептов, так и некоторых
полученных на их основании блюд.
Тезисы
Тексты
кулинарных рецептов представляют собой
результат творческой деятельности
людей, которые являются в той или иной
мере экспертами в области
приготовления пищи.
Помимо знаний эксперта, создание таких
текстов требует больших вложений
времени, труда и зачастую материальных
ресурсов в виде ингредиентов при
тестировании и сравнении различных
версий рецепта. Компьютерная генерация
рецептов могла бы:
в идеале — автоматизировать процесс
создания рецепта и избавить пользователя
от необходимости консультироваться с
экспертом или искать необходимый рецепт
в интернете; как минимум — упростить
начальный этап составления рецепта для
эксперта и в результате сократить его
умственные и материальные затраты; а
также предложить новые неожиданные
комбинации ингредиентов или действий.
В работе описывается серия экспериментов по компьютерной генерации рецептов с помощью марковских моделей. Целью работы было получение текста, который не повторяет уже существующие рецепты, т.е. оригинален настолько, насколько это позволяет формат; выглядит как рецепт: имеет все необходимые структурные компоненты; может функционировать как рецепт в двух основных аспектах: имеет связь между структурными компонентами (например, между списком ингредиентов и инструкцией) и может быть исполнен.
Для эксперимента были автоматически собран корпус рецептов с различных интернет-ресурсов. Особенностью текста рецепта является строгая структура, что упрощает его компьютерную обработку. Он имеет заголовок, часто перед основным текстом присутствует краткое вступление, обязательно наличие списка ингредиентов (с указанием количества для каждого из них) и инструкции, в которой последовательно излагаются необходимые шаги в приготовлении блюда. Внутри каждого из разделов текст также в той или иной степени формализован, и поэтому с помощью марковских моделей оказалось возможным генерировать тексты разделов автоматически. Был разработан алгоритм, повышающий степень связности между различными структурными компонентами готового рецепта.
Оценка использованных методов генерации текстов проводилась по двум направлениям. Во-первых, полученные рецепты оценивались с точки зрения качества текста: насколько его структура и наполнение следуют логике жанра, правилам русского языка и здравому смыслу. Во-вторых, с помощью экспертов-добровольцев оценивались вкусовые качества блюд, приготовленных на основе компьютерных рецептов.
В работе описывается серия экспериментов по компьютерной генерации рецептов с помощью марковских моделей. Целью работы было получение текста, который не повторяет уже существующие рецепты, т.е. оригинален настолько, насколько это позволяет формат; выглядит как рецепт: имеет все необходимые структурные компоненты; может функционировать как рецепт в двух основных аспектах: имеет связь между структурными компонентами (например, между списком ингредиентов и инструкцией) и может быть исполнен.
Для эксперимента были автоматически собран корпус рецептов с различных интернет-ресурсов. Особенностью текста рецепта является строгая структура, что упрощает его компьютерную обработку. Он имеет заголовок, часто перед основным текстом присутствует краткое вступление, обязательно наличие списка ингредиентов (с указанием количества для каждого из них) и инструкции, в которой последовательно излагаются необходимые шаги в приготовлении блюда. Внутри каждого из разделов текст также в той или иной степени формализован, и поэтому с помощью марковских моделей оказалось возможным генерировать тексты разделов автоматически. Был разработан алгоритм, повышающий степень связности между различными структурными компонентами готового рецепта.
Оценка использованных методов генерации текстов проводилась по двум направлениям. Во-первых, полученные рецепты оценивались с точки зрения качества текста: насколько его структура и наполнение следуют логике жанра, правилам русского языка и здравому смыслу. Во-вторых, с помощью экспертов-добровольцев оценивались вкусовые качества блюд, приготовленных на основе компьютерных рецептов.