Автоматическая оценка тональности текста (на материале отзывов потребителей о товарах)
Анастасия Вадимовна Емельянова
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
25
2015-04-07
14:00 -
14:20
Ключевые слова, аннотация
Ввиду растущей
популярности интернет-маркетинга важную
роль при выборе товара играют отзывы
других пользователей, уже попробовавших
тот или иной товар. Некоторые ресурсы, помимо текста отзыва, предлагают
потребителям поставить общую оценку
продукту. В докладе представлена программа,
которая автоматически выставляет оценку
по тексту отзыва на основании анализа
тональных маркеров. При анализе используется метод машинного обучения на основе
искусственного нейрона.
Тезисы
Разговорные
тексты, к которым по жанру можно отнести
тексты отзывов о продуктах, помимо
объективной информации (диктума) содержат
субъективную оценку (модус) предмета
автором. Определение эмоционального
тона письменной речи и для человека
является нетривиальной задачей,
автоматизация данного процесса –
актуальный вопрос ввиду растущих объёмов
текстовой информации в интернете. В
докладе описана программа, автоматически
определяющая тональность отзывов
покупателей о товарах в интернет-магазинах.
В качестве конкретного объекта мы
использовали тексты отзывов об электронных
фотоаппаратах с сервиса «Яндекс.Маркет»
(http:/www.market.yandex.ru/).
Для определения тональности используются
лексические маркеры — слова, с помощью
которых в текст вводится оценка. При
анализе обучающей выборки отзывов
вручную был получен список лексических
маркеров, которые были распределены по
тематическим категориям. В программе
реализован метод машинного обучения и
использован искусственный нейрон.
Нейронная сеть настраивается при помощи
групп тональных маркеров и совокупности
отзывов с сайтов с выставленной оценкой
по пятибалльной шкале. Эта совокупность
представляет так называемый «золотой
стандарт». Программа написана на языке
C# и реализована при помощи
программы Visual Studio.
Для определения точности работы программы
результаты автоматической оценки
сравниваются с отзывами «золотого
стандарта» и случайной совокупности
отзывов, представленных на «Яндекс.Маркет».
Оценивается инструмент, позволяющий
автоматически выявлять и оценивать
тональность текстов отзывов, и предлагаются
пути улучшения метода.