XVIII Международная конференция студентов-филологов

Автоматическая оценка тональности текста (на материале отзывов потребителей о товарах)

Анастасия Вадимовна Емельянова
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет

25
2015-04-07
14:00 - 14:20

Ключевые слова, аннотация

Ввиду растущей популярности интернет-маркетинга важную роль при выборе товара играют отзывы других пользователей, уже попробовавших тот или иной товар. Некоторые ресурсы, помимо текста отзыва, предлагают потребителям поставить общую оценку продукту. В докладе представлена программа, которая автоматически выставляет оценку по тексту отзыва на основании анализа тональных маркеров. При анализе используется метод машинного обучения на основе искусственного нейрона.

Тезисы

Разговорные тексты, к которым по жанру можно отнести тексты отзывов о продуктах, помимо объективной информации (диктума) содержат субъективную оценку (модус) предмета автором. Определение эмоционального тона письменной речи и для человека является нетривиальной задачей, автоматизация данного процесса – актуальный вопрос ввиду растущих объёмов текстовой информации в интернете. В докладе описана программа, автоматически определяющая тональность отзывов покупателей о товарах в интернет-магазинах. В качестве конкретного объекта мы использовали тексты отзывов об электронных фотоаппаратах с сервиса «Яндекс.Маркет» (http:/www.market.yandex.ru/). Для определения тональности используются лексические маркеры — слова, с помощью которых в текст вводится оценка. При анализе обучающей выборки отзывов вручную был получен список лексических маркеров, которые были распределены по тематическим категориям. В программе реализован метод машинного обучения и использован искусственный нейрон. Нейронная сеть настраивается при помощи групп тональных маркеров и совокупности отзывов с сайтов с выставленной оценкой по пятибалльной шкале. Эта совокупность представляет так называемый «золотой стандарт». Программа написана на языке C# и реализована при помощи программы Visual Studio. Для определения точности работы программы результаты автоматической оценки сравниваются с отзывами «золотого стандарта» и случайной совокупности отзывов, представленных на «Яндекс.Маркет». Оценивается инструмент, позволяющий автоматически выявлять и оценивать тональность текстов отзывов, и предлагаются пути улучшения метода.