XXI Открытая конференция студентов-филологов в СПбГУ

Экспериментальное исследование методов автоматического реферирования текстов

Елена Вячеславовна Соколова
Докладчик
студент 4 курса
Санкт-Петербургский государственный университет

ауд. 193
2018-04-19
12:55 - 13:10

Ключевые слова, аннотация

В докладе представлены результаты экспериментального исследования методов автоматического реферирования на материале русских художественных текстов. В ходе исследования было рассмотрено несколько методов автоматического реферирования, их внутренняя организация и выявлены факторы, влияющие на качество работы алгоритма в целом.

Тезисы

Учитывая современные условия жизни, каждый день человеку приходится сталкиваться с огромным объёмом информации, обработать который вручную просто не представляется возможным. К тому же, ручной труд для решения подобных задач слишком энерго- и ресурсозатратен. Таковы, пожалуй, основные причины высокой потребности в автоматизации методов обработки текстов на естественном языке сегодня. Алгоритмы автоматического реферирования не являются исключением.
Автоматическое реферирование представляет собой процесс сокращения некоторого документа посредством применения определённого программного обеспечения для получения реферата с сохранением основных пунктов содержания оригинального документа. Алгоритмы автоматического реферирования имеют довольно широкий круг практического применения: они используются для автоматического создания аннотаций; индексирования в области информационного поиска; различных задач, предполагающих установление релевантности документа, и т. д.
В результате работы алгоритма автоматического реферирования может быть получен экстрактивный или абстрактивный реферат. Первый вид рефератов состоит исключительно из тех данных, которые уже содержатся в оригинальном тексте, т. е. составляется из извлечённых из него единиц. Абстрактивный реферат, в свою очередь, предполагает непосредственную генерацию нового текста, передающего основные пункты содержания оригинала.
В данном исследовании мы сосредоточили своё внимание на методах генерации абстрактивных рефератов, их внутренней организации и принципах работы. Таким образом, задачей нашего исследования является выявление достоинств и недостатков устройства и работы каждого принятого в рассмотрение метода. В качестве материалов исследования используются различные тексты, написанные художественным функциональным стилем. Процедура эксперимента заключается в непосредственном автоматическом создании абстрактивных рефератов с помощью каждого метода, оценке полученных результатов и их интерпретации с точки зрения устройства алгоритма, а также поиске возможных путей решения существующих проблем. В ходе исследования было выявлено, какие из рассмотренных алгоритмов порождают наиболее релевантные абстрактивные рефераты, и установлены причины различий в качестве работы алгоритмов.