Экспериментальное исследование методов автоматического реферирования текстов
Елена Вячеславовна Соколова
Докладчик
студент 4 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
ауд. 193
2018-04-19
12:55 -
13:10
Ключевые слова, аннотация
В докладе представлены результаты экспериментального
исследования методов автоматического реферирования на материале русских
художественных текстов. В ходе исследования было
рассмотрено несколько методов автоматического реферирования, их внутренняя
организация и выявлены факторы, влияющие на качество работы алгоритма в целом.
Тезисы
Учитывая современные условия жизни, каждый день человеку
приходится сталкиваться с огромным объёмом информации, обработать который вручную
просто не представляется возможным. К тому же, ручной труд для решения подобных
задач слишком энерго- и ресурсозатратен. Таковы, пожалуй, основные причины
высокой потребности в автоматизации методов обработки текстов на естественном
языке сегодня. Алгоритмы автоматического реферирования не являются исключением.
Автоматическое реферирование представляет собой процесс сокращения некоторого документа посредством применения определённого программного обеспечения для получения реферата с сохранением основных пунктов содержания оригинального документа. Алгоритмы автоматического реферирования имеют довольно широкий круг практического применения: они используются для автоматического создания аннотаций; индексирования в области информационного поиска; различных задач, предполагающих установление релевантности документа, и т. д.
В результате работы алгоритма автоматического реферирования может быть получен экстрактивный или абстрактивный реферат. Первый вид рефератов состоит исключительно из тех данных, которые уже содержатся в оригинальном тексте, т. е. составляется из извлечённых из него единиц. Абстрактивный реферат, в свою очередь, предполагает непосредственную генерацию нового текста, передающего основные пункты содержания оригинала.
В данном исследовании мы сосредоточили своё внимание на методах генерации абстрактивных рефератов, их внутренней организации и принципах работы. Таким образом, задачей нашего исследования является выявление достоинств и недостатков устройства и работы каждого принятого в рассмотрение метода. В качестве материалов исследования используются различные тексты, написанные художественным функциональным стилем. Процедура эксперимента заключается в непосредственном автоматическом создании абстрактивных рефератов с помощью каждого метода, оценке полученных результатов и их интерпретации с точки зрения устройства алгоритма, а также поиске возможных путей решения существующих проблем. В ходе исследования было выявлено, какие из рассмотренных алгоритмов порождают наиболее релевантные абстрактивные рефераты, и установлены причины различий в качестве работы алгоритмов.
Автоматическое реферирование представляет собой процесс сокращения некоторого документа посредством применения определённого программного обеспечения для получения реферата с сохранением основных пунктов содержания оригинального документа. Алгоритмы автоматического реферирования имеют довольно широкий круг практического применения: они используются для автоматического создания аннотаций; индексирования в области информационного поиска; различных задач, предполагающих установление релевантности документа, и т. д.
В результате работы алгоритма автоматического реферирования может быть получен экстрактивный или абстрактивный реферат. Первый вид рефератов состоит исключительно из тех данных, которые уже содержатся в оригинальном тексте, т. е. составляется из извлечённых из него единиц. Абстрактивный реферат, в свою очередь, предполагает непосредственную генерацию нового текста, передающего основные пункты содержания оригинала.
В данном исследовании мы сосредоточили своё внимание на методах генерации абстрактивных рефератов, их внутренней организации и принципах работы. Таким образом, задачей нашего исследования является выявление достоинств и недостатков устройства и работы каждого принятого в рассмотрение метода. В качестве материалов исследования используются различные тексты, написанные художественным функциональным стилем. Процедура эксперимента заключается в непосредственном автоматическом создании абстрактивных рефератов с помощью каждого метода, оценке полученных результатов и их интерпретации с точки зрения устройства алгоритма, а также поиске возможных путей решения существующих проблем. В ходе исследования было выявлено, какие из рассмотренных алгоритмов порождают наиболее релевантные абстрактивные рефераты, и установлены причины различий в качестве работы алгоритмов.