Сравнительный анализ методик обработки устных текстов о себе
Дарья Сергеевна Павлова
Докладчик
аспирант
Пермский государственный национальный исследовательский университет
Пермский государственный национальный исследовательский университет
198
2014-04-08
13:45 -
14:10
Ключевые слова, аннотация
В докладе рассматриваются методики изучения семантической структуры устных спонтанных текстов. Построение графов семантических связей полей в тексте производилось в ИС "Семограф". Важно
было выбрать адекватный метод семантического анализа текста. Для этого один и
тот же текст был обработан разными методиками (в докладе представлены
полученные семантические графы). Сравнительный
анализ методик позволяет говорить о значительных изменениях в семантических структурах текстов.
Тезисы
Задача исследования – изучение
семантической структуры устного спонтанного монолога.
Согласно методике, реализованной в ИС
«Семограф» (Белоусов К.И.), текст делится на синтагмы, слова каждой синтагмы получают
семантическое описание через отнесение к семантическому полю. Например, в
синтагме пять часов слово пять относится к полю КОЛИЧЕСТВО, а часов – к полю ВРЕМЯ. Программа
автоматически считает связанными слова одной синтагмы. Получаемый в результате
анализа граф изображает семантические связи полей в тексте.
Однако такой тип анализа учитывает
только вхождения слов в синтагму, но не синтаксические связи между ними.
Поэтому стандартная методика была нами изменена. Согласно новой методике обработки
материала слова относятся к контекстуально-семантическим полям с учетом не
только семантики, но и их синтаксических связей. Например, в словосочетании пять часов существительное часов относится к полю ВРЕМЯ, а пять – одновременно к полям и КОЛИЧЕСТВО,
и ВРЕМЯ, поскольку числительное обозначает именно количество времени. Обработка
происходит в той же ИС «Семограф», в результате обработки также получаем граф
семантических связей.
На первом этапе важно было выбрать
адекватный метод семантического анализа текста. Для этого один и тот же текст был
обработан разными методиками (в докладе представлены полученные
семантические графы).
Сравнительный анализ методик позволяет
говорить о значительных изменениях в связях между полями. Например, при учете
синтаксических отношений некоторые поля оказались не связанными с другими
полями. Также изменилась и сила связей между полями.
Анализ графов показал, что применение той или иной
методики должно быть обусловлено целью исследования. При исследовании семантического
пространства текста в статике следует пользоваться оригинальной методикой
разработчиков «Семографа», а при изучении семантического развертывания текста
предложенная нами методика будет более адекватна.