XVII Международная конференция студентов-филологов

Сравнительный анализ методик обработки устных текстов о себе

Дарья Сергеевна Павлова
Докладчик
аспирант
Пермский государственный национальный исследовательский университет

198
2014-04-08
13:45 - 14:10

Ключевые слова, аннотация

В докладе рассматриваются методики изучения семантической структуры устных спонтанных текстов. Построение графов семантических связей полей в тексте производилось в ИС "Семограф". Важно было выбрать адекватный метод семантического анализа текста. Для этого один и тот же текст был обработан разными методиками (в докладе представлены полученные семантические графы). Сравнительный анализ методик позволяет говорить о значительных изменениях в семантических структурах текстов. 

Тезисы

Задача исследования – изучение семантической структуры устного спонтанного монолога. Согласно методике, реализованной в ИС «Семограф» (Белоусов К.И.), текст делится на синтагмы, слова каждой синтагмы получают семантическое описание через отнесение к семантическому полю. Например, в синтагме пять часов слово пять относится к полю КОЛИЧЕСТВО, а часов – к полю ВРЕМЯ. Программа автоматически считает связанными слова одной синтагмы. Получаемый в результате анализа граф изображает семантические связи полей в тексте. Однако такой тип анализа учитывает только вхождения слов в синтагму, но не синтаксические связи между ними. Поэтому стандартная методика была нами изменена. Согласно новой методике обработки материала слова относятся к контекстуально-семантическим полям с учетом не только семантики, но и их синтаксических связей. Например, в словосочетании пять часов существительное часов относится к полю ВРЕМЯ, а пять – одновременно к полям и КОЛИЧЕСТВО, и ВРЕМЯ, поскольку числительное обозначает именно количество времени. Обработка происходит в той же ИС «Семограф», в результате обработки также получаем граф семантических связей. На первом этапе важно было выбрать адекватный метод семантического анализа текста. Для этого один и тот же текст был обработан разными методиками (в докладе представлены полученные семантические графы). Сравнительный анализ методик позволяет говорить о значительных изменениях в связях между полями. Например, при учете синтаксических отношений некоторые поля оказались не связанными с другими полями. Также изменилась и сила связей между полями. Анализ графов показал, что применение той или иной методики должно быть обусловлено целью исследования. При исследовании семантического пространства текста в статике следует пользоваться оригинальной методикой разработчиков «Семографа», а при изучении семантического развертывания текста предложенная нами методика будет более адекватна.