Лингвостатистический метод оценки лексического наполнения учебных текстов
Ирина Александровна Меньшенина
Докладчик
старший преподаватель
Витебский государственный медицинский университет
Витебский государственный медицинский университет
193
2016-03-16
15:10 -
15:30
Ключевые слова, аннотация
В докладе описывается разработанный нами
на основе количественных показателей подход к оценке лексического наполнения учебных
текстов. Приводится компьютерная
программа, созданная нами для автоматического вычисления ряда количественных
коэффициентов, позволяющих оценить, какое слово и в каком учебнике подано лучше
(чаще и более равномерно), какая тема какого учебника лучше соответствует
задачам обучения, какой учебник лучше соответствует вероятностно-статистической
структуре памяти обучаемого. Программа также позволяет выделить слова, которые
могут быть включены в лексический минимум по теме.
Тезисы
Текст обладает статистической
структурой, в которой отражены языковая система и норма, порождающие этот
текст. Благодаря этому, опираясь на статистическую структуру речи, возможно
отбирать для усвоения учащимися наиболее употребительные и важные с точки зрения
конкретных целей преподавания единицы. Каждый учебник характеризуется целым
рядом количественных и качественных показателей, причем последние вполне
возможно оценивать и сравнивать. [1] В своей работе мы хотим предложить подход к
оценке этих параметров и предложить разработанную нами компьютерную программу
для оценки лексического наполнения учебных текстов (на примере англоязычных
медицинских текстов).
Известно, что чем большее количество раз
слово встретилось в уроке и во всем учебнике и чем более равномерно это слово
распределено по всему учебнику, тем учебник лучше. Раскрывая это условие, нами
были использованы конкретные оценивающие коэффициенты, при помощи которых
вычислялась частота каждого слова в определенном уроке, частота слова во
всем учебнике, равномерность распределения слова в учебнике, употребительность
слова в учебнике, вариации для слова во всем учебнике и т. д. Ряд коэффициентов
позволил оценить учебник по степени совпадения его слов со словами заданного
лексического минимума. Для вычисления всех этих коэффициентов
необходимо иметь частотные словари по каждой теме учебника, которые нами были
получены при помощи программы Dict.
Описанная выше теория проверялась на
конкретных учебниках английского языка для студентов медицинских вузов. В каждом из учебников было выбрано по три
темы и также был задан лексический минимум по курсу английского языка для медицинских
вузов.
Созданная нами программа lang позволяет автоматически
вычислить и сравнить все описанные выше коэффициенты и таким образом оценить
лексическое наполнение тем сравниваемых учебников, то есть определить, какое слово и в каком учебнике
подано лучше (чаще и более равномерно), какая тема какого учебника лучше
соответствует задачам обучения, какой учебник лучше соответствует
вероятностно-статистической структуре памяти обучаемого, а также выделить слова, которые
могут быть включены в лексический минимум по теме. Программа также включает
файл syswords.cfg, который предназначен для исключения всех введенных в него слов
из общего алфавитно-частотного словаря. Это было сделано для того, чтобы
исключить из рекомендованных в лексический минимум служебные слова,
вспомогательные глаголы и другие части речи, которые являются наиболее
частотными в любом тексте.
Список литературы:
[1] Алексеев П. М. Некоторые вопросы теории и практики статистической лексикографии // Статистика текста. Т. I. Минск, 1969. С. 23.
Список литературы:
[1] Алексеев П. М. Некоторые вопросы теории и практики статистической лексикографии // Статистика текста. Т. I. Минск, 1969. С. 23.