XXVII Открытая конференция студентов-филологов в СПбГУ

Способы оценки лексической сложности: учебные материалы на L2

Жу Бай
Докладчик
аспирант
Санкт-Петербургский государственный университет

198
2024-04-24
14:20 - 14:40

Ключевые слова, аннотация

В докладе анализируются способы оценки лексической сложности учебных материалов на языке, изучаемом как иностранный (втором языке, L2). При оценке текста в целом предлагается учитывать читабельность и лексическое разнообразие, у его отдельных компонентов (слов) предлагается учитывать: длину в буквах и слогах, их частотность, вхождение в лексические минимумы, словообразовательные характеристики (производность/непроизводность), их семантику (абстрактность/конкретность), терминологический статус и др. В докладе подчёркивается важность оценки лексической сложности учебных материалов на L2.

Тезисы

Ключевые слова: лексическая сложность; сложность текста; изучение языка как второго

Сложность текста влияет на восприятие и понимание текста читающим (то есть на трудность текста). Подходящие по уровню владения языком материалы для чтения способствуют развитию языковых навыков, тогда как слишком простые тексты могут вызвать скуку, а чересчур сложные — снизить мотивацию [Лапошина, Лебедева, 2021]. Таким образом, оценка лексической сложности учебных материалов на L2 — актуальная задача. 
Расчёт читабельности (трудности для чтения) текста осуществляется на основе формул читабельности, в частности формулы Флеша-Кинкейда. Показатели читабельности тесно связаны с длиной слова и предложения. Существуют формулы, адаптированные для русского языка [Solnyshkina, Ivanov, Solovyev, 2018]. Расчет лексического разнообразия выполняется с помощью ряда показателей, самый простой из которых — Type-Token Ratio, TTR. Это отношение уникальных слов текста (types) ко всем словам текста (tokens). Если текст содержит широкий набор уникальных (неповторяющихся) слов, то он может быть более сложным для понимания и запоминания. В настоящее время существует ряд исследований, которые гласят, что при оценке сложности текста можно опираться на следующие лексические параметры.
Наличие слова в базовом списке (лексическом минимуме). Если слово относится к основной лексике, которую студенты должны знать на определённом уровне владения, то это слово не будет относиться к трудным.
Частотность слов (на основе текстовых корпусов). Часто употребляемые слова считаются более простыми, чем редкие.
Длина слова. Длина слова тоже может служить индикатором его сложности. Более короткие слова обычно считаются менее сложными для изучающих язык.
Семантическая сложность слова. Слова с множеством значений, с абстрактными или переносными значениями могут считаться более сложными для понимания.
Кроме того, существует анализ лексической сложности слов на основе их морфологической структуры, то есть с учётом количества морфем, наличия словообразовательных аффиксов, см., например: [Дружкин, 2016]. При анализе сложности стоит учитывать также генетические и типологические характеристики L1 в сравнении с L2. Изучение родственных или близкородственных языков требует меньше затрат.
Оценка лексической сложности полезна при выборе учебных материалов для изучения L2, может обеспечить эффективное изучение новой лексики и способствовать созданию учебных материалов, которые соответствуют языковой компетенции и потребностям учащихся. 

Литература: 
Дружкин К. Ю. Метрики удобочитаемости для русского языка: выпускная квалификационная работа магистра. М., 2016. 
Лапошина А. Н., Лебедева М. Ю. Текстометр: онлайн-инструмент определения уровня сложности текста по русскому языку как иностранному // Русистика. М., 2021. №3. С. 331—345. 
Solnyshkina M., Ivanov V., Solovyev V. Readability Formula for Russian Texts: A Modified Version // Proceedings of the 17th Mexican International Conference on Artificial Intelligence, MICAI 2018. Рart II. Guadalajara, Mexico, 2018. P. 132—145.