LI Международная научная филологическая конференция имени Людмилы Алексеевны Вербицкой

«Сложность» и «трудность» в лингвистической терминологии и словарях

Ольга Владимировна Блинова
Докладчик
доцент
Санкт-Петербургский государственный университет

онлайн 184
2023-03-16
18:00 - 18:30

Ключевые слова, аннотация

Языковая сложность, языковая трудность, понятийный аппарат лингвистики, русские словари трудностей

«Сложность» внедрена в лингвистическую терминологию (ср. 'сложное предложение', 'сложный согласный'), а «трудность» является принятой характеристикой слов в некоторых ортологических словарях. Автор доклада, во-первых, каталогизирует вхождения типа 'complex verb' в англоязычных и русскоязычных словарях и энциклопедиях, во-вторых, рассматривает типологию и содержание русских словарей трудностей. Цель доклада — в самом общем виде выяснить, можно ли обсуждаемые данные о сложности и трудности использовать в автоматических моделях оценки сложности текстов. 

Тезисы

1. Настоящий доклад подготовлен при поддержке проекта РНФ №19-18-00525, в рамках которого создана автоматическая модель оценки сложности русских правовых текстов. В модели используются различные метрики сложности и методы машинного обучения, см. [Blinova, Tarasov: 2022].
Вслед за [Dahl: 2004] можно различать «сложность» (complexity) как некоторую объективную меру и «трудность» (difficulty) — меру субъективную. При сравнении единиц языка (слов, предложений и др.), текстов на языке, стилей и регистров как вариантов языка, а также языков в целом «сложность» может пониматься как переменная, оказывающая влияние на восприятие языковых объектов читающим, слушающим, изучающим язык и пр. (т. е. на трудность). Таким образом, «трудность» — характеристика перцептивная.
2. В докладе в первом приближении обсуждается бесхитростная идея, согласно которой (коль скоро «сложность» внедрена в лингвистический понятийный аппарат, а «трудность» является принятой характеристикой при представлении единиц языка, прежде всего — слов, в некоторых словарях) эти «готовые» данные о сложности и трудности можно использовать в моделях оценки сложности текстов на языке. Таким образом, автора интересует вопрос, можно ли взять, скажем, по крайней мере некоторые русские словари трудностей и использовать их данные при оценке лексической и грамматической сложности текстов (введя в модель соответствующие метрики). Для того, чтобы оценить разумность такого шага, нужно сколько-нибудь точно понимать, какие категории языковых единиц и на каких основаниях характеризуются как «сложные» и «трудные».
3. Доклад структурирован так. В первой части обсуждается содержание лингвистических энциклопедий и словарей лингвистических терминов авторства и под редакцией Bussmann; Collinge; Crystal; Danesi; Dearborn; Ducrot & Todorov; Hartmann & James; Hogan; Loewen & Plonsky; Luraghi & Parodi; Malmkjær; Matthews; Mesthrie; Simpson; Trask; Wilson & Keil; Ахмановой; Панова; Ярцевой. При этом рассматриваются и каталогизируются вхождения типа “complex sentence”, “complex word”, “complex verb”, “complex proposition”, “complex wave”, “complex consonant cluster”, “complex vowel system”, “сложное дополнение”, “сложный согласный” и т. д. (вне зависимости от того, находятся они в заголовке словарной статьи или в её теле). Основанием для каталогизации является прежде всего область лингвистики, где используется обсуждаемое понятие (напр., фонетика или синтаксис).
Во второй части рассматриваются русские словари, в названии которых содержится эксплицитное указание на трудность содержащихся в них единиц. В отечественной лексикографической традиции такие словари относятся к ортологическим. Кратко рассматривается история вопроса (начиная со «Словаря неправильных, трудных и сомнительных слов, синонимов и выражений в русской речи» И.И. Огиенко, 1914).
Вводится классификация словарей трудностей по целевой аудитории (различаются словари для так называемых стандартных носителей и для носителей с неполной компетенцией в русском, в частности, изучающих русский как второй, детей). Среди стандартных носителей выделяются группы по профессиям и занятиям; среди них — группа, которая занимается правкой чужих текстов (редакторы), группа, которая занимается обучением языку, а также группы, которые порождают устные и письменные тексты для широкой аудитории (журналисты, политики).
Основная часть доклада — анализ содержимого словарей трудностей с акцентом на «трудность» единиц текстов письменного модуса. Рассмотрены словари авторства и под редакцией Бельчикова и Панюшевой; Вербицкой; Гирич; Глинкиной; Головиной; Гольберг и Иванова; Горбачевича; Горбачевича и Качевской и др.; Добромыслова и Розенталя; Ефремовой и Костомарова; Каленчук и Касаткиной; Рахмановой; Розенталя и Теленковой; Семенюк, Городецкой и др.; Суровой; Юрьевой. Сделан вывод, согласно которому авторы словарей трудностей учитывают прежде всего: единицы с вариативностью (в том числе относительно кодифицированной нормы); отличающиеся по значению единицы со сходствами плана выражения; редкие (низкочастотные), архаичные единицы, заимствования, термины.
4. В заключении приводятся предложения по доработке модели сложности с учётом полученной информации.

Литература:
1. Blinova O., Tarasov N. A hybrid model of complexity estimation: Evidence from Russian legal texts // Frontiers in Artificial Intelligence. 2022. Vol. 5.
2. Dahl Ö. The Growth and Maintenance of Linguistic Complexity. Amsterdam; Philadelphia: John Benjamins Publishing Company, 2004. 333 pp.