Лингвостатистический анализ глаголов мышления на корпусе публицистических текстов о правах женщин в Афганистане
Екатерина Михайловна Белавина
Докладчик
доцент
Московский государственный университет им. М. В. Ломоносова
Московский государственный университет им. М. В. Ломоносова
Полина Сергеевна Уварова
Докладчик
аспирант
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
193
2022-03-16
16:00 -
16:20
Ключевые слова, аннотация
Корпусная статистика; глаголы мышления; теория семантического поля; textométrie
(TXM); лингвостатистический анализ
Тезисы
В настоящий момент в мире выходит большое количество статей, посвященных
положению женщин в Афганистане и несоблюдении их прав и свобод. Эта тема широко
освещается средствами массовой информации по всему миру, что позволяет обработать
значительное количество текстовых данных и провести их анализ. Для исследования
были отобраны тексты на английском и русском языках, в результате их обработки
был составлен репрезентативный двуязычный корпус. Было принято решение не
делать корпус параллельным для полноценного анализа особенностей использования
глаголов мышления в каждом из языков, так как перевод не всегда отражает
актуальную языковую ситуацию.
Тексты данной тематики были выбраны не только в связи с актуальностью темы, а еще и из-за большого количества глаголов мышления, используемых при выражении мнения автора. Это позволяет оценить разнообразие глаголов мыслительной сферы в публицистических текстах. Отдельно хотелось бы выделить, что глаголы мыслительной деятельности в настоящей работе чаще всего имеют значение предиката мнения, а не знания, что и обуславливает важность эмоциональной окраски в выбранных текстах, так как это напрямую влияет на количество оценочных комментариев автора.
Выбор списка глаголов для анализа не является очевидным. Глаголы были отобраны и классифицированы, в результате чего был составлен список тех, которые можно отнести к мыслительной сфере. Для осуществления этой задачи был проведен анализ семантического своеобразия языков (английского и русского) в рамках публицистических текстов и дальнейшая классификация глаголов согласно теории семантического поля, учитывая самые современные работы на эту тему.
Для составления доклада был подготовлен двуязычный корпус текстов с использованием средств SketchEngine, дальнейшая работа осуществлялась средствами платформы Textométrie (TXM), имплементирующей основные методы текстометрии. В докладе приводится краткий разбор функционала данных инструментов и обосновывается их выбор в рамках работы с текстами данной тематики.
Во время работы над докладом были проанализированы и обоснованы критерии выбора источников для составления двуязычного корпуса текстов, проведен обзор средств для составления корпуса и проведения морфосинтаксической разметки готового корпуса, обоснован выбора (SketchEngine, Universal Dependencies). Дальнейший анализ данных показал, что получившийся список лексем в английском языке значительно меньше чем в русском.
Тексты данной тематики были выбраны не только в связи с актуальностью темы, а еще и из-за большого количества глаголов мышления, используемых при выражении мнения автора. Это позволяет оценить разнообразие глаголов мыслительной сферы в публицистических текстах. Отдельно хотелось бы выделить, что глаголы мыслительной деятельности в настоящей работе чаще всего имеют значение предиката мнения, а не знания, что и обуславливает важность эмоциональной окраски в выбранных текстах, так как это напрямую влияет на количество оценочных комментариев автора.
Выбор списка глаголов для анализа не является очевидным. Глаголы были отобраны и классифицированы, в результате чего был составлен список тех, которые можно отнести к мыслительной сфере. Для осуществления этой задачи был проведен анализ семантического своеобразия языков (английского и русского) в рамках публицистических текстов и дальнейшая классификация глаголов согласно теории семантического поля, учитывая самые современные работы на эту тему.
Для составления доклада был подготовлен двуязычный корпус текстов с использованием средств SketchEngine, дальнейшая работа осуществлялась средствами платформы Textométrie (TXM), имплементирующей основные методы текстометрии. В докладе приводится краткий разбор функционала данных инструментов и обосновывается их выбор в рамках работы с текстами данной тематики.
Во время работы над докладом были проанализированы и обоснованы критерии выбора источников для составления двуязычного корпуса текстов, проведен обзор средств для составления корпуса и проведения морфосинтаксической разметки готового корпуса, обоснован выбора (SketchEngine, Universal Dependencies). Дальнейший анализ данных показал, что получившийся список лексем в английском языке значительно меньше чем в русском.