В статье затрагивается проблема составления учебных материалов по иностранному языку с помощью современного программного обеспечения, созданного с применением технологий искусственного интеллекта. В качестве основных методов выступают эксперимент и анализ. Материалом служит лингвистический корпус текстов статей издания (газетных статей) «Westdeutsche Allgemeine Zeitung» объемом более 1 млн токенов. Авторы описывают и апробируют семь видов поисковых запросов, результатом работы которых является генерация аутентичных контекстов для разработки учебных материалов.
Введение. Категория наименований одежды представляет собой обширный пласт лексических единиц, обозначающих предметы одежды, обувь, головные уборы и т. п., которая является существенным артефактом человеческой деятельности и играет важнейшую роль в истории общества и культуры. Это одна из основных предметных категорий человеческого бытия, чрезвычайно важная в культурологическом и социальном отношении. Цель исследования состоит в том, чтобы определить ядро значений лексем, обозначающих наименования одежды в современных американских СМИ. Достижение цели планируется путем решения следующих задач: сформировать список существительных – наименований одежды, релевантных для англоязычной (американской) лингвокультуры; провести извлечение контекстов, содержащих заданные наименования; проанализировать контекстные значения отобранных существительных в репрезентативном лингвистическом корпусе новостных текстов CNN.
Материалы и методы. Материалом исследования послужил лингвистический корпус новостных текстов CNN (37 864 предложения или 982 107 токенов), собранный во второй половине 2023 года с помощью авторского программного обеспечения «Генератор сбалансированного лингвистического корпуса и корпусный менеджер» (Свидетельство о государственной регистрации программы для ЭВМ № 2023683209, Роспатент). В качестве методов исследования привлекаются индуктивный анализ (для решения 1-й задачи), корпусный эксперимент (2-я задача) и контекстный анализ (3-я задача).
Анализ. Для трех наиболее часто встречающихся существительных – shoes, dress, clothes – представлен анализ их конкретных значений, распределенных по рубрикам, выделенным в ходе мысленной интерпретации контекстов.
Результаты. Определена частотность употребления 15 лексем – наименований одежды в лингвистическом корпусе новостных текстов CNN, обозначены доминанты значений указанных лексем, предоставлены авторские переводы изученных контекстов. Практическая ценность исследования заключается в том, что полученные данные, а также разработанная методика анализа могут быть использованы при изучении иных категорий предметных имен в английском и других языках.
В статье представлен обзор I и II научно-практических (заочных) конференций с международным участием «Человек - язык - компьютер», прошедших в Московском государственном лингвистическом университете в 2023 и 2024 годах и объединивших на своей площадке студентов, магистрантов, аспирантов и молодых ученых, интересующихся проблемами прикладной лингвистики. Результатом конференций стало обсуждение разработок Лаборатории фундаментальных и прикладных проблем виртуального образования, обмен опытом с молодыми исследователями из Минского государственного лингвистического университета и других вузов.
Цель исследования - изучить контексты употребления лексем, содержащих основу ‘Auto’ (автомобиль) на материале сбалансированного лингвистического корпуса новостных статей газеты Westdeutsche Allgemeine Zeitung (2024 год издания). Новизна работы заключается в том, что самые современные публикации указанной газеты впервые исследуются с применением оригинального отечественного программного комплекса «Генератор сбалансированного лингвистического корпуса и корпусный менеджер». В ходе исследования в автоматическом режиме был собран корпус новостных текстов; произведен поиск в корпусе по лемме и по части токена (началу, середине, концу) - тем самым был разработан метод поиска, который можно применять в сходных исследованиях; в полученных контекстах были выделены тематические доминанты (отказ от автомобиля / переход к электромобилям, экономия / чрезмерные траты при использовании автомобилей, преступления, аварии и несчастные случаи, неудачи экономического характера / убытки / неприятности), которые имеют отрицательную коннотацию. Положительно коннотированные контексты были зафиксированы лишь в единичных случаях. Таким образом, в рассмотренном издании фиксируется преимущественно отрицательная повестка в отношении личного автотранспорта. Исследование имеет перспективу в части создания баз данных оценочных маркеров с учетом жанровой специфики различных текстов.
Цель предлагаемого исследования - разработать и апробировать формальную модель оценки образа персонажа произведения художественной литературы на основе корпусного подхода. Научная новизна заключается в том, что впервые такого рода анализ героя произведения художественной литературы проводится на основе корпусного подхода. В итоге был построен сбалансированный корпус оригинального текста романа Дж. Оруэлла «1984», включающий разметку иерархических связей между токенами. Осуществлен ряд поисковых запросов к корпусу с помощью авторского программного обеспечения «Генератор сбалансированного лингвистического корпуса и корпусный менеджер», в результате которых был получен частотный список имен собственных романа и выведены списки токенов, характеризующих его главных действующих лиц. Полученные данные извлекаются в ходе работы встроенного в корпусный менеджер специального алгоритма, который выбирает из текста значимые для характеристики персонажа и связанные с ним лексические единицы. Тем самым строится модель оценки характерных черт персонажа как формальное описание системы связанных между собой иерархическими связями элементов текста. Результаты исследования были проанализированы и сопоставлены с результатами мысленной интерпретации. В итоге были составлены характеристики персонажей с точки зрения формального описания их действий и тех объектов, на которые были направлены их действия.