Научный архив: статьи

ОБНАРУЖЕНИЕ НЕИСПРАВНОСТЕЙ В ПРОМЫШЛЕННЫХ ИЗДЕЛИЯХ С ИСПОЛЬЗОВАНИЕМ МАЛЫХ ОБУЧАЮЩИХ НАБОРОВ ДАННЫХ (2024)

В настоящее время все более актуальной становится задача обеспечения безопасности и корректности функционирования различных интеллектуальных автоматизированных систем, построенных на основе технологии интернета вещей, которые включают в себя различные двигатели, редукторы, приводные механизмы. Такие системы широко применяются в промышленности, электроэнергетике, на транспорте и в других критически важных сферах современной промышленности. Непрерывная и достоверная диагностика функционирования подобных устройств обуславливает необходимость совершенствования, как аппаратной части сенсоров, используемых для считывания в реальном времени характеристик функционирования деталей системы, так и программных методов эффективной обработки данных, поступающих от сенсоров для своевременного выявления неисправностей в системе. В статье решается задача разработки подхода к автоматизированному обнаружению дефектов материалов на примере роторных механизмов с использованием машинного обучения и визуального анализа данных. Экспериментальная оценка подхода выполняется с помощью небольшого набора данных, собранных от подшипниковых устройств и описывающих, как нормальный режим функционирования, так и три режима с дефектами в подшипниках. Решение этой задачи позволит более быстро, своевременно и с меньшим участием человека выявлять дефекты устройств и материалов в процессе работы системы. Новизной предложенного подхода является сочетание машинного обучения и визуального анализа данных в условиях использования обучающих выборок малого размера. Кроме того, решается задача отбора признаков дефектов - первичных данных, которые необходимо считывать с сенсоров устройств и которые позволяют достоверно выявлять дефекты в системе. Это будет способствовать уменьшению затрат на внедрение встраиваемых сенсоров и средств их автоматической диагностики, на их обслуживание за счет снижения числа используемых сенсоров.

Издание: ВЕСТНИК ВОРОНЕЖСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА. СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Выпуск: № 1 (2024)
Автор(ы): Десницкий Василий Алексеевич, Новикова Евгения Сергеевна
Сохранить в закладках
ПРИМЕНЕНИЕ ИМПУЛЬСНЫХ НЕЙРОННЫХ СЕТЕЙ В РЕШЕНИИ ЗАДАЧИ ФАКТОРИЗАЦИИ ВИНЕРА - ХОПФА (2024)

Работа посвящена изучению возможностей применения искусственных импульсных (или спайковых) нейронных сетей для решения задачи приближенной факторизации Винера - Хопфа для процессов Леви в рамках интеллектуальной системы машинного обучения. Одним из приложений факторизации Винера - Хопфа является вычисление цен барьерных опционов, в связи с чем рассматриваемая задача имеет важный прикладной аспект для вычислительной финансовой математики в части создания гибридных численных методов, комбинирующих современные технологии нейросетей третьего поколения и классические методы вычислительной математики. В рамках статьи предложена импульсная нейронная сеть с моделью «интегрировать-и-сработать» с утечками для факторизации тригонометрического полинома в комплексной форме, коэффициенты которого представляют собой распределение вероятностей. Искомые многочлены-факторы имеют аналогичную вероятностную интерпретацию, при этом у первого фактора первая половина коэффициентов равна нулю, а у второго - вторая половина. Вероятностная интерпретация задачи позволяет обойтись без кодирования и декодирования входных и выходных данных в спайки и обратно. Обучение сети проводится для одного набора коэффициентов полинома с целью минимизировать ошибку приближения этого полинома произведением факторов, коэффициенты которых предсказываются сетью, для чего программно реализована собственная функция потерь. В отличие от традиционного подхода к подбору параметров модели на обучающей выборке, в данной работе предлагается минимизировать ошибку приближения конкретной характеристической функции процесса Леви произведением многочленов-факторов. При этом модель не использует фактические значения коэффициентов факторов при обучении, а только значения многочленов, вычисленные с помощью быстрого преобразования Фурье. В рамках вычислительных экспериментов представлен пример факторизации полинома 255-й степени, связанного с гауссовым процессом Леви, с помощью спайковой нейросети. Программная реализация предлагаемого в статье подхода к решению задачи факторизации написана на языке программирования Python с использованием фреймворка машинного обучения pyTorch и библиотеки snnTorch импульсных нейронных сетей.

Издание: ВЕСТНИК ВОРОНЕЖСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА. СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Выпуск: № 4 (2024)
Автор(ы): Алымова Елена Владимировна, Кудрявцев Олег Евгеньевич
Сохранить в закладках
Защита частной жизни в виртуальной реальности: ответственность за использование дипфейк-контента в метавселенной (2025)

Метавселенная, представляющая собой иммерсивную и постоянную виртуальную среду, в сочетании с неправомерным использованием технологий искусственного интеллекта для создания гиперреалистичных синтетических медиаматериалов (фото, видео, аудио), образует новую категорию угроз для общественных отношений в сфере обеспечения неприкосновенности частной жизни.

Действующие нормативно-правовые механизмы, предназначенные в основном для регулирования взаимодействия в физической реальности и более ранних итерациях цифровой среды, недостаточно адаптированы для эффективного противодействия вызовам, возникающим в связи с созданием, использованием и распространением так называемых дипфейков (deepfakes). Именно применение этих технологий для формирования виртуальных аватаров (образов) людей в метавселенной представляет собой особенно сложную задачу. Представлен возможный механизм установления юридической ответственности, основанный на формальном признании комплекса «виртуальные права личности». Этот комплекс включает в себя право на аутентичность и контроль над собственным аватаром, право на подтверждение авторства и защиту от незаконного присвоения виртуальной личности, а также право на обеспечение целостности виртуальной среды субъекта. Предлагаемый подход также предусматривает необходимость разграничения юридической ответственности между субъектами, непосредственно создающими синтетические медиаматериалы с использованием машинного обучения, теми, кто осуществляет их последующее использование и распространение, и провайдерами платформ метавселенной, обеспечивающими инфраструктуру для такого взаимодействия.

Издание: ВЕСТНИК УНИВЕРСИТЕТА ИМЕНИ О.Е. КУТАФИНА (МГЮА)
Выпуск: № 5 (129) (2025)
Автор(ы): Кузнецова Ольга Алексеевна, Маджумаев Мурад Мамедович
Сохранить в закладках
Современные методы предотвращения DDoS-атак и защиты веб-серверов (2025)

Объектом исследования являются веб-серверы и их поведение в условиях высокоинтенсивных распределённых атак типа «отказ в обслуживании» (DDoS), нарушающих доступность сервисов и устойчивость инфраструктур. В качестве предмета исследования рассматриваются современные методы защиты серверных приложений от DDoS-угроз, включая анализ трафика, фильтрацию по частоте запросов, межсетевые экраны (файрволы) и облачные решения. Подробно анализируется эффективность различных технологий защиты, таких как Rate Limiting, ModSecurity, Google Cloud Armor и Cloudflare, а также их интеграция с традиционными средствами - межсетевыми экранами, системами предотвращения вторжений (IPS) и прокси-серверами. В рамках исследования разработан тестовый сервер на языке Go, имитирующий поведение реального веб-приложения с логированием и сбором статистики. Для моделирования DDoS-атак использован инструмент MHDDoS, обеспечивающий широкое покрытие типов угроз: от UDP и SYN Flood до HTTP Flood и Slowloris. Методы исследования включают эмуляцию атак на сетевом и прикладном уровнях трафика, нагрузочное тестирование, сбор метрик (процент заблокированных запросов, среднее время отклика, нагрузка на CPU и RAM) и сравнительный анализ эффективности решений. Научная новизна исследования заключается в разработке и применении экспериментальной модели имитации DDoS-атак с использованием специализированного Go-сервера, что позволило в реалистичных условиях оценить эффективность современных локальных и облачных средств защиты. Анализ реальных кейсов демонстрирует эффективность адаптивных стратегий против современных сложносоставных атак. Выводы подчёркивают необходимость активного подхода к безопасности, учитывающего как технологические, так и организационные меры защиты. Полученные результаты имеют практическую ценность для специалистов по кибербезопасности, системных администраторов и разработчиков защитных решений, предоставляя им методическую основу для создания устойчивых к DDoS веб-инфраструктур. Работа также обозначает перспективные направления для дальнейших исследований в области интеллектуальных систем обнаружения и нейтрализации атак.

Издание: ПРОГРАММНЫЕ СИСТЕМЫ И ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ
Выпуск: № 2 (2025)
Автор(ы): Козырева Надежда Ивановна, Мухтулов Михаил Олегович, Ершов Сергей Александрович, Новосельцева София Владимировна, Ахмадуллин Динар Айратович
Сохранить в закладках
Разработка проекта PLAY VISION AI для просмотра спортивных матчей с помощью искусственного интеллекта (2025)

С развитием цифровых технологий, искусственного интеллекта и больших данных, спортивная индустрия сталкивается с растущей потребностью в продвинутых аналитических инструментах. В футболе, где стратегическое и тактическое планирование играют ключевую роль, применение технологий компьютерного зрения и машинного обучения для анализа игр становится не просто трендом, а необходимостью для поддержания конкурентоспособности. Использование компьютерного зрения и машинного обучения в спортивной аналитике позволяет автоматически извлекать значимые данные из видео матчей, что значительно повышает скорость и точность анализа по сравнению с традиционными методами. Такие технологии могут предоставить тренерам детальные отчеты о движениях, позиционировании и тактике игроков в реальном времени. Целью является создание системы, которая позволит проводить комплексный анализ футбольных матчей с использованием последних достижений в области искусственного интеллекта и компьютерного зрения. Основной метод - обзор и анализ публикаций по теме исследования; анализ современных технологий, позволяющих автоматически обрабатывать видеоданные. Основная методология - концепция разработки проекта PLAY VISION AI как способ просмотра спортивных матчей с помощью искусственного интеллекта для оценки эффективности игровых стратегий. Актуальность данной работы обусловлена максимальной модификацией современных технических средств для улучшения аналитических возможностей в спорте. Авторами разработаны алгоритмы для калибровки и коррекции искажений видео, полученного с футбольных матчей; разработаны методы детекции и трекинга опорных точек и игроков на видео; реализованы алгоритмы для сопоставления изображений с реальными координатами на поле, а также определения позиций игроков; выполнена интеграция разработанных методов в единую систему с интерфейсом для конечных пользователей. Разработанная система PLAY VISION AI обеспечит тренерам и аналитикам инструменты для оценки эффективности игровых стратегий и подготовки к предстоящим матчам. Также будет способствовать дальнейшему развитию технологий анализа в спорте, открывая новые перспективы для исследований и практического применения.

Издание: ПРОГРАММНЫЕ СИСТЕМЫ И ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ
Выпуск: № 2 (2025)
Автор(ы): Ковалев Сергей Васильевич, Смирнова Татьяна Николаевна, Зверев Роман Евгеньевич, Раков Иван Витальевич
Сохранить в закладках
Влияние искусственного интеллекта на повышение эффективности управления в нефтегазовой отрасли (2025)

В данной статье исследовано влияние искусственного интеллекта на повышение эффективности управления в нефтегазовой отрасли. Авторы, анализируя влияние искусственного интеллекта (ИИ) на повышение эффективности в нефтегазовой отрасли, включая оптимизацию разведки, добычи, логистики и экологической безопасности; размер рынка; долгосрочные тенденции в областях применения и т. д., выделяют ключевые технологические решения. К ним относятся автоматизация анализа данных, прогнозирование рисков и интеграция IoT-платформ. На основе проведенного исследования предлагается расширить использование искусственного интеллекта для повышения эффективности нефтегазовой отрасли посредством внедрения гибридных алгоритмов машинного обучения, усиления межотраслевого сотрудничества и разработки стандартов цифровой безопасности. Особое внимание уделяется роли ИИ в снижении углеродного следа и адаптации к глобальным климатическим инициативам. Использованы методы машинного обучения, анализ больших данных и кейс-стади ведущих компаний (Schlumberger, ExxonMobil, СИБУР). Применены статистические модели для оценки снижения затрат на добычу (до 40%) и повышения точности геофизической разведки. Данные получены из отраслевых отчетов, патентных баз и программных решений. ИИ используется для оцифровки производственных записей и автоматического анализа геологических данных, на основе глубинных нейросетей, что позволяет выявлять проблемы и оптимизировать ключевые процессы разведки нефти. Интеллектуальный анализ рыночного спроса через сбор данных и визуализацию повышает эффективность цепочек поставок. Современные коммерческие решения стимулируют цифровую трансформацию отрасли и инновации. Результаты исследования применимы для оптимизации разведки, добычи и логистики. В отличие от существующих работ, акцент сделан на специфику развивающихся рынков. Несмотря на текущие проблемы (затраты, качество данных), внедрение ИИ позволит: Усилить сбор данных каротажа; Внедрить интеллектуальную геофизическую разведку; Автоматизировать диагностику неисправностей. Ключевое направление - создание инновационного исследовательского центра для ускорения цифровой трансформации и внедрения инноваций.

Издание: ФИНАНСЫ И УПРАВЛЕНИЕ
Выпуск: № 2 (2025)
Автор(ы): Фастович Владимир Владимирович
Сохранить в закладках
Анализ взаимной динамики котировок акций и тональности текстовых упоминаний в СМИ компании «OZON Holdings PLC» с применением корреляционного и сентимент-анализа (2025)

Предметом исследования является количественная оценка взаимосвязи между тональностью упоминаний компании «Ozon Holdings PLC» в русскоязычных средствах массовой информации (СМИ) и динамикой котировок ее акций на Московской бирже. В современной цифровой экономике понимание этого нефинансового фактора имеет критическое значение, особенно для технологических компаний, таких как Ozon, чьи акции характеризуются высокой волатильностью и чувствительностью к информационному фону, а также репутационным рискам. Актуальность работы обусловлена необходимостью для компании Ozon разрабатывать эффективные стратегии управления своим медиа-образом. Это является значимой проблемой в условиях высокой конкуренции и информационного давления, поскольку негативное восприятие способно подорвать доверие инвесторов и негативно сказаться на рыночной капитализации. Целью исследования является установление наличия, направления и силы статистически значимой связи между квартальным агрегированным показателем медиа-тональности и изменением цены акций Ozon. Основная гипотеза предполагает прямую положительную корреляцию: улучшение тональности упоминаний в СМИ ассоциируется с ростом котировок, а преобладание негативной информации - с их снижением. Методология включала сбор квартальных данных о котировках акций Ozon и текстовых упоминаний (Google Новости, 2021-2024). Для сентимент-анализа применялась нейросетевая модель DeepPavlov. Взаимосвязь медиа-тональности и динамики цен акций оценивалась корреляционным анализом Пирсона (α=0.05). Научная новизна заключается в количественной оценке влияния агрегированной поквартальной тональности русскоязычных новостных сообщений на динамику котировок акций крупной российской e-commerce компании, дополняя знания о специфике российского информационного поля. Основные результаты подтвердили гипотезу: выявлена сильная положительная статистически значимая корреляция (r = 0.72, R² = 0.52, p “ 0.001) между медиа-тональностью и ценами акций Ozon. Это указывает, что около 52% вариаций в изменении цен акций могут быть объяснены тональностью СМИ. Исследование имеет ограничения (не учтены соцсети, корпоративные новости, макрофакторы). Практически результаты могут использоваться инвесторами для оценки рисков, а Ozon - для разработки PR-стратегий, оперативного реагирования на негатив и формирования позитивного имиджа для укрепления рыночных позиций и повышения инвестиционной привлекательности.

Издание: ФИНАНСЫ И УПРАВЛЕНИЕ
Выпуск: № 2 (2025)
Автор(ы): Шиболденков Владимир Александрович, Тюрнев Александр Николаевич, Афанасьев Кирилл Миронович, Пресняков Артем Олегович
Сохранить в закладках
МЕТОД ИСПОЛЬЗОВАНИЯ ЦИФРОВЫХ ТЕХНОЛОГИЙ В РАЗРАБОТКЕ СИСТЕМ УПРАВЛЕНИЯ ТЕПЛИЦЕЙ НА ПРЕДПРИЯТИИ АПК (2024)

Проблема и цель. Целью является получение данных в результате моделирования с привлечением нейросети и обоснование возможности использования аппарата искусственных нейронных сетей в тепличном комплексе.

Методология. Агропромышленный комплекс (АПК), как отрасль в целом, невозможен без наличия в нем методов и способов производства, требующих заметного количества внедрённых средств автоматизации производства и управления. Управление практически любой системой невозможно без обработки больших объёмов статистических данных. Использование системы управления тепличным комплексом в сфере АПК имеет те же задачи. В статье приведено описание подхода к проектированию специального модуля системы цифрового управления теплицей с возможностью получения прогнозируемых данных об оценке технических элементов объекта. Объект исследования: тепличный объект общего назначения и цифровые данные, получаемые через коммуникационную сеть от цифровых технических элементов. Кратко описана используемая коммуникационная сеть. Предполагается использование технических элементов, имеющих функции накопления и/или передачи измеряемых данных.

Результаты. На первом этапе была исследована сама возможность применения обученных нейросетей для работы с данными элементов от объектов АПК. На втором исследовалась возможность использования аппарата искусственной нейросети на ограниченном наборе данных для получения прогнозных результатов. В описываемом подходе предполагается использование численных методов для моделирования и метод прогноза с помощью аппарат искусственных нейронных сетей для прогноза состояния технических элементов.

Заключение. Модуль, с использованием нейросети, может быть применен в составе управляющего ПО для мониторинга технических элементов и объектов АПК. Используемый способ применения нейросети с простой архитектурой, с упором на результаты моделирования, позволил исследовать применение такого подхода в системе управления теплицей на основе статистики с объекта.

Издание: ВЕСТНИК РЯЗАНСКОГО ГОСУДАРСТВЕННОГО АГРОТЕХНОЛОГИЧЕСКОГО УНИВЕРСИТЕТА ИМ. П. А. КОСТЫЧЕВА
Выпуск: № 2 (2024)
Автор(ы): Грачев Александр Викторович, Неверов Евгений Николаевич, Горелкина Алёна Константиновна
Сохранить в закладках
Спортивные права на игроков в обеспечительных сделках: правовые аспекты и экономические перспективы (2025)

Статья исследует вопросы эффективного управления спортивными правами на игроков как экономическими активами спортивного клуба. Основной задачей является установление правовой возможности и экономической привлекательности применения указанных прав не только в контексте стандартных трансферных сделок, но и также в качестве объекта сделок обеспечительных, что могло бы способствовать привлечению дополнительных финансовых ресурсов и улучшению общего экономического состояния клубов. Отмечается, что несмотря на отсутствие законодательных ограничений - открытого перечня способов обеспечения исполнения обязательств и принципа свободы договора, наличествуют некоторые сложности, обусловленные высокой волатильностью и недостаточной ликвидностью данного вида активов. Однако уникальность обладания таким активом как спортивные права, способного генерировать несколько косвенных денежных потоков для спортивных клубов помимо трансферной выплаты, может существенно нивелировать данный недостаток. В исследовании рассматриваются современные подходы к оценке трансферной и рыночной стоимости спортивных прав, включая использование технологий машинного обучения. При этом анализируются как российские, так и зарубежные научные разработки в этой сфере, что подчеркивает высокую степень научной заинтересованности в выявлении заветной формулы ценообразования спортивных прав на игроков. Результаты исследования имеют практическое значение для спортивных клубов, открывая перед ними перспективу оптимизации своих финансовых показателей посредством задействования спортивных прав в обеспечительных сделках. Научная новизна работы заключается в комплексном подходе к анализу использования спортивных прав как экономического актива и разработке рекомендаций по их применению в обеспечительных сделках. Такая многоаспектность и значимость спортивных прав в контексте динамично развивающейся спортивной индустрии, требует комплексного научного анализа и проработки нормативно-правового регулирования. Автор приходит к выводу, что спортивные права на игроков представляют собой перспективный экономический актив, который может стать источником дополнительного финансирования для спортивных клубов при условии разработки эффективных методов оценки, управления и наличия правового регулирования. Это позволит спортивным организациям не только укрепить своё финансовое положение, но и повысить конкурентоспособность, в том числе, на международном рынке.

Издание: ЮРИДИЧЕСКИЕ ИССЛЕДОВАНИЯ
Выпуск: № 2 (2025)
Автор(ы): Ахунзянов Данис Фанисович
Сохранить в закладках
КОМПЬЮТЕРНЫЕ МОДЕЛИ ПРОГНОЗИРОВАНИЯ СПРОСА В УПРАВЛЕНИИ ПЛАТНЫМИ ОБРАЗОВАТЕЛЬНЫМИ УСЛУГАМИ (2025)

Статья посвящена анализу и практическому применению компьютерных моделей для прогнозирования спроса в системе управления платными образовательными услугами. В условиях роста конкуренции и цифровизации образовательной сферы точное прогнозирование спроса становится важным фактором для эффективного планирования ресурсов, маркетинга и формирования ценовой политики, что определяет актуальность исследования. Авторы рассматривают как качественные, так и количественные методы прогнозирования: экспертные оценки (метод Дельфи, групповая экспертиза), регрессионный анализ, анализ временных рядов и моделей эластичности. Особое внимание уделено современным технологиям - использованию Python, машинного обучения и анализа больших данных для построения гибких и адаптивных моделей, которые получают в настоящее время должное теоретико-методическое и прикладное применение в экономических исследованиях в системе управления. Цель исследования заключается в разработке и апробации компьютерных моделей, способствующих эффективному управлению образовательными ресурсами и пониманию тенденций на рынке образовательных услуг. В статье представлены практические примеры расчётов, коды на Python, а также визуализации результатов. Кроме того, рассматриваются демографические, экономические и сценарные подходы к моделированию спроса. В результате разработаны современные компьютерные модели, которые позволяют более точно прогнозировать спрос на платные образовательные услуги. Представлены новые подходы к интерпретации результатов прогнозирования, что способствует повышению эффективности управления образовательными ресурсами. Статья подчёркивает важность комплексного и технологически подкреплённого подхода к прогнозированию как основного инструмента развития образовательной организации.

Издание: ЭКОНОМИЧЕСКАЯ СРЕДА
Выпуск: Т. 14 № 2 (2025)
Автор(ы): Черников Алексей Дмитриевич, Чемерис Ольга
Сохранить в закладках
ОРИЕНТИРЫ И ПРОБЛЕМЫ ВНЕДРЕНИЯ ИННОВАЦИОННЫХ РАЗРАБОТОК НА ОСНОВЕ ТЕХНОЛОГИЙ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА (2025)

Статья посвящена анализу влияния искусственного интеллекта на современный бизнес и перспектив его использования. Целью исследования является изучение и обобщение результатов применения, анализ проблем и перспектив внедрения инновационных разработок на основе технологий искусственного интеллекта российскими компаниями. Методика исследования основана на применении методов наблюдения, сравнения, обзорного анализа, сопоставления информации, обобщения, логической оценки. В результате исследования в статье обоснованы преимущества внедрения технологий искусственного интеллекта в различные сферы российской экономики. Ставится вопрос о возможностях искусственного интеллекта и перспективах его реализации в деятельности человека, в частности, рассматривается тезис о влиянии кибертехнологий на развитие бизнес-процессов в нашей стране, при этом даётся анализ обобщённых данных об эффективности использования искусственного интеллекта отдельными отечественными бизнес-компаниями. Особое внимание уделяется оценке рисков и трудностей, связанных с интеграцией искусственного интеллекта в жизнь общества. Определены задачи государственной значимости по их преодолению.

Издание: ЭКОНОМИЧЕСКАЯ СРЕДА
Выпуск: Т. 14 № 1 (2025)
Автор(ы): Шмаркова Лариса Ивановна, Киселева Надежда Александровна, Плотко Иван Сергеевич
Сохранить в закладках
Автоматическая саммаризация родительских чатов в WhatsApp (2025)

Автоматическая саммаризация текста – одна из ключевых задач NLP, предполагающая создание краткой версии исходного текста. В современном мире, где объемы потребляемой человеком информации неустанно растут, задаче саммаризации уделяется все больше внимания. Автореферирование предполагает два основных подхода: экстрактивный и абстрактивный. Последний заключается в автоматическом создании саммари текста, в котором могут содержаться слова и предложения, не встречающиеся в источнике. Этот подход зачастую требует использования нейросетевых моделей, и для его реализации необходимы большие наборы специальным образом размеченных данных. Несмотря на значительные успехи в абстрактивной саммаризации публицистических и научных текстов, методы и датасеты, используемые для работы с монологическими документами, не всегда применимы для саммаризации диалогов. Кроме того, хотя создано достаточно много англоязычных датасетов для саммаризации текстов различных доменов, существующие наборы данных для автоматического аннотирования текстов на русском языке пока немногочисленны. Настоящая статья посвящена разработке и описанию русскоязычного диалогового датасета для саммаризации сообщений в родительских чатах и последующему обучению модели абстрактивной саммаризации для русского языка на авторском наборе диалоговых данных. В качестве материала выступил родительский чат с учителем в мессенджере WhatsApp. Процесс ручной разметки датасета включал в себя разбиение всех сообщений чата на отдельные диалоги, создание саммари и присвоение тематических меток для каждого разговора. В результате был создан датасет, содержащий 616 диалогов, в общей сложности состоящих из 3380 сообщений. Для файн-тьюнинга были выбраны модели-трансформеры ruT5, mT5 и RuGPT (ruT5 и RuGPT были предварительно обучены на русскоязычном датасете для автоматической саммаризации новостей), а для оценки их качества – метрики ROUGE-1, ROUGE-2, ROUGE-L, BLEU и BERTScore. В результате модели ruT5, дообученной на авторском датасете, удалось превзойти бейзлайн по всем пяти метрикам.

Издание: ВЕСТНИК НГУ. СЕРИЯ: ЛИНГВИСТИКА И МЕЖКУЛЬТУРНАЯ КОММУНИКАЦИЯ
Выпуск: Том 23, № 1 (2025)
Автор(ы): Дмитриева Кристина Александровна, Жолус Марина Романовна
Сохранить в закладках