ISSN 1818-1015 · EISSN 2313-5417

· Язык: ru

Статья: ПРИМЕНЕНИЕ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ИРОНИИ В РУССКОЯЗЫЧНЫХ ТЕКСТАХ (2024)

Читать

Статья Литература Выпуск Статистика Издательство

Читать онлайн

В работе исследуются автоматические методы классификации русскоязычных предложений на два класса: содержащие и не содержащие ироничный посыл. Рассматриваемые методы могут быть разделены на три категории: классификаторы на основе эмбеддингов языковых моделей, классификаторы с использованием информации о тональности и классификаторы с обучением эмбеддингов обнаружению иронии. Составными элементами классификаторов являются нейронные сети, такие как BERT, RoBERTa, BiLSTM, CNN, а также механизм внимания и полносвязные слои. Эксперименты по обнаружению иронии проводились с использованием двух корпусов русскоязычных предложений: первый корпус составлен из публицистических текстов из открытого корпуса OpenCorpora, второй корпус является расширением первого и дополнен ироничными предложениями с ресурса Wiktionary. Лучшие результаты продемонстрировала группа классификаторов на основе чистых эмбеддингов языковых моделей с максимальным значением F-меры 0.84, достигнутым связкой из RoBERTa, BiLSTM, механизма внимания и пары полносвязных слоев в ходе экспериментов на расширенном корпусе. В целом использование расширенного корпуса давало результаты на 2-5% выше результатов на базовом корпусе. Достигнутые результаты являются лучшими для рассматриваемой задачи в случае русского языка и сравнимы с лучшими для английского.

Ключевые фразы: ОБНАРУЖЕНИЕ ИРОНИИ, ОБНАРУЖЕНИЕ САРКАЗМА, НЕЙРОСЕТЕВОЙ КЛАССИФИКАТОР, глубокое обучение, обработка естественного языка, BERT

Автор (ы): Костерин Максим Алексеевич, Парамонов Илья Вячеславович

Журнал: МОДЕЛИРОВАНИЕ И АНАЛИЗ ИНФОРМАЦИОННЫХ СИСТЕМ

Идентификаторы и классификаторы

УДК: 004.912. Обработка текста
eLIBRARY ID: 63159434

Для цитирования:

КОСТЕРИН М. А., ПАРАМОНОВ И. В. ПРИМЕНЕНИЕ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ИРОНИИ В РУССКОЯЗЫЧНЫХ ТЕКСТАХ // МОДЕЛИРОВАНИЕ И АНАЛИЗ ИНФОРМАЦИОННЫХ СИСТЕМ. 2024. Т. 31 № 1

Текстовый фрагмент статьи

Список литературы

M. Kosterin, I. Paramonov, and N. Lagutina, “Automatic Irony and Sarcasm Detection in Russian Sentences: Baseline Methods”, in 33rd Conference of Open Innovations Association FRUCT, 2023, pp. 148-154,. DOI: 10.23919/FRUCT58615.2023.10142992
D. \vSandor and M. B. Babac, “Sarcasm detection in online comments using machine learning”, Information Discovery and Delivery, 2023,. DOI: 10.1108/IDD-01-2023-0002
R. A. Potamias, G. Siolas, and A.-G. Stafylopatis, “A transformer-based approach to irony and sarcasm detection”, Neural Computing and Applications, vol. 32, pp. 17309-17320, 2020,. DOI: 10.1007/s00521-020-05102-3
C. Van Hee, E. Lefever, and V. Hoste, “Semeval-2018 task 3: Irony detection in English tweets”, in Proceedings of The 12th International Workshop on Semantic Evaluation, 2018, pp. 39-50,. DOI: 10.18653/v1/S18-1005
M. Khodak, N. Saunshi, and K. Vodrahalli, “A large self-annotated corpus for sarcasm”. 2017.
E. Riloff, A. Qadir, P. Surve, L. De Silva, N. Gilbert, and R. Huang, “Sarcasm as contrast between a positive sentiment and negative situation”, in Proceedings of the 2013 conference on empirical methods in natural language processing, 2013, pp. 704-714.
S. Zhang, X. Zhang, J. Chan, and P. Rosso, “Irony detection via sentiment-based transfer learning”, Information Processing & Management, vol. 56, no. 5, pp. 1633-1644, 2019,. DOI: 10.1016/j.ipm.2019.04.006
D. Hazarika, S. Poria, S. Gorantla, E. Cambria, R. Zimmermann, and R. Mihalcea, “Cascade: Contextual sarcasm detection in online discussion forums”. 2018.
T. Zefirova and N. Loukachevitch, “Irony and sarcasm expression in Twitter”, EPiC Series in Language and Linguistics, vol. 4, pp. 45-49, 2019,. DOI: 10.29007/tpzw

A. A. Gurin and T. A. Zhukov, "Avtomaticheskoe opredelenie sarkazma v tekstakh na russkom yazyke", Tsyfrovaya ekonomika, vol. 1(22), pp. 44-53, 2023.

A. D. Yacoub, S. Slim, and A. Aboutabl, "A Survey of Sentiment Analysis and Sarcasm Detection: Challenges, Techniques, and Trends", International journal of electrical and computer engineering systems, vol. 15, no. 1, pp. 69-78, 2024,.  DOI: 10.32985/ijeces.15.1.7  EDN: EDNMGM

Y. Kuratov and M. Arkhipov, "Adaptation of deep bidirectional multilingual transformers for Russian language". 2019.

D. Zmitrovich et al., "A family of pretrained transformer language models for Russian". 2023.

C. Zhou, C. Sun, Z. Liu, and F. Lau, "A C-LSTM neural network for text classification". 2015.

A. Rogers, A. Romanov, A. Rumshisky, S. Volkova, M. Gronas, and A. Gribov, "RuSentiment: An enriched sentiment analysis dataset for social media in Russian", in Proceedings of the 27th international conference on computational linguistics, 2018, pp. 755-763.

Выпуск

Т. 31 № 1 (2024)

Кол-во страниц: 114 страниц

Другие статьи выпуска

NP-ПОЛНОТА ЗАДАЧИ ОБ ЭЙЛЕРОВОМ МАРШРУТЕ В КРАТНОМ ГРАФЕ (2024)

Авторы: Смирнов Александр Валерьевич

В статье рассматриваются неориентированные кратные графы произвольной натуральной кратности k>1. Кратный граф содержит ребра трех типов: обычные, кратные и мультиребра. Ребра последних двух типов представляют собой объединение k связанных ребер, которые соединяют 2 или (k+1) вершину соответственно. Связанные ребра могут использоваться только согласованно. Если вершина инцидентна кратному ребру, то она может быть инцидентна другим кратным ребрам, а также она может быть общим концом k связанных ребер мультиребра. Если вершина является общим концом мультиребра, то она не может быть общим концом никакого другого мультиребра. Рассматривается задача об эйлеровом маршруте (цикле или цепи) в кратном графе, которая обобщает классическую задачу для обычного графа. Доказывается, что задача о кратном эйлеровом маршруте в варианте распознавания является NP-полной. Для этого предварительно обосновывается NP-полнота вспомогательной задачи о покрывающих цепях с заданными концами в обычном графе.

Сохранить в закладках

МИНИМАЛЬНОЕ ПОКРЫТИЕ ОБОБЩЕННЫХ ТИПИЗИРОВАННЫХ ЗАВИСИМОСТЕЙ ВКЛЮЧЕНИЯ В БАЗАХ ДАННЫХ (2024)

Авторы: Зыкин Сергей Владимирович

В статье рассматривается теория и алгоритмы, необходимые для построения минимального покрытия обобщенных типизированных зависимостей включения. Традиционно аппарат построения минимальных покрытий используется для всех видов зависимостей с целью получения не избыточного и непротиворечивого проекта базы данных. Обобщенные зависимости включения соответствуют ссылочным ограничениям целостности, когда в одном ограничении участвуют несколько главных и несколько внешних отношений, что соответствует ребру ультраграфа. В предыдущей работе на основе исследования свойств зависимостей представлена система аксиом с доказательством непротиворечивости и полноты. В данной работе проведены исследования замыканий для обобщенных типизированных зависимостей включения. Разработан алгоритм построения замыканий, доказана его корректность. Полученные результаты далее используются для разработки алгоритма построения минимального покрытия. В конце статьи представлены примеры, которые демонстрируют работу алгоритмов.

Сохранить в закладках

О ПРИМЕНЕНИИ ИСЧИСЛЕНИЯ ПОЗИТИВНО-ОБРАЗОВАННЫХ ФОРМУЛ ДЛЯ ИССЛЕДОВАНИЯ УПРАВЛЯЕМЫХ ДИСКРЕТНО-СОБЫТИЙНЫХ СИСТЕМ (2024)

Авторы: Давыдов Артем Васильевич, Нагул Надежда Владимировна, Ларионов Александр Александрович

Статья посвящена разработке подхода к решению основных задач теории супервизорного управления логическими дискретно-событийными системами (ДСС), основанного на представлении их в виде позитивно-образованных формул (ПОФ). Рассматриваются логические ДСС в автоматной форме, понимаемые как генераторы некоторых регулярных языков. Язык ПОФ представляет собой полный язык первого порядка, формулы которого имеют регулярную структуру из чередующихся типовых кванторов и не содержат в синтаксисе оператора отрицания. Ранее было доказано, что любая формула классического исчисления предикатов первого порядка может быть представлена в виде ПОФ. ПОФ имеют наглядное древовидное представление и естественную вопросно-ответную процедуру поиска вывода с помощью единственного правила вывода. Показано, как разработанное в 1990-х годах для решения некоторых задач управления динамическими системами исчисление ПОФ позволяет решать базовые задачи теории супервизорного управления, такие как проверка критериев существования супервизорного управления, автоматическая модификация ограничений на поведение управляемой системы и реализация супервизора. Благодаря некоторым особенностям исчисления ПОФ существует возможность применения немонотонного вывода. Продемонстрировано, как представленный метод на основе ПОФ позволяет выполнять дополнительную обработку событий во время логического вывода. Также представлена программная система Bootfrost, или так называемый прувер, разработанный для опровержения полученных ПОФ, кратко описываются особенности его реализации. В качестве иллюстративного примера рассматривается задача управления автономным мобильным роботом.

Сохранить в закладках

ШАБЛОНЫ ТРЕБОВАНИЙ В ДЕДУКТИВНОЙ ВЕРИФИКАЦИИ POST-ПРОГРАММ (2024)

Авторы: Гаранина Наталья Олеговна, Ануреев Игорь Сергеевич, Черненко Иван Михайлович

Процесс-ориентированное программирование - один из подходов к разработке управляющего программного обеспечения. Процесс-ориентированная программа определяется как последовательность процессов. Каждый процесс представляется набором именованных состояний, содержащих программный код, которые задают логику поведения процесса. Выполнение программы заключается в последовательном исполнении этих процессов в их текущих состояниях на каждой итерации цикла управления. Процессы могут взаимодействовать через изменение состояний друг друга и через разделяемые переменные. Статья является развитием метода классификации темпоральных требований к процесс-ориентированным программам с целью упростить и автоматизировать дедуктивную верификацию таких программ. Метод состоит из следующих шагов. На первом шаге требования формализуются на специализированном языке DV-TRL, варианте типизированной логики предикатов первого порядка с набором интерпретированных типов и предикатных и функциональных символов, позволяющем отражать специфические понятия систем управления в процесс-ориентированной парадигме. На втором шаге формализованные требования разбиваются на классы, каждый из которых определяется шаблоном - параметрической формулой языка DV-TRL, причем условия корректности, порождаемые для процесс-ориентированных программ относительно требований, удовлетворяющих одному шаблону, имеют одну и ту же схему доказательства. На третьем шаге разрабатываются соответствующие схемы доказательства. В статье мы сначала даём краткое введение в язык poST, процесс-ориентированное расширение языка ST стандарта МЭК 61131-3. Далее определяется язык DV-TRL. Мы также приводим коллекцию требований на естественном языке для нескольких систем управления. Затем мы определяем шаблоны, позволяющие полностью покрыть все требования этой коллекции и для каждого из шаблонов приводим пример формализованного требования из коллекции и описываем схему доказательства условий корректности для этого шаблона. Статистика распределения требований из коллекции по шаблонам выявляет наиболее востребованные шаблоны. Мы также провели анализ связанных работ.

Сохранить в закладках

Статистика статьи

Статистика просмотров за 2025 год.

Издательство

Издательство: ЯрГУ им. П.Г. Демидова
Регион: Россия, Ярославль
Почтовый адрес: 150003, Ярославль, Советская, 14,
Юр. адрес: 150003, Ярославль, Советская, 14,
ФИО: Иванчин Артем Владимирович (Ректор)
E-mail адрес: rectorat@uniyar.ac.ru
Контактный телефон: +7 (485) 2797702
Сайт: https://www.uniyar.ac.ru/

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.

Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.

Все права на товарные знаки принадлежат их законным владельцам!

Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.

Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.

Спасибо, понятно.

Наведите камеру на QR-код, чтобы открыть моб. версию страницы.