ISSN 2072-6759

· Языки: ru / en

Статья: Многозадачное обучение для улучшения генерализации в задаче генерации структурированных запросов (2024)

Читать

Статья Литература Выпуск Статистика Издательство

Читать онлайн

Семантический парсинг – это задача перевода выражения на естественном языке в логическое выражение на формальном языке. Примером практического применения семантического парсинга является преобразование текста в запрос к базе знаний. Наиболее популярными задачами преобразования текста в запрос являются задачи преобразования выражения в SQL и в SPARQL. Сдвиг распределения обучающей выборки – одна из главных проблем устойчивости семантических парсеров. Наиболее частым сдвигом в семантическом парсинге является композиционный сдвиг – необходимость генерации новых композиций кода из известных элементов синтаксиса целевого языка. В этой работе исследуется возможность использования предобученных языковых моделей (PLM) вместе с многозадачным обучением. Предлагаются специально разработанные разбиения наборов данных SPARQL и SQL, исходных датасетов LC-QuAD и WikiSQL для имитации сдвига распределения и сравнения оригинального подхода обучения генерации запроса с многозадачным подходом. В работе проведен углубленный анализ разбиений данных и предсказаний модели и показаны преимущества многозадачного подхода над оригинальным для задачи семантического парсинга.

Ключевые фразы: семантический парсинг, сдвиг распределения, многозадачное обучение

Автор (ы): Сомов О. Д.

Журнал: ТРУДЫ МФТИ

Идентификаторы и классификаторы

УДК: 004.852. Статистическое обучение и параметрическое обучение

Для цитирования:

СОМОВ О. Д. МНОГОЗАДАЧНОЕ ОБУЧЕНИЕ ДЛЯ УЛУЧШЕНИЯ ГЕНЕРАЛИЗАЦИИ В ЗАДАЧЕ ГЕНЕРАЦИИ СТРУКТУРИРОВАННЫХ ЗАПРОСОВ // ТРУДЫ МФТИ. 2024. ТОМ 16, № 2 (62)

Текстовый фрагмент статьи

Список литературы

1. Zhong V. [et al.]. Seq2sql: Generating structured queries from natural language using reinforcement learning // arXiv preprint. [2017]. arXiv: 1709.00103.
2. Shaw P. [et al.]. Compositional generalization and natural language variation: Can a semantic parsing approach handle both? // arXiv preprint. [2020]. arXiv: 2010.12725.
3. Hupkes D. [et al.]. Compositionality decomposed: How do neural networks generalise? // JAIR. 2020. V. 67. P. 757–795.
4. Worsham J. [et al.]. Multi-task learning for natural language processing in the 2020s: Where are we going? // Pattern Recognition Letters. 2020. V. 136. P. 120–126.
5. Dubey M. [et al.]. Lc-quad 2.0: A large dataset for complex question answering over wikidata and dbpedia // ISWC. 2019. V. 2. P. 69-78.
6. Raffel C. [et al.]. Exploring the limits of transfer learning with a unified text-to-text transformer // JMLR. 2020. V. 21(1). P. 5485–5551.
7. Bakshandaeva D. [et al.]. PAUQ: Text-to-SQL in Russian // EMNLP. 2022. V. 2022. P. 2355–2376.

Выпуск

Том 16, № 2 (62) (2024)

Кол-во страниц: 145 страниц

Другие статьи выпуска

Особенности функционирования генератора случайных чисел с транзисторным источником шума в различных температурных условиях (2024)

Авторы: Матюшин Д. А., Лобанов А. М., Тихонов Д. Р., Стожков Владимир Юрьевич, Лапушкин Георгий Иванович

Устройства, порождающие случайный набор чисел, находят применение в различных областях. В настоящей работе рассмотрен вариант реализации источника шума на основе эмиттерного p-n перехода биполярного транзистора. В данной работе изучены практические характеристики генерации случайных чисел, основанной на шуме такого перехода. Определена рабочая область генерации, уровень случайного сигнала, получена температурная зависимость режимов работы для p-n перехода транзистора КТ3102. Сделаны предположения о физическом механизме возникновения такого шума, что позволит стандартизировать подбор транзисторов для рассматриваемой задачи. Проверка полученных случайных последовательностей с помощью статистических тестов [3] показала, что полученную нами последовательность нулей и единиц можно считать случайной с уровнем доверия 99%.

Сохранить в закладках

Насыщающийся поглотитель на основе упорядоченных одностенных углеродных нанотрубок (2024)

Авторы: Исмаил Алмикдад Таие, Арутюнян Наталия Рафаэлевна, Образцова Е. А., Коматсу Натсуми, Коно Юничиро, Образцова Елена Дмитриевна

Рассматривается задача исследования оптических свойств упорядоченных вдоль одной оси, параллельно к плоскости образца, одностенных углеродных нанотрубок с целью создания насыщающегося поглотителя для волоконного эрбиевого лазера фемтосекундных импульсов, работающего в ближнем ИК-диапазоне. Возможность генерации ультракоротких импульсов с помощью исследуемого насыщающегося поглотителя в лазере данного типа была изучена методом численного моделирования. Результаты показывают возможность манипуляции выходными характеристиками излучения лазера данного типа посредством изменения угла ориентации трубок относительно оптической оси.

Сохранить в закладках

Синтез волноводных фильтров Ка-диапозона с помощью метода согласования мод (2024)

Авторы: Демин Д. А., Филатов И. В., Филатов В. В., Денисов Н. Н., Чубинский Николай Петрович

В работе рассматриваются приложения метода согласования мод для задачи синтеза волноводного фильтра. Методика модифицирована для анализа специфичной формы волноводного фильтра с толстыми симметричными апертурами. Приводится эквивалентная схема этой структуры, численно устанавливается связь между параметрами этой схемы и геометрией фильтра с применением метода согласования мод. В качестве примера методика применена для синтеза полосового фильтра Ка-диапазона. Проведено сравнение результатов моделирования с помощью предлагаемой методики и метода конечных элементов. Методика проверена экспериментально на существующем волноводном фильтре. Предлагается методика изготовления волноводных фильтров без необходимости применения дополнительных подстроечных элементов.

Сохранить в закладках

Сравнение результатов измерений электронных параметров плазмы зондами Ленгмюра с изоляторами разных размеров (2024)

Авторы: Драганов Иван Игнатьевич, Бернацкий Антон Владиславович, Очкин Владимир Николаевич

Изучается влияние размера изолятора зонда Ленгмюра на результаты измерений потенциала плазмы, электрического поля, средней энергии и концентрации электронов в разряде в гелии, поддерживаемом полым катодом. Измерения проводились подвижным зондом с пространственным разрешением. Установлено, что влияние различно в отношении разных параметров плазмы и зависит от локализации зонда в пространстве катод-анод.

Сохранить в закладках

Возбуждение вещества электромагнитными импульсами со случайной фазой (2024)

Авторы: Астапенко Валерий Александрович, Бергалиев Т. К., Сахно Сергей Владимирович

Теоретически исследуется возбуждение вещества электромагнитными импульсами со случайной фазой на примере двухуровневой системы и квантового гармонического осциллятора. В рамках теории возмущений получено выражение для вероятности возбуждения двухуровневой системы через Фурье-образ огибающей импульса. Численно проанализировано возбуждение квантового осциллятора гауссовским и экспоненциальным импульсами с различными фазовыми характеристиками в терминах вероятности возбуждения за все время действия импульса. Установлены характеристические черты данного процесса как функции длительности импульса для различных значений частоты Раби.

Сохранить в закладках

Применение теории эволюционной оптимальности для определения преждевременной и избыточной смертности в модели Лотки (2024)

Авторы: Разжевайкин Валерий Николаевич

В рамках модели Лотки, записанной в форме уравнений Мак Кендрика – фон Ферстера, представлены имеющие вид принципа эволюционной оптимальности необходимые условия устойчивости решений, задающих выжившие популяции, в терминах избыточной смертности и максимальной продолжительности жизни. Разобраны два варианта зависимости индивидуальной смертности от структуры популяции: зависимость от общей и от относительной по отношению к числу новорожденных численностей. Представлены содержательные биологические интерпретации полученных математических результатов. В частности, обсуждаются парадокс бессмертия и необходимость «отрезания по-живому» для максимальной продолжительности жизни.

Сохранить в закладках

Разрешимость задачи Неймана для полигармонического уравнения в шаре (2024)

Авторы: Карачик Валерий Валентинович

В работе приводится представление решения задачи Неймана для полигармонического уравнения в единичном шаре через решения задач Дирихле для уравнения Лапласа и функцию Грина задачи Дирихле для полигармонического уравнения.

Сохранить в закладках

О применении причинно-следственных моделей в тестировании систем машинного обучения (2024)

Авторы: Якушева С. Ф., Хританков Антон Сергеевич

Верификация систем машинного обучения – это сложная задача, предполагающая анализ взаимозависимостей между частями системы. Для тестирования таких систем представляется перспективным применение метода тестирования инвариантами (метаморфное тестирование, metamorphic testing). В данной работе предлагается использовать причинно-следственные модели для анализа причин невыполнения тестовых инвариантов (метаморфных соотношений, metamorphic relations), заданных для исследуемой системы машинного обучения. В результате расчета оценок влияния, рассчитанных на основе модели, могут быть определены компоненты, оказывающие наибольшее влияние на нарушения тестовых инвариантов. Приоритетное исправление ошибок в этих компонентах помогает уменьшить степень нарушения инвариантов. Применимость и полезность метода показана на примере многокомпонентной системы искусственного интеллекта для создания персонализированных стикеров.

Сохранить в закладках

Моделирование пропитки пористой среды с помощью двумерной сетевой модели (2024)

Авторы: Вамси Б., Шаббир К., Извеков Олег Ярославович

Реализована двумерная сетевая модель (network model) двухфазных течений в неодноднородной пористой среде, состоящей из двух подсистем: низко проницаемого блока с тонкими капиллярами, окруженного областью высокопроницаемой среды с толстыми капиллярами. Рассматривается задача установления капиллярного равновесия в результате противоточной пропитки блока. Считается, что в начальный момент времени высокопроницаемая и низко проницаемая части пористой среды насыщены смачивающей и несмачивающей несжимаемой жидкостью соответственно. В численных расчетах на основе сетевой модели исследуется зависимость от времени насыщенности подсистем смачивающей жидкостью и зависимость капиллярного давления от текущей насыщенности. Получено качественное соответствие известным экспериментальным и теоретическим результатам, что в дальнейшем позволит использовать модель для верификации осредненных моделей капиллярной неравновесности.

Сохранить в закладках

Автоматическая настройка ПИД-регулятора с применением машинного обучения для обеспечения стабильной работы автономных электронных систем при термоциклировании (2024)

Авторы: Чибисов А. В., Попов Александр Григорьевич, Мозговой Н. А., Пиджаков В. А., Ульянов Сергей Алексеевич

Данная статья посвящена применению методов машинного обучения для автоматической настройки коэффициентов ПИД-регулятора для обеспечения стабильной работы автономных электронных систем в условиях быстрых изменений температуры. Рассмотрена проблема влияния температурного режима на работу оптоэлектронных устройств и предложен способ её решения. Представлена архитектура нейронной сети, созданной для нелинейной настройки коэффициентов ПИД-регулятора для контроля элемента Пельтье на основе его математической модели. Проведен численный эксперимент для оценки эффективности применения созданного метода настройки и продемонстрировано увеличение точности контроля температуры рабочей поверхности при его использовании.

Сохранить в закладках

Особенности засветки бленды солнечным излучением, отраженным от поверхности Земли (2024)

Авторы: Класс Елена Викторовна, Виноградов И. С., Ульянов Сергей Алексеевич, Конопелько Никита Алексеевич, Попов Александр Григорьевич

Проведены расчетные исследования по засветке бленды звездного датчика космического аппарата солнечным излучением, отраженным от поверхности Земли. Математическая модель процесса была реализована в рамках программы метода Монте-Карло РОКС-RG, предназначенной для решения уравнения переноса оптического излучения в трехмерной геометрии. Показано, что угловой размер небесной сферы, обеспечивающий допустимую засветку звездного датчика, в ряде случаев может быть увеличен.

Сохранить в закладках

Оптимальное планирование работы измерительных средств при сборе координатной информации о космических объектах (2024)

Авторы: Григорьев В. С.

В настоящее время все более актуальной становится задача оптимального планирования наблюдений наземными измерительными средствами. В данной работе формализуется задача планирования с целью сбора координатной информации о космических объектах оптическими и радиотехническими средствами. Предложен метод сведения задачи планирования к построению дерева и поиску в нем ветви с максимальной суммой приоритетов вершин, ей принадлежащих. Для такой постановки приведен оптимальный алгоритм формирования расписаний для случая одного измерительного средства. Вместе с тем данный подход к построению плана позволяет использовать другие более быстрые квазиоптимальные алгоритмы, например, нейронные сети или генетические алгоритмы в случае недостаточного количества вычислительного ресурса.

Сохранить в закладках

Статистика статьи

Статистика просмотров за 2025 год.

Издательство

Издательство: МФТИ, ФИЗТЕХ
Регион: Россия, Москва
Почтовый адрес: 141701, Московская область, г. Долгопрудный, Институтский переулок, д.9.
Юр. адрес: 117303, г Москва, р-н Зюзино, ул Керченская, д 1А к 1
ФИО: Ливанов Дмитрий Викторович (РЕКТОР)
E-mail адрес: rector@mipt.ru
Контактный телефон: +7 (495) 4084774
Сайт: https:/old.mipt.ru

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.

Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.

Все права на товарные знаки принадлежат их законным владельцам!

Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.

Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.

Спасибо, понятно.

Наведите камеру на QR-код, чтобы открыть моб. версию страницы.