В настоящее время использование связки – (а) программные средства глубокого обучения и (б) параллельный двуязычный выравненный корпус текстов – позволяет создать переводчик для определенной предметной области. С помощью семейства патентов Patent Family (изобретения, профессионально переведенные на различные языки: русский, английский и т. п. и зарегистрированные в патентных базах различных стран), полученного посредством парсинга Google Patents, возможно создать параллельный корпус текстов для обучения лингвистической модели. В ходе работы получен новый метод, обеспечивающий формирование русско-английского параллельного корпуса для автоматического перевода текста патентов. Разработаны алгоритмы: парсинга патентов с Google Patents; формирования параллельного корпуса; обучения лингвистической модели перевода текстов патентов с использованием модели seq2seq. Разработанные алгоритмы реализованы в виде программного модуля на языке Python с использованием PyTorch, NLTK, spaCy, MySQL, ClickHouse. Программный модуль апробирован на патентах с сайта Google Patents. Для вычисления точности перевода были рассчитаны коэффициент BLEU и коэффициент полноты.
Идентификаторы и классификаторы
Актуальность перевода российских патентов можно разделить на две основные сферы:
- Первая связана с патентным поиском, который необходим для авторов патентов и экспертов патентного ведомства для определения, не зарегистрированы ли ранее подобные данному изобретения;
- Вторая – желание зарегистрировать патент в зарубежных патентных ведомствах.
Список литературы
- Особенности перевода патентной документации // НаучныеПереводы.рф. – URL: https://научные переводы.рф/perevod_patentov/ (дата обращения: 05.06.2023).
- Перевод патентов – услуги профессиональных переводчиков технических текстов // Бюро переводов «Фларус». – URL: http://www.patent-translation.ru/ (дата обращения: 05.06.2023).
- Особенности перевода патентной документации // Компания Effectiff – Бюро переводов в Москве. – URL: https://www.effectiff.com/node/358 (дата обращения: 05.06.2023).
- Триноженко, М. Д. Специфика перевода патентной литературы / М. Д. Триноженко, Ю. Л. Гончарова // Молодой исследователь Дона. – 2016. – № 1 (1).
- WIPO Translate (ВОИС Переводчик) // WIPO. – URL: https://www.wipo.int/wipo-translate/ru/ (дата об-ращения: 05.06.2023).
- EPO – Patent Translate // EPO. – URL: https://www.epo.org/searching-for-patents/helpful-resources/patent-translate.html (дата обращения: 05.06.2023).
- Patsnap | Best Patent Search Tool // PatSnap. – URL: https://www.patsnap.com/ (дата обращения: 05.06.2023).
- Что такое ClickHouse // ClickHouse. – URL: https://clickhouse.com/docs/ru (дата обращения: 27.04.2023).
- Коробкин, Д. М. Анализ патентного массива с использованием связки Clickhouse и HDFS1 / Д. М. Коробкин, С. А. Фоменков, С. А. Козина, А. Б. Голованчиков // Математические методы в технологиях и технике. – 2023. – № 3. – С. 94–99.
Выпуск
Другие статьи выпуска
В статье представлен обзор алгоритмов оценки активной мощности в однофазной цепи электроснабжения с использованием цифровой обработки сигналов во временной и частотной областях. Также проведено сравнение свойств этих алгоритмов для синусоидального тестового сигнала. Сравниваются не только уже известные алгоритмы, но и предлагаемый новый алгоритм. Дается дополнительная информация о некоторых известных алгоритмах. Приведены результаты компьютерного моделирования в среде MATLAB и результаты измерений, полученные с помощью мультиплексированных компьютерных плат сбора данных. Также исследованы косинусные окна сглаживания в сочетании с предлагаемым итеративным алгоритмом. Помимо этого, исследуется влияние аддитивного шума и субгармоник на точность оценки активной мощности. Показано, что наиболее точные результаты оценивания обеспечивает метод во временной области, основанный на методе максимального правдоподобия
В статье поставлена цель выработки критерия выбора радиуса тестового фрагмента круглой формы для виброизмерительной системы, анализирующей вибрационное размытие его изображения. Актуальность поставленной цели состоит в расширении функциональных возможностей виброизмерительной системы за счет измерения как сильных вибраций, так и слабых при минимизации погрешности измерений. Для обоснования взаимосвязи радиуса тестового фрагмента и измерительной погрешности применены методы математической статистики, сегментации изображений и численного моделирования. Проведен анализ состояния вопроса измерения параметров вибраций на основе анализа размытия изображения тестового фрагмента круглой формы. Составлена примерная схема измерения параметров вибрационных процессов на основе анализа размытия изображения тестового фрагмента круглой формы. Приведено описание этой схемы. Проведен анализ вибрационного перемещения тестового фрагмента круглой формы в плоскости объекта регистрирующего устройства по гармоническому закону. Проведена ре-конструкция такого вибрационного перемещения, представлена и описана ее графическая интерпретация. Проведена предметно ориентированная сегментация изображения тестового фрагмента круглой формы с вибрационным размытием при прямолинейном вибрационном перемещении в плоскости объекта регистрирующего устройства. Проведен сравнительный анализ погрешности измерения площади изображения, вносимой прямоугольным сегментом и полукруглыми сегментами. Введено понятие нормированной амплитуды вибрационного перемещения, которое применяется в качестве аргумента функции приведенной погрешности, когда в качестве нормирующего значения принимается радиус тестового фрагмента круглой формы. Введено, обосновано и конкретизировано понятие эквивалентной амплитуды вибрационного перемещения по произвольной траектории. Выработана и обоснована рекомендация выбирать радиус тестового фрагмента минимальным при условии превышения им наибольшей ожидаемой эквивалентной амплитуды вибрационного перемещения исследуемого элемента вибрирующей поверхности.
Существующие методы изучения студентами основ радионавигации, радиолокации, систем управления и радиоэлектронной борьбы в рамках обучения по специальности «Радиоэлектронные системы и комплексы» и обучения операторов обзорных радиолокационных станций ограничены по возможностям или при изучении тратится технический ресурс обзорных радиолокационных станций. В данной работе приводится описание разработанной в филиале «Взлет» Московского авиационного института компьютерной модели индикатора радиолокационной станции кругового обзора, которую предполагается использовать при изучении ряда дисциплин, а также обучении операторов индикаторов обзорных радиолокационных станций кругового обзора. Представлена реализация модели в виде частей программного кода, а также результаты экспериментов по моделированию радиолокационной обстановки в простых и сложных помеховых ситуациях. Предложенная модель индикатора обзорных радиолокационных станций кругового обзора обладает большим потенциалом дальнейшего развития по совершенствованию радиолокационной обстановки и приближению её к более реальным обстановкам.
Данное исследование охватывает развитие методов математического анализа фондовых рынков с использованием подходов машинного обучения и моделей математического программирования. В рамках исследования описана модель частично-целочисленного линейного программирования для решения задач бинарной классификации с наложением дополнительных условий на число используемых признаков модели и стабильности качества модели во времени. Данная модель реализует комитетный подход к решению задач классификации. Эффективность предложенной модели представлена на примере решения задачи прогнозирования моментов для покупки или продажи акций ПАО «Сбербанк» на основе биржевых данных за период с августа 2007 по май 2023 г. Полученные результаты торговой стратегии позволяют говорить о том, что предложенная модель имеет низкий риск получения убытков на периоде в 1 год, что подтверждается отсутствием периодов с метрикой Accuracy менее 50 %, а также оценкой потенциальных доходов, которая на всех годовых периодах была выше 10 %. Проведенное исследование подчеркивает значимость интеграции математического программирования и машинного обучения для повышения точности и эффективности торговых стратегий на фондовых рынках. Данная работа может представлять интерес для профессиональных трейдеров, исследователей данных, студентов экономических и технических специальностей, а также всех лиц заинтересованных в теме инвестиций и машинного обучения.
В работе проводится анализ существующих исследований по созданию интеллектуальных систем управления с ассоциативной памятью. Извлечение информации из ассоциативной памяти тесно связано с кластеризацией данных, что повышает способность системы обрабатывать и использовать большие объемы данных. Применяемые методы определения оптимального числа кластеров не учитывают последующую длительность, необходимую для поиска управления в кластеризованных данных из ассоциативной памяти. Целью исследования является разработка метода, критерия и алгоритма оптимизации функционирования интеллектуальной системы управления с ассоциативной памятью. Метод основан на поиске управления сначала среди центров кластеров, а затем внутри содержимого ближайшего к входным данным кластера. Критерий позволяет выбрать количество кластеров с точки зрения оценки максимальной длительности поиска управления в ассоциативной памяти для различных входных данных. Алгоритм сокращает количество итераций, необходимых для нахождения количества кластеров. Эффективность предложенного метода, критерия и алгоритма подтверждается результатами вычислительного эксперимента. Анализ полученных результатов показывает, что использование разработанных решений позволяет существенно сократить длительность поиска управления в ассоциативной памяти, повышая, в конечном итоге, эффективность функционирования интеллектуальной системы.
В данной статье представлены результаты систематического обзора литературы по проблемам управления киберфизическими системами на основе анализа данных мониторинга. Обзор включает в себя следующие этапы: формулировку вопроса исследования, поиск и отбор литературы, анализ данных и составление отчета. После отбора статей по критериям включения было выбрано 64 наиболее релевантных статьи. Результаты исследования представ-лены в виде диаграмм, таблиц и графиков. Анализ литературы позволил определить несколько основных проблем в управлении киберфизическими системами на основе данных мониторинга: проблемы безопасности, обработка больших объемов данных, сложность управления, недостаток стандартизации, необходимость быстрого реагирования. Также анализ позволил выделить методы и инструменты, использующиеся для решения проблем управления киберфизическими системами на основе анализа данных мониторинга.
В статье рассматривается проблема автоматизации процесса составления типовых документов по информационной безопасности, такие как положения, инструкции, регламенты и пр. Отмечено, что в большинстве малых российских организаций в штате отсутствует специалист по информационной безопасности, поэтому является актуальной задача разработки сервиса по генерации типовых документов для представителей малого бизнеса. Авторами проведен патентный поиск и анализ предметной области, что подтвердило гипотезу об актуальности поставленной проблемы. В рамках данной работы была предпринята попытка структурировать и систематизировать имеющиеся требования к разработке нормативных документов по информационной безопасности, а также сформулировать тот перечень документов, которые может быть типизирован. На основании данной работы были разработаны требования к программному обеспечению, а также проектные диаграммы и алгоритм работы программного продукта.
Геймификация – это методология, которая может быть успешно применена в различных сферах организации предприятия. В частности, она может быть использована для обучения новых сотрудников, повышения квалификации уже имеющегося персонала и подготовки к кризисным ситуациям. Введение элементов игры и соревнования в процесс обучения позволяет сотрудникам применять полученные знания и навыки в реальных ситуациях, что повышает их эффективность и способность реагировать на угрозы информационной безопасности. Кроме того, использование геймификации стимулирует мотивацию сотрудников и улучшает их вовлеченность в процесс обучения. Одной из особенно-стей геймификации является возможность создания персонажей, которые отражают реальные должности и функции сотрудников организации. Авторы предлагают новые подходы к обучению персонала реагированию инцидентов ин-формационной безопасности, которые ставят процесс учебы под конкретные потребности и особенности организации. Кроме того, результаты игры могут быть представлены в виде описания состояния компании и условий работы сотрудников, которые являются следствием принимаемых во время игры решений. Использование геймификации в обучении информационной безопасности имеет не только преимущества для сотрудников, но и для самой организации. Она помогает сотрудникам развивать необходимые навыки и знания, а также повышает их мотивацию и участие в обучении. В результате информационная безопасность организации улучшается, а риск возникновения угроз снижается.
Для динамически изменяющихся объектов управления в задаче управления информационной безопасностью возникают новые задачи, такие как изменение подходов к сбору и анализу данных, разработка динамических сценариев реагирования на инциденты информационной безопасности. Они должны быть решены через создание применимых в указанной задаче алгоритмов, моделей, методик и подходов управления безопасностью, в том числе на уровне организации процессов, работы с данными и формирования архитектуры информационной безопасности организации. Необходимо в первую очередь создать основу для реагирования в виде модели управляемого объекта, что, в свою очередь, позволит сформировать единый подход для представления управляемых объектов в виде унифицированных записей, удобных для автоматизированного анализа. В настоящей работе приведен вариант модели управляемого объекта на основе гиперграфа с возможностью представления в виде покрытия его звездами в графовой модели. Показана привязка модельной задачи к свойствам объектов задачи управления информационной безопасностью. Статья также содержит ограничения и применимые меры контроля в части управления объектами в цикле непрерывного детектирования и реагирования на инциденты информационной безопасности, а также приложение к задаче управления информационной безопасностью вопросов эксфильтрации данных. Упоминаются также условия контроля эксфильтрации данных. Результаты работы могут быть использованы как для имитационных моделей, так и для реализации в виде модели управляемого объекта для процессов управления информационной безопасностью в практических задачах.
В статье производится краткий обзор существующих платформ для создания умного дома, описывается функциональность каждой платформы, их совместимость с устройствами и возможности управления умным домом через мобильные приложения и голосовые команды. Рассматриваются особенности построения гибкой сетевой архитектуры и устройство приватного облачного сервера. Приведен пример построения гибкой архитектуры умного дома, позволяющей управлять различными устройствами в доме с помощью единого интерфейса, обеспечивая максимальный комфорт и удобство для пользователя. Также доказывается важность выбора открытых стандартов и протоколов, которые обеспечивают совместимость устройств и будущую расширяемость системы.
Статья рассматривает использование цифрового двойника в химии, представляющего собой виртуальное отображение реальной химической системы, а также методику его создания и применения. Проиллюстрирована сложность моделирования молекулярных систем и обоснована необходимость автоматизации этого процесса. Проведен анализ процесса возникновения молекулярных связей, и на его основе разработаны критерии составления продукционных правил, применяемых при моделировании сложных молекулярных систем. Показаны специфика составления и добавления продукционных правил в базу данных, а также особенности их использования в процессе моделирования. Кроме того, описаны программные алгоритмы формирования модели сложной молекулярной системы. Выполнена оценка эффективности автоматизированной системы в сравнении с ручной обработкой данных. Полученные результаты могут быть использованы специалистами в области химии, биологии и др.
Рассмотрен ряд условий и особенностей применения методов определения нечетких отношений предпочтения в сочетании с алгоритмами анализа и сравнения недоминирующих альтернатив в интересах формулировки оптимального состава и номенклатуры системы показателей качества информационного поиска на ресурсах современных дата-центров и электронных библиотек. Данный подход опирается на известные методы теории нечетких множеств, теории синтеза оптимальных систем, теории качества и традиционные методы классификации показателей существенных свойств сложных процессов, учитывающие аспекты релевантности, оперативности, адекватности и минимальной размерности результатов реализации поисковых запросов. Рас-смотрены этапы, физическая сущность и математические аспекты подходов, реализующих синтез оптимальной системы показателей релевантности процессов такого класса в условиях априорной неопределенности (нечет-кости) исходных данных. Практическое применение предложенного подхода позволит повысить объективность формулировки исходных данных для информационного поиска, достоверность определения состава множества оцениваемых параметров качества реализации поисковых запросов, создавая тем самым предпосылки для повышения эффективности процессов такого класса в целом.
Издательство
- Издательство
- АГУ им. В. Н. Татищева
- Регион
- Россия, Астрахань
- Почтовый адрес
- 414056, Южный федеральный округ, Астраханская область, г. Астрахань, ул. Татищева, 20а
- Юр. адрес
- 414056, Южный федеральный округ, Астраханская область, г. Астрахань, ул. Татищева, 20а
- ФИО
- Алексеев Игорь Александрович (РЕКТОР)
- E-mail адрес
- asu@asu.edu.ru
- Контактный телефон
- +7 (851) 2246800
- Сайт
- https://asu.edu.ru/