SCI Библиотека

SciNetwork библиотека — это централизованное хранилище... ещё…

Результаты поиска: 4487 док. (сбросить фильтры)
БЫСТРОЕ ВЫЧИСЛЕНИЕ ПОКАЗАТЕЛЬНОЙ ФУНКЦИИ С ПОМОЩЬЮ ТАБЛИЦ

В работе изложены алгоритмы и приведены компактные программные модули на языке С для быстрого вычисления показательной функции с помощью таблиц для процессоров архитектуры x86-64. Выполнена оценка точности и проведено сравнение быстродействия для некоторых процессоров AMD и Intel. Реализовано и протестировано обобщение табличного подхода для некоторых тригонометрических функций. В среднем предложенные функции работают в 10 раз быстрее соответствующих аналогов из стандартной математической библиотеки с прототипами в math.h.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Васильев Евгений
Язык(и): Русский
ВАЛИДАЦИОННЫЕ РАСЧЕТЫ ЗАДАЧ ГЕМОДИНАМИКИ С ИСПОЛЬЗОВАНИЕМ ПРОГРАММНОГО КОМПЛЕКСА FLOWVISION В РЕЖИМЕ РАСПАРАЛЛЕЛИВАНИЯ

Проведены расчеты тестовой задачи, связанной с моделированием течения в идеализированном медицинском устройстве, в программном комплексе FlowVision. Расчеты проводились для ламинарного, турбулентного и переходного режимов течения. Исследована масштабируемость задачи. На основе решения тестовой задачи сделан вывод о возможности применения программного комплекса FlowVision к решению проблем гемодинамики.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Калугина Мария
Язык(и): Русский
A RECURRENT FORMULA FOR CALCULATING AN IMPEDANCE OF THE CATHODE CATALYST LAYER IN A POLYMER ELECTROLYTE FUEL CELL

A recurrent formula for estimating an impedance of the cathode catalyst layer with fast oxygen transport in a polymer electrolyte fuel cell is derived. The catalyst layer is divided into N sub-layers and application of the charge conservation law enables to obtain the nonlinear recurrent relation Zn = f(Zn-1), where Zn is the accumulated impedance of all sub-layers up to the n-th one. Numerical solution of this relation gives the total impedance of the catalyst layer with taking into account variation of the static overpotential of the oxygen reduction reaction along the depth of this layer. The model is simple, robust and two orders of magnitude faster than the standard model based on numerical solution of the differential equation.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Куликовский Андрей
Язык(и): Русский
ПОСТРОЕНИЕ РАСПИСАНИЯ ДЛЯ МНОГОЯДЕРНОГО ПРОЦЕССОРА С УЧЕТОМ ВЗАИМНОГО ВЛИЯНИЯ РАБОТ

В статье рассматривается задача планирования работ на многоядерном процессоре с учетом их замедления при совместном выполнении. Предложена постановка задачи и модель частично целочисленного линейного программирования, доказана NP-трудность задачи при числе ядер, ограниченном константой. Результаты планировщика Intel TBB и жадного алгоритма сравниваются с результатами, полученными в соответствии с предложенной моделью с помощью пакета CPLEX. Проведенный эксперимент показал преимущества предложенного подхода по времени завершения всех работ.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Еремеев Антон
Язык(и): Русский
ОНТОЛОГИЧЕСКИЙ АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ ЦИФРОВОЙ ПЛАТФОРМЫ ALGO500

Проект создания цифровой платформы Algo500 направлен на решение задачи совместного анализа свойств алгоритмов и особенностей архитектур суперкомпьютеров. В статье на основе методологии онтологического анализа рассматриваются и предлагаются понятия, модели и метамодели данных, обосновываются подходы к описанию некоторых понятий из мира высокопроизводительных вычислений (HPC), устанавливаются новые требования к моделям данных, которые должны обеспечить выполнение задач, поставленных при создании платформы Algo500.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Антонов Александр
Язык(и): Русский
ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ БИО АНИЗОТРОПНОЙ ПОРОУПРУГОЙ ФЛЮИДОНАСЫЩЕННОЙ СРЕДЫ В КВАЗИСТАТИЧЕСКОЙ ПОСТАНОВКЕ ДЛЯ ЧИСЛЕННОГО РЕШЕНИЯ ЗАДАЧИ АПСКЕЙЛИНГА

Представлен алгоритм численного моделирования квазистатической нагрузки пористого флюидонасыщенного образца для решения задачи апскейлинга трещиновато-пористой флюидонасыщенной среды. В результате апскейлинга восстанавливается анизотропная однородная вязкоупругая эквивалентная среда, определяемая комплекснозначным частотно-зависимым тензором жесткости. Компоненты восстановленного тензора жесткости эквивалентной среды используются для оценки частотно-зависимого сейсмического затухания и фазовой скорости сейсмических волн. Численный апскейлинг включает в себя численное решение краевой задачи для системы уравнений Био анизотропной пороупругой флюидонасыщенной среды в частотной области для набора частот и различных граничных условий. Численное решение системы уравнений Био основано на конечно-разностной аппроксимации уравнений в квазистатической постановке и проводится с использованием прямого решателя результирующей СЛАУ. Используемый прямой решатель позволяет эффективно решать СЛАУ для набора правых частей, что необходимо при численном апскейлинге. Представленная реализация алгоритма позволяет численно решать двумерную задачу апскейлинга на расчетной сетке с размерами до 2000 × 2000 узлов на персональном компьютере, что обеспечивает возможность восстанавливать эквивалентную вязкоупругую модель для детализированных репрезентативных образцов трещиновато-пористой среды. Для демонстрации применимости алгоритма выполнено несколько наборов численных экспериментов, направленных на выявление влияния связности трещин и микромасштабной анизотропии пороупругого материала внутри трещин на затухание, вызванное индуцированными волной потоками флюидов, и дисперсию сейсмической волны в сложной трещиновато-пористой флюидонасыщенной среде.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): СОЛОВЬЁВ Сергей
Язык(и): Русский
ПАРАЛЛЕЛЬНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМА ВОССТАНОВЛЕНИЯ СЕЙСМИЧЕСКОГО ИСТОЧНИКА ПО СЕРИИ СТАТИСТИЧЕСКИ ИДЕНТИЧНЫХ МОДЕЛЕЙ СРЕДЫ С ПРИМЕНЕНИЕМ FORTRAN COARRAY

Рассматривается задача параллельной реализации алгоритма определения сейсмического источника внутри случайно-неоднородной среды. Алгоритм определения исходной позиции источника использует данные записанных сейсмограмм на свободной поверхности и информацию о статистических свойствах случайной среды. Предложенный подход требует решения большого количества задач динамической теории упругости для различных статистически эквивалентных скоростных моделей, идентифицированных по статистическим параметрам исходной среды. Это наиболее трудоемкая часть алгоритма решения. Чтобы ускорить расчеты, используется двухуровневая стратегия распараллеливания с помощью создания групп, каждая из которых решает свою задачу динамической теории упругости с декомпозицией расчетной области внутри группы. Реализация программы выполнена с использованием Fortran Coarray. Также приводится сравнение используемых конструкций расширения Fortran Coarray с функциями MPI.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Койнов В.
Язык(и): Русский
МОДЕЛИРОВАНИЕ МЕТОДОМ ЧАСТИЦ НА GPU С ИСПОЛЬЗОВАНИЕМ ЯЗЫКА GLSL

Рассмотрено моделирование гравитационной задачи N тел с использованием алгоритмов PM и P3M. Реализация алгоритмов для GPU осуществлена с применением вычислительных шейдеров. Предложенный подход использует CPU-код только для синхронизации и запуска шейдеров и не содержит вычислительных частей, реализуемых на CPU; в том числе полностью отсутствует копирование данных между CPU и GPU. Приводятся параллельный алгоритм размещения частиц по ячейкам сетки и параллельный алгоритм распределения масс по узлам сетки. Основой алгоритмов является параллельное построение списков, соответствующих ячейкам сетки. Алгоритмы полностью распараллелены и не содержат частей, исполняемых в один поток. Для расчета одновременно с визуализацией часть вычислений сделана в вершинном шейдере. Выполнить их позволило использование буферных объектов в вершинном шейдере и специально подготовленных данных вместо вершин в качестве входа. Приведены результаты численных расчетов на примере образования галактических скоплений в расширяющейся согласно модели Фридмана плоской вселенной. В качестве модели вселенной брался куб с периодическими краевыми условиями по всем осям. Максимальное число частиц, с которым проводились расчеты, - 108. Для моделирования использовались современный кроссплатформенный API Vulkan и язык GLSL. Результаты расчетов на процессорах Apple M1 и Ryzen 3700X сравниваются с результатами расчетов на обычных видеокартах Apple M1 и NVIDIA RTX 3060. Параллельный алгоритм для CPU реализован с помощью OpenMP. Проведено сравнение производительности алгоритма с результатами других авторов, причем делаются качественные сравнения самих результатов вычислений и сравнение времени работы алгоритмов. Также приведено сравнение времени работы программы для GPU и похожей программы для кластера из многих узлов.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Озерицкий Алексей
Язык(и): Русский
СОЗДАНИЕ ПЕРЕНОСИМОГО ПРОГРАММНОГО КОМПЛЕКСА ДЛЯ МОНИТОРИНГА И АНАЛИЗА ПРОИЗВОДИТЕЛЬНОСТИ СУПЕРКОМПЬЮТЕРНЫХ ПРИЛОЖЕНИЙ

Современные суперкомпьютеры востребованы в самых разных областях науки и техники. Однако их вычислительные ресурсы зачастую используются не в полной мере. Причина нередко кроется в низкой эффективности выполнения пользовательских приложений. Решить возникшую проблему весьма непросто, что связано как с чрезвычайной сложностью строения современных суперкомпьютеров, так и с недостатком теоретических знаний и практического опыта в создании высокоэффективных параллельных приложений у пользователей вычислительных систем. Более того, пользователи зачастую и не знают, что их приложения работают неэффективно. Поэтому важно, чтобы администраторы суперкомпьютеров могли постоянно контролировать и анализировать весь поток выполняющихся приложений. Для этих целей можно использовать различные существующие системы мониторинга и анализа производительности, однако подобные решения в большинстве своем либо не предоставляют достаточный функционал в части изучения производительности, либо не переносимы. В данной работе описывается прототип разрабатываемого программного комплекса, который предоставляет широкие возможности по сбору и автоматическому анализу данных о производительности приложений и при этом является переносимым.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Воеводин Вадим
Язык(и): Русский
ПОЛИЛИНЕЙНЫЕ ПРОДОЛЖЕНИЯ НЕКОТОРЫХ ДИСКРЕТНЫХ ФУНКЦИЙ И АЛГОРИТМ ИХ НАХОЖДЕНИЯ

Исследована проблема существования и единственности полилинейных продолжений некоторых дискретных функций. Доказано, что для любой булевой функции существует соответствующее полилинейное продолжение и оно единственно. Предложен алгоритм нахождения полилинейного продолжения булевой функции и доказана его корректность. На основе предложенного алгоритма найдены явные формы полилинейных продолжений сначала для булевой функции, а затем для произвольной функции, определенной на множестве вершин n-мерного единичного куба, произвольного куба и параллелепипеда, и в каждом конкретном случае доказана единственность соответствующего полилинейного продолжения.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Баротов Достонжон
Язык(и): Русский