SCI Библиотека

SciNetwork библиотека — это централизованное хранилище научных материалов всего сообщества... ещё…

Результаты поиска: 7 док. (сбросить фильтры)
Статья: ПРИМЕНЕНИЕ ЛЕДЖ-КОЭФФИЦИЕНТА В ЗАДАЧЕ БИНАРНОЙ КЛАССИФИКАЦИИ БИОМЕДИЦИНСКИХ ДАННЫХ С ДНК-МИКРОЧИПОВ

В связи с развитием технологий, используемых в современных биомедицинских исследованиях, происходит увеличение объема информации, подлежащей анализу. Одним из актуальных примеров является класс задач бинарной классификации многомерных данных, полученных с ДНК-микрочипов [1, 2]. Такая информация представлена значениями числовых признаков, количество которых измеряется тысячами, что значительно увеличивает время анализа данных. Для качественного решения рассматриваемых задач классификации широко используются алгоритмы фильтрации, поскольку среди методов отбора признаков они являются наиболее вычислительно эффективными. Идея этого подхода состоит в выборе подмножества признаков, упорядоченных согласно некоторой заданной мере [3]. Однако, распространенные в настоящее время алгоритмы фильтрации не вполне сосредоточены на выявлении связи между числовым и бинарным признаками, свойственной рассматриваемым задачам. В связи с этим для ее оценивания в работе [4] был введен ледж-коэффициент корреляции, в статье [5] предложены алгоритмы по его вычислению, в работе [6] описан алгоритм фильтрации, основанный на применении ледж-коэффициента

Формат документа: pdf
Год публикации: 2020
Кол-во страниц: 1
Загрузил(а): БОЙКО ИЛЬЯ ЮРЬЕВИЧ
Язык(и): Русский
Доступ: Всем
Статья: ОБ ИЗУЧЕНИИ СИЛЫ СВЯЗИ БИНАРНЫХ ПОКАЗАТЕЛЕЙ

В работе получено точное распределение коллигативного коэффициента, ранее введенного автором для изучения силы связи между бинарными показателями в качестве альтернативы коэффициенту корреляции Пирсона, применение которого для бинарных показателей не всегда корректно. На основе этого распределения предложен новый статистический критерий, устанавливающий факт связи двух бинарных показателей. Описываются применения этого критерия к методам классификации данных и медицинским задачам дифференциальной диагностики.

Формат документа: pdf
Год публикации: 2021
Кол-во страниц: 1
Язык(и): Русский
Доступ: Всем
Статья: ИЕРАРХИЧЕСКАЯ КВАНТИФИКАЦИЯ КЛАСТЕРНОЙ ПЕРЕМЕННОЙ

В статье предлагается и обосновывается способ присвоения числовых меток (квантификация) кластерам, связанный с их построением на основе агломеративного кластерного алгоритма, рассматриваются проблемы, которые могут возникнуть при такой квантификации, в частности, возникновение числовых меток кластеров, значения которых противоречат их естественному порядку (инверсии). Предложен новый вариант алгоритма, при котором подобные инверсии не возникают.

Формат документа: pdf
Год публикации: 2021
Кол-во страниц: 1
Загрузил(а): Болгов А.В.
Язык(и): Русский
Доступ: Всем
Статья: ОСНОВНЫЕ РАНГОВЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ В ПРИКЛАДНЫХ ЗАДАЧАХ

Одной из важнейших задач любого исследования, связанного с многомерным анализом данных, является задача установления наличия и оценки степени связи между исследуемыми переменными. При изучении монотонных связей для их выявления и оценки силы чаще всего используют ранговые коэффициенты Спирмена и Кенделла. В работе исследованы соотношения этих коэффициентов между собой, а также с классическим коэффициентом корреляции Пирсона. Высказано несколько новых гипотез относительно этих коэффициентов, которые подтверждены полным перебором всех вариантов при некоторых небольших объемах выборки n, для осуществления которого написана компьютерная программа на языке Python.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Оборовская А.С.
Язык(и): Русский
Доступ: Всем
Статья: ПОШАГОВОЕ УЛУЧШЕНИЕ ВНУТРИКЛАСТЕРНОГО РАССЕИВАНИЯ

В работе детально описан алгоритм оптимизации кластерного разбиения. Критерием качества выбрано суммарное внутрикластерное рассеивание по всем вновь организуемым кластерам. Уменьшение этого рассеивание достигается направленным пошаговым перемещением отдельных объектов между кластерами. Алгоритм реализован в виде компьютерной программы. Приведены примеры его работы на реальных данных.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Язык(и): Русский
Доступ: Всем
Статья: НЕИТЕРАЦИОННЫЙ АЛГОРИТМ ВИЗУАЛИЗАЦИИ МНОГОМЕРНЫХ ДАННЫХ

В связи с появившейся сегодня возможностью обрабатывать большие объемы данных особое значение приобретает задача первоначального грубого анализа этих данных с целью сформулировать предварительные направления исследования и сделать прикидочное заключение о возможных его результатах. Обычно подобный анализ проводится путём изучения некоторых изображений, но, если данные имеют достаточно большую размерность, то построение изображений, адекватно отображающих структуру этих данных, представляет собой серьезную математическую задачу. В статье представлен новый алгоритм построения неискаженных изображений многомерных данных в случае, когда подобные изображения возможны.

Формат документа: pdf
Год публикации: 2023
Кол-во страниц: 1
Загрузил(а): Калинкин А.А.
Язык(и): Русский
Доступ: Всем
Статья: ГЕОМЕТРИЧЕСКИЙ ПОДХОД В POST-HOC ЗАДАЧЕ КЛАСТЕРНОГО АНАЛИЗА

В работе предложен единый подход к нескольким вариантам решения задачи о квантификации кластеров уже имеющегося кластерного разбиения конечного множества. В результате применения любого из предлагаемых подходов каждый кластер получает, вообще говоря, векторные метки. Для этого применяется методика, близкая к анализу латентных классов: каждый объект или каждый признак в рамках кластера отождествляется с некоторым вектором, а из полученных векторов геометрическим методами извлекается некая общая часть, вектор, в наибольшей степени близкий к каждому из построенных векторов. Этот вектор и объявляется меткой кластера.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Язык(и): Русский
Доступ: Всем