Архив статей журнала
Одной из важнейших задач любого исследования, связанного с многомерным анализом данных, является задача установления наличия и оценки степени связи между исследуемыми переменными. При изучении монотонных связей для их выявления и оценки силы чаще всего используют ранговые коэффициенты Спирмена и Кенделла. В работе исследованы соотношения этих коэффициентов между собой, а также с классическим коэффициентом корреляции Пирсона. Высказано несколько новых гипотез относительно этих коэффициентов, которые подтверждены полным перебором всех вариантов при некоторых небольших объемах выборки n, для осуществления которого написана компьютерная программа на языке Python.
В работе детально описан алгоритм оптимизации кластерного разбиения. Критерием качества выбрано суммарное внутрикластерное рассеивание по всем вновь организуемым кластерам. Уменьшение этого рассеивание достигается направленным пошаговым перемещением отдельных объектов между кластерами. Алгоритм реализован в виде компьютерной программы. Приведены примеры его работы на реальных данных.
В связи с появившейся сегодня возможностью обрабатывать большие объемы данных особое значение приобретает задача первоначального грубого анализа этих данных с целью сформулировать предварительные направления исследования и сделать прикидочное заключение о возможных его результатах. Обычно подобный анализ проводится путём изучения некоторых изображений, но, если данные имеют достаточно большую размерность, то построение изображений, адекватно отображающих структуру этих данных, представляет собой серьезную математическую задачу. В статье представлен новый алгоритм построения неискаженных изображений многомерных данных в случае, когда подобные изображения возможны.