В данной статье описывается процесс реализации такого метода машинного обучения, как рекомендательная система; рассматривается построение коллаборативной рекомендательной системы, в основе которой лежит алгоритм сингулярного разложения или сингулярной декомпозиции матрицы. Описаны процесс сбора тестовых данных, их обработки, а также обучение модели и её оценка согласно некоторым метрикам.
Идентификаторы и классификаторы
- УДК
- 004.85. Обучение
Одним из инновационных подходов к построению коллаборативных рекомендательных систем является использование сингулярного разложения матрицы (Singular Value
Decomposition, SVD). Этот метод не только позволяет эффективно обрабатывать большие
объемы данных, но и обеспечивает высокую точность и персонализацию рекомендаций. В
данной статье мы рассмотрим основы построения коллаборативной рекомендательной системы на основе сингулярного разложения матрицы. Мы разберем ключевые концепции,
преимущества данного подхода и его практическое применение в создании интеллектуальных систем рекомендаций.
Список литературы
1. Рекомендательные системы на практике / пер. с англ. Д.М. Павлова. — М. : ДМК Пресс, 2020. — 448 с.
2. Ricci F. Recommender Systems Handbook. – New York : Springer New York Dordrecht Heidelberg London, 1979. – 845 p.
3. Habr : сайт. — URL: https://habr.com/ru/company/jetinfosystems/blog/453792/.
4. Habr : сайт. — URL: https://habr.com/ru/company/prequel/blog/567648/.
5. VK: cайт. — URL: https://dev.vk.com/reference.
6. Visual Studio Code: сайт. — URL: https://code.visualstudio.com/.
7. Retailer: сайт. — URL: https://retailrocket.ru/blog/shest-podhodov-k-rekomendatsiyam-tovarov-v-internet-magazine/.
8. Google Colab: cайт. — URL: https://colab.research.google.com/.
9. Jim Lambers. The SVD Algorithm. – 2010. – CME 335.
10. Логинов Н.В. Сингулярное разложение матриц. — М. : МГАПИ, 1996.
11. Гасников А.В. Современные численные методы оптимизации. Метод универсального градиентного спуска : учебное пособие. — М. : МФТИ, 2018. — 291 с.
12. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. — М. : Наука,1979. — 283 с.
13. SciPy Stats: cайт. — URL: https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html.
Выпуск
Другие статьи выпуска
Рассматривается возможность применения такого метода машинного обучения, как деревья решений, для определения метеорологической дальности видимости на основе других погодных показателей (температура воздуха, атмосферное давление, относительная влажность, скорость и направление ветра, облачность, текущая погода и др.). Описаны процесс сбора и обработки данных, а также обучение модели и её итоговая точностью.
Работа посвящена разработке веб-приложения для прогнозирования исходов спортивных событий, которое позволит оценить составленные программой проценты на исходы определенной подборки матчей по разным видам спорта.
Рассмотрена задача о движении внешней нагрузки с постоянной скоростью вдоль замороженного канала с неравномерным сжатием. Лед моделируется как тонкая вязкоупругая пластина постоянной толщины. Края пластины приморожены к стенкам канала. Прогиб ледового покрова описывается в рамках линейной теории упругости. Жидкость под пластиной невязкая и несжимаемая. Течение жидкости, вызванное прогибом пластины, является потенциальным. Внешняя нагрузка моделируется движущимся с постоянной скоростью распределением давления. Задача решается с помощью преобразования Фурье вдоль канала и методом нормальных мод для формы прогибов льда поперек канала. Основным параметром для исследования в данной модели является эффект неоднородного сжатия ледового покрова.
В работе рассматриваются и сравниваются некоторые методы составления прогноза, основанные на нечетких математических моделях, рассматриваются преимущества и недостатки того или иного метода.
Одной из важнейших задач любого исследования, связанного с многомерным анализом данных, является задача установления наличия и оценки степени связи между исследуемыми переменными. При изучении монотонных связей для их выявления и оценки силы чаще всего используют ранговые коэффициенты Спирмена и Кенделла. В работе исследованы соотношения этих коэффициентов между собой, а также с классическим коэффициентом корреляции Пирсона. Высказано несколько новых гипотез относительно этих коэффициентов, которые подтверждены полным перебором всех вариантов при некоторых небольших объемах выборки n, для осуществления которого написана компьютерная программа на языке Python.
В работе исследуется колебания упругой балки с переменной толщиной, находящейся в полном контакте с жидкостью (гидроупругие колебания) или при отсутствии жидкости (упругие колебания). Гидроупругие и упругие прогибы балки являются двумерными. Задача рассматривается без демпфирования колебаний и внешнего воздействия. Упругая балка тонкая, конечной длины, и с заданными краевыми условиями. Вычислены моды упругих и гидроупругих колебаний балки в случае линейной и кусочно-линейной толщины.
Работа посвящена созданию онлайн веб-приложения для ведения заметок, позволяющему пользователю выполнить автоматическое извлечение ключевых слов из текстов его заметок и на основании данного набора получить рекомендации о сотрудничестве с другими клиентами сервиса.
В работе детально описан алгоритм оптимизации кластерного разбиения. Критерием качества выбрано суммарное внутрикластерное рассеивание по всем вновь организуемым кластерам. Уменьшение этого рассеивание достигается направленным пошаговым перемещением отдельных объектов между кластерами. Алгоритм реализован в виде компьютерной программы. Приведены примеры его работы на реальных данных.
В связи с появившейся сегодня возможностью обрабатывать большие объемы данных особое значение приобретает задача первоначального грубого анализа этих данных с целью сформулировать предварительные направления исследования и сделать прикидочное заключение о возможных его результатах. Обычно подобный анализ проводится путём изучения некоторых изображений, но, если данные имеют достаточно большую размерность, то построение изображений, адекватно отображающих структуру этих данных, представляет собой серьезную математическую задачу. В статье представлен новый алгоритм построения неискаженных изображений многомерных данных в случае, когда подобные изображения возможны.
В работе рассматривается задача оптимизации выполнения проекта в плане согласования его стоимости и временных характеристик. Стоимостные и временные характеристики выражаются в стоимости дня реализации проекта в зависимости от затрат на его оснащённость. На основе модельной задачи разработан программный продукт для численных расчётов оптимальных параметров экономического проекта.
В статье приводится методика решения задачи адаптации технологии обоснования решений индивидов при выборе продолжительности рабочего времени к условиям локальных рынков труда Республики Узбекистан. В основе компьютерной технологии использована математическая модель оптимального выбора индивидами продолжительности рабочего времени с учетом личностной оценки привлекательности трудового процесса. Обоснование оптимальных стратегий активности работников в трудовых процессах выполнено с использованием компьютерной модели и социологических исследований.
В работе применительно к задачам нелинейного программирования исследуется класс функций штрафа, обладающих хорошими дифференциальными свойствами и в то же время приемлемым порядком стремления в бесконечность вне допустимой области. Для решения задач выпуклого программирования с означенным ниже классом штрафных функций имеют место достаточно строгие теоретические обоснования. Для ряда модельных задач осуществлено численное исследование.
В данном исследовании рассматриваются особенности проектирования окружения в проектах на основе технологий виртуальной реальности (VR) [1,2]. По сути каждый VR-проект позволяет реализовать некоторый сценарий поведения человека при взаимодействии с объектами в виртуальном окружении. В статье выделены основные вопросы, которые актуальны для гейм-дизайнеров при реализации VR-проектов.
В данной работе рассматривается игра двух лиц исследуемая с применением модели взаимодействия налоговой службы и налогоплательщика. Поиск наилучшего гарантированного результата, оптимального выбора стратегий и их интерпретация осуществляют решение иерархических игр. Исследование проводится методами математического и компьютерного моделирования.
В данной работе рассматриваются возможности и перспективы использования VR-технологий в образовательном процессе.
Данная статья представляет собой сравнение двух сред разработки приложений виртуальной реальности: Unity и Unreal Engine. В статье приводятся характеристикиданных платформ, их особенности.
В статье представлен обзор на возможности развития VR технологий и их ограничения с данными технологическими решениями.
В статье рассматривается пространственно-одномерная нестационарная задача антиплоского сдвига для линейно термоупругого материала (композита) с быстроосциллирующими физическими характеристиками. Частота осцилляций полагается пропорциональной безразмерной величине \varepsilon^{-1}. С помощью метода двухмасштабной сходимости Аллера - Нгуетсенга проводится предельный переход при стремлении частоты осцилляций к бесконечности, то есть при \varepsilon\to0+. В результате конструируется предельная усреднённая двухмасштабная модель динамики композита. Затем стандартным методом асимптотической декомпозиции разделяются масштабы и выводится предельная макроскопическая модель. Настоящая работа подтверждает результат о предельном режиме осцилляций, полученный Ж. Франкфором (1983) с использованием метода аналитической теории полугрупп. Главная новизна настоящей работы по отношению к исследованию Ж. Франкфора состоит в конструкции <<промежуточной>> двухмасштабной модели, а также в дополнительном учёте присутствия быстро осциллирующих внешних распределённых сил и источников тепла и наличия быстрых осцилляций в начальных данных задачи.
В данном исследовании обозначены краткосрочные и долгосрочные выгоды от разработки и применения обучающих VR-тренажёров в вузе. Представлены перспективы использования виртуального образовательного контента для обучения студентов.
В статье рассмотрены базовые определения технологий виртуальной реальности. Работа содержит описание видов шлемов виртуальной реальности и их особенности, а также возможности применения технологий виртуальной реальности в образовательном процессе.
В данной статье рассматриваются вопросы использования инструментов библиотеки XR Socket Interactor. Возможности библиотеки позволяет реализовать механизмы закрепления объектов в сокеты и их последующее извлечение. Такие инструменты используются в проектах виртуальной реальности, где требуется точное позиционирование и манипулирование объектами.
Г.Г. Михайличенко дается определение физической структуры ранга (3,2). Им же доказывается, что эта физическая структура локально эквивалентна дважды точнотранзитивному действию группы Ли в пространстве R^n. В.А. Кыровым были найдены алгебры Ли некоторых таких действий в R^3 с подгруппами параллельных переносов. В данной статье находятся локальные дважды точно транзитивные действия для трёх ранее найденных алгебр Ли. При решении этой задачи сначала интегрированием уравнений Ли найдены однопараметрические подгруппы, а затем, вычислены их композиции искомые действия.
В работе построено гауссово изображение нескольких кривых третьего порядка: декартова листа, циссоиды, строфоиды и трисектриссы Маклорена. Построение быловыполнено с помощью программы, написанной в СКМ SageMath.
В статье приводятся решения функциональных уравнений от функций многих переменных: Йенсена, Коши (четырјх типов), Лобачевского. Это стало возможным благодаря конструкции мультифункций и использованию критерия линейности функции многих переменных, полученных автором ранее.
Работа посвящена изучению преобразования Бэклунд-Бианки для поверхностей вращения постоянной отрицательной гауссовой кривизны. Поверхности вращения постоянной отрицательной гауссовой кривизны - это волчок Миндинга, катушка Миндинга, псевдосфера (поверхность Бельтрами). Используя математический пакет, строятся псевдосфера, волчок Миндинга, катушка Миндинга и их преобразования Бианки.
В статье представлена модификация известной модели оптимального выбора индивидами продолжительности рабочего времени с учетом личностной оценки привлекательности трудового процесса. Предложена уточненная функция потребительского выбора и способы идентификации ее параметров. Исследование оптимальных стратегий активности работников в трудовых процессах выполнено методами математического и компьютерного моделирования.
В настоящей работе рассмотрен вариант задачи анфолдинга, в которой положение части объектов (целей) уже известно, и требуется локализовать только наблюдателей - оставшуюся часть множества объектов. Предлагается процесс заполнения пропущенных позиций матрицы различий реализовать через построение промежуточной визуализации в искусственном пространстве изображений с точным соблюдением всех заданных изначально расстояний. При этом оказывается, что для того, чтобысделать построение промежуточной визуализации простым и, желательно, однозначным, достаточно подобрать подходящую размерность пространства изображений. Если возможность неоднозначного построения, тем не менее, будет не полностью исключена, то она окажется сведенной к небольшому количеству возможных вариантов.После построения каждого из допустимых вариантов промежуточной визуализации недостающие в исходных данных различия уже вычисляются, и есть возможностьзаполнить матрицу различий целиком. Выбор из набора потенциальных вариантов заполнения матрицы можно затем осуществить путем их перебора.
Издательство
- Издательство
- АлтГУ
- Регион
- Россия, Барнаул
- Почтовый адрес
- 656049, Алтайский край, город Барнаул, проспект Ленина, дом 61
- Юр. адрес
- 656049, Алтайский край, город Барнаул, проспект Ленина, дом 61
- ФИО
- Бочаров Сергей Николаевич (Руководитель)
- E-mail адрес
- rector@asu.ru
- Контактный телефон
- +7 (385) 2291291
- Сайт
- https://www.asu.ru/