Архив статей журнала

Что обычный человек должен понимать в работе генеративного искусственного интеллекта? Материалы конкурса «ТРИЗформашка-2024» (2024)

Выпуск: № 4, Том 23 (2024)

Авторы: Плаксин Михаил Александрович

В статье обсуждаются три базовые момента работы генеративных нейросетевых моделей (генеративного искусственного интеллекта): понятие «токен», вероятностный характер генерируемого ответа и понятие «большая модель», размер которой обеспечивает псевдоразумное поведение нейросетевых чат-ботов. Принципиально не обсуждаются вопросы реализации генеративных моделей, области и способы их применения.

Приводятся материалы конкурса «ТРИЗформашка-2024», который был посвящен нейросетевым моделям. Демонстрируется факт псевдоразумности генеративных моделей. Оказывается, модель, обученная на одной-единственной фразе «мама мыла раму» и использующая для генерации контекст из одной-единственной буквы, может иногда вести себя так, как будто она знает правила склонения в русском языке и способна изменять слово по падежам!

Понятие «токен» рассматривается применительно к генерации текстов, картинок и паролей. На базе «токенов» выстраивается практически полезная методика генерации паролей, сложных для разгадывания, но простых для воспроизведения (сложных для забывания).

Понятие «большая модель» представляется наглядно и доходчиво за счет «визуализации» его путем сопоставления с физическими величинами. (Если бы один параметр нейросети весил один грамм, то для ее перевозки потребовалось бы 200 грузовых поездов. Если бы он имел длину в один миллиметр, то нейросеть оборачивалась ба вокруг Земли по экватору 25 раз. Если бы на обучение по одному параметру требовалась одна секунда, то начинать обучать современную нейросеть надо было бы во времена кроманьонцев.)

Материалы будут полезны для изучения генеративного искусственного интеллекта в любом возрасте.

Сохранить в закладках

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.

Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.

Все права на товарные знаки принадлежат их законным владельцам!

Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.

Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.

Спасибо, понятно.

ИНФОРМАТИКА В ШКОЛЕ

Архив статей журнала