Кажется, еще вчера искусственный интеллект был чем-то из научной фантастики, а сегодня он пишет стихи, дипломы и рисует картины, которые побеждают на конкурсах. Откуда у бездушного алгоритма берется фантазия? Как набор математических формул понимает, что такое «кот» или «грусть», и почему слова на экране складываются в осмысленный текст, а не в абракадабру? На самом деле, никакой магии нет. Под капотом у этих систем скрываются колоссальные объемы данных и сложнейшая математика, которая научилась находить и воспроизводить закономерности нашего с вами мира. Это не сознание, а невероятно мощный инструмент для имитации творчества, основанный на статистике.
Чтобы понять, как это работает, не нужно быть программистом. Достаточно разобраться в базовых принципах. Если вам интересно не только пользоваться этими технологиями, но и понимать их суть, существует множество ресурсов, где сложные вещи объясняются простым языком. Например, на сайте https://shtruzel.ru/ можно найти подборки инструментов и обзоры, которые помогают ориентироваться в мире нейросетей и цифровых технологий.
Когда вы печатаете сообщение в телефоне, он предлагает следующее слово. Это простейшая языковая модель. Модели, которые пишут статьи, работают по тому же принципу, но в миллиардных масштабах.
Картинки рисуются иначе. Здесь работают две нейросети в паре, и этот процесс часто называют «дискриминаторно-генеративной сетью» (GAN).
Нейросеть — это не база данных с фактами, а система для создания правдоподобного контента.
Для текста: если в обучающих данных было много ошибок или противоречий, модель может их воспроизвести. Она не знает, что Земля круглая, она лишь знает, что слова «Земля», «круглая» и «вращается» часто встречаются рядом в научных текстах. Если её попросить придумать факт о планете Кеплер-186f, она сгенерирует правдоподобный, но вымышленный текст.
Для картинок: именно поэтому у людей на сгенерированных фото часто бывает по шесть пальцев или асимметричное лицо. Модель знает, что «пальцы» — это «палочки у ладони», но она не понимает анатомической логики их количества. Она просто рисует то, что статистически похоже на руку.
Обсудить
Комментарии