Иллюстрации созданы нейросетями
Одной из самых хайповых научно-популярных тем нынче постепенно становится искусственный интеллект. Вслед за развитием компьютерных технологий именно ИИ выдвигается в самый авангард прогресса. Нейросети — это программные модели, созданные для имитации работы человеческого мозга. Они способны обрабатывать большие объемы данных, распознавать образы, самостоятельно делать прогнозы и принимать решения. В частности, писать большие уникальные тексты по короткому запросу. Насколько хорошо у них это получается — судить вам. Одну из частей этой статьи написала нейросеть. Сможете угадать, какую?
Рождение электронного разума
Истоки искусственного интеллекта уходят в глубокое (уже) прошлое. Идеи, лежащие в их основе, возникли еще в 1940-х годах. Одним из пионеров стал Уоррен Маккаллок, который вместе с Уолтером Питтсом создал модель нейрона — базового элемента нейросетей. В 1949 году Дональд Хебб в своей книге «Организация поведения: нейропсихологическая теория» описал правило, которое объясняло, как нейроны могут укреплять связи между собой. Это открытие стало основой для развития идеи обучения нейронных сетей.
Однако прорыв произошел только в 1980-х годах, когда появились алгоритмы обратного распространения ошибки (о них мы поговорим чуть позже), а также появились быстрые компьютеры, способные обрабатывать большие объемы данных. Одним из знаменитых примеров стал проект ALVINN (Autonomous Land Vehicle in a Neural Network) — нейронная сеть, способная распознавать дорогу и управлять автомобилем без вмешательства человека.
В 1990-х интерес к нейросетям уменьшился, но к началу 2000-х они вновь привлекли внимание научного сообщества. Одним из примеров достижений в этот период является создание нейронной сети LeNet-5 Яна Лекуна, которая умела распознавать цифры по их рукописному написанию.
Нейросети работают на основе принципа обработки информации, который называется искусственные нейроны. Это математические модели, которые имитируют работу нервных клеток в мозге человека. Они получают входные данные, обрабатывают их и передают результаты дальше по сети — точно так же, как это происходит в разуме.
Но как именно они учатся и генерируют уникальный контент? Конечно, с помощью упорных тренировок. Специалисты разрабатывают особые алгоритмы и создают большой набор данных, на основе которых ИИ будет обучаться. Этот набор содержит информацию о различных образах и шаблонах, на основе которых программа делает свои выводы и генерирует контент. Во время тренировки в такую систему подаются входные данные, и они проходят через несколько этапов обработки, на каждом из которых нейросеть сравнивает полученные данные с ожидаемыми результатами и корректирует свои параметры (так называемые веса), чтобы приблизиться к правильному ответу. Затем специалисты оценивают результаты, и эти оценки отправляются обратно по цепочке, выравнивая работу всех искусственных нейронов, принявших участие в работе. Такой процесс называется обратным распространением ошибки и является ключевым для обучения нейросети.
Представьте, что вы хотите создать нейросеть, которая научится распознавать изображения кошек. Вы начинаете с набора изображений с кошками, а также таких, на которых усатых-хвостатых нет и в помине. Вы подаете эти изображения на вход системы, и она начинает их анализировать. Когда она обрабатывает картинки, каждый нейрон отвечает за распознавание определенных признаков, таких как уши, глаза, морда или усы. Комбинируя результаты работы всех нейронов, нейросеть принимает решение о том, является изображение кошкой или нет. Она сама находит особенности и закономерности в изображениях и предлагает свои ответы. Каждый раз, когда вы соглашаетесь с результатом или указываете на ошибку, нейросеть меняет настройки, учитывает полученную информацию и начинает еще точнее отличать кошек от всего, что ими не является.
Если вы хотите, чтобы нейросеть создавала тексты, ей нужно предоставить большой объем литературы — например, книги разных авторов. Программа проанализирует их и найдет закономерности в структуре предложений, выборе слов и тематике текстов. Затем она будет использовать свои знания, полученные во время обучения, для создания новых комбинаций слов и предложений, соответствующих запросу. Аналогично, для создания музыки, изображений или видео нейросеть комбинирует и модифицирует уже изученные образцы, чтобы создать что-то уникальное.
Смотри, как я умею!
Сегодня нейросети достигли невероятных результатов в самых различных областях.
Начнем с создания текстов. GPT-3 (Generative Pre-trained Transformer 3), разработанная компанией OpenAI, способна генерировать тексты, прекрасно имитирующие человеческую речь. GPT-3 обучена на огромном объеме текстов из Интернета, что позволяет ей создавать статьи, новости, рассказы и даже коды программ. Некоторые недостатки были исправлены в более продвинутой версии ChatGPT. Новая нейросеть способна запоминать историю разговора с пользователем и тем самым учитывать контекст во время длительного общения.
И, конечно, благодаря этим технологиям намного упростилась процедура перевода текстов на разные языки. Робот-гуманоид Амека, недавно считавшийся наиболее продвинутым в плане подражания человеку, после интеграции нейросети стал говорить на нескольких языках и обладать сверхчеловеческими лингвистическими способностями.
Теперь об изображениях: вот где нейросети стали настоящими звездами. Они научились обрабатывать и редактировать фотографии, улучшать качество (выполнять так называемый upscaling), удалять шумы и даже изменять фон за главным объектом на изображении. Как и в предыдущих примерах, они уже умеют определять повторяющиеся паттерны и генерировать иллюстрации по текстовому описанию. Одним из лучших представителей данного жанра стала нейросеть DALL-E 2. На самом деле она включает в себя целых три отдельных системы, работающих в тандеме. Первая содержит в себе огромную базу взаимосвязанных пар «текст плюс картинка». Вторая генерирует маленькое изображение по текстовому запросу, постоянно обращаясь к первой, чтобы та проверила, угадываются ли в созданном изображении образы, заданные при запросе. Третья же завершает работу, увеличивая итоговое изображение до приемлемого размера. Результат порой поражает воображение. Если в запросе указать имя знаменитого художника, не исключено, что итог будет неотличим от других работ желаемого автора.
В синергии этих алгоритмов уже рождаются интересные результаты. В апреле этого года Сбер и РБК выпустили газету, используя GigaChat и Kandinsky 2.1. Редакция подготовила шесть тематических материалов, дополненных работами текстовой нейросети, а эксперты Сбера собрали эти материалы в единую композицию и нарисовали иллюстрации с помощью другой нейросети.
Переходим к созданию музыки. В музыкальной сфере современные технологии тоже могут создавать оригинальные композиции. Это открывает новые возможности для музыкантов и композиторов, помогая им в поисках свежих идей. ИИ под названием Magenta, разработанная Google Brain, способна генерировать отдельные мелодии и целые музыкальные композиции. Она обучена на большом количестве музыкальных произведений и может создавать мелодии в различных жанрах от классической музыки до электронной.
Наконец, видео. Думаю, вы уже догадались, что здесь нейросетям тоже нашлась работа, ведь видео — не что иное, как двигающееся изображение со звуком. Нет, они пока не способны создавать полноценные фильмы, неотличимые от тех, что сняли люди. Но уже могут анализировать видеоролики, распознавать в них объекты, людей и события. Им активно находят применение в системах видеонаблюдения для автоматического распознавании лиц. А совсем недавно компания Flawless выпустила инструмент, заменяющий движения губ на экране в зависимости от языка озвучки.
Трудности воспитания
Неудивительно, что в связи с ростом популярности нейросетей человечество все чаще сталкивается с этическими дилеммами, связанных с их использованием. Например, в 2018 году произошел скандал с компанией Cambridge Analytica. Тогда данные миллионов пользователей Фейсбука (запрещен в РФ) были незаконно использованы для манипуляции политическими процессами. Этот случай вызвал серьезные вопросы о том, какие данные могут собираться для обучения сетей без ведома их владельцев.
Еще одним этическим аспектом является систематическое искажение результатов из-за некорректных или предвзятых данных, на которых нейросети обучаются. Например, в 2015 году программа «Майкрософта» под названием «Tay» (Тэй) была запущена в Твиттере (запрещен в РФ) для общения с пользователями. Однако вскоре, натренировавшись в общении с реальными людьми, она начала выражать расистские и оскорбительные взгляды. Это яркий пример того, как нейросети могут отражать предвзятость и прочие негативные аспекты современного общества.
Также стоит обсудить вопрос использования искусственного интеллекта в военных целях. Например, автономные военные дроны, основанные на нейросетевых алгоритмах, могут вызывать опасения относительно этичности использования. Возможность принятия решений о жизни и смерти без непосредственного участия человека поднимает серьезные вопросы морали и ответственности. А в прошлом году, используя платформу искусственного интеллекта MegaSyn, американская компания Collaborations Pharmaceuticals разработала список химически опасных соединений, включая запрещенное ООН нервно-паралитическое вещество VX, что вызвало беспокойство ученых из-за потенциального использования таких разработок террористами.
Кроме того, нейросети вызывают тревогу в отношении рабочих мест. Некоторые отрасли, такие как автоматизированный сбор данных и самообучающиеся системы, могут заменить человеческий труд, что приведет к социальным и экономическим проблемам. С появлением ИИ, генерирующего изображения, многие шутили о том, что вскоре художники могут оказаться без работы. В самом деле, многие компании сейчас предпочитают пользоваться автоматизированными системами для подобных задач, что ускоряет работу и сокращает расходы, но закономерно лишает множества людей работы. Более того, современные нейросети способны писать программный код, что также ставит под угрозу работников в сфере IT.
Неудивительно, что в начале этого года более тысячи ученых и технологов, включая Илона Маска и Стива Возняка, опубликовали открытое письмо с призывом приостановить разработку искусственного интеллекта, ссылаясь на риск для человечества. Впрочем, вряд ли это всерьез замедлит неумолимый прогресс.
Магия вне Хогвартса
Достижения современных разработок в области нейросетей находят широкое применение в различных отраслях. Одна из областей, где уже произошел значительный прорыв, — медицина. Например, искусственный интеллект может помочь в диагностике и прогнозировании заболеваний. Некоторые из них уже показывают высокую точность в распознавании раковых клеток на ранних стадиях, что позволяет начать лечение раньше и повышает шансы на полное выздоровление. Также нейросети могут помочь в персонализированной медицине, предсказывая реакцию пациента на определенные лекарственные препараты и помогая в подборе оптимальной терапии. Небезызвестна история пользователя Твиттера (запрещен в РФ) по имени Купер, собака которого страдала от какой-то болезни. Купер предоставил результаты анализов нейросети ChatGPT и рассказал ей о симптомах. Искусственный интеллект выдал список возможных заболеваний и после исключения нескольких проверенных специалистами инфекций осталось единственно верное решение. На приеме у ветеринара диагноз, поставленный нейросетью, подтвердился. Собаке назначили правильное лечение, и она пошла на поправку.
Еще одной областью, где ИИ принесет большие изменения, является автономная транспортная система. Компания «Тесла» уже давно использует искусственный интеллект для обработки данных от своих автопилотов, что позволяет им становиться все более безопасными в использовании. Убер и Яндекс также активно исследуют и разрабатывают нейросетевые системы для самоуправляемых автомобилей. Это может привести к уменьшению аварий, а также к тому, что однажды профессия «водитель» может кануть в лету.
Нейросети также могут применяться в области финансов, чтобы анализировать рынки и прогнозировать тренды. Они могут быть использованы в робототехнике, игровой индустрии, энергетике и многих других областях, где требуется обработка больших объемов данных и принятие сложных решений. Голосовые помощники умных устройств все чаще используют нейросетевые алгоритмы обработки речи для понимания намерений пользователя. Все это — лишь несколько примеров из множества областей, в которых нейросети уже упрощают и обогащают нашу жизнь, делая возможным то, что еще вчера казалось недоступным благом.
Нейросети — это захватывающая область науки и технологий, которая меняет наш мир. Их возможности и сферы применения постоянно расширяются, открывая новые горизонты для инноваций и прогресса. Они становятся неотъемлемой частью нашей жизни, и нам остается только с нетерпением ждать, что они принесут человечеству в будущем.
***
Вам удалось понять, какая часть этого текста написана нейросетью?
Боюсь огорчить (или обрадовать?), но на самом деле ИИ создал всю статью целиком.
Да, пришлось хорошенько отредактировать все предложения, проверить факты на достоверность (искусственный интеллект умеет очень правдоподобно врать) и добавить информацию о совсем недавних достижениях. Но, согласитесь, его работа и без того заставляет удивиться. Может, совсем скоро программы научатся полностью обходиться без вмешательства людей. Только Бог знает, как тогда будет выглядеть завтрашний день.
Статья была опубликована в журнале «Человек и мир. Диалог», № 3(12), июль – сентябрь 2023 г.