За короткое время графические нейронные сети превратились из развлечения для гиков в рабочий инструмент для иллюстраторов и контент-менеджеров. Всё труднее отличить изображения, созданные машиной, от нарисованных художниками. Нейросети могут помочь создать изображения для блогов, контента в соцсетях, NFT и многого другого.
В этой статье мы вместе поисследуем, как нейросети генерируют изображения, где это можно применить, а также протестируем разные сервисы для создания картинок.
Что такое нейросети
Нейронная сеть — это набор алгоритмов, имитирующих работу человеческого мозга. Как и наш мозг, нейросеть распознаёт взаимосвязи между огромными объёмами данных. Она может накапливать знания и применять их на практике.
Нейронная сеть представляет собой систему из множества процессоров (аналогов нейронов в мозге). Простые по отдельности эти процессоры соединены в огромную сложную систему. Однажды запрограммированные или обученные, дальше нейросети учатся сами по себе. Благодаря этому они способны выполнять сложные задачи: собирать информацию, анализировать её или даже создавать новые данные. Сегодня нейросети могут классифицировать информацию, группировать данные и прогнозировать результаты.
Чтобы нейросеть могла всё это делать, сначала её необходимо обучить. Например, в случае создания картинки по тексту ей «показывают» текст и изображение. По сути, таким образом ей объясняют — это дом, а это дерево. Ведь для того чтобы генерировать новые изображения лиц, компьютер должен понимать, что такое лицо.
Разработкой нейросетей занимаются специалисты по искусственному интеллекту и машинному/глубокому обучению (Machine Learning и Deep Learning). Таких специалистов пока ещё немного, а востребованность их высока, ведь нейросети сегодня генерируют не только картинки.
Вы наверняка слышали о программах, которые могут преобразовывать речь в текст или распознавать лица. В их основе как раз лежит работа нейросетей.
Первая в мире обложка журнала, разработанная нейросетью DALL-E 2. Источник: cosmopolitan.com
В жизни искусственные нейронные сети можно использовать разными способами: в финансовых услугах, маркетинговых исследованиях, оценке рисков, развлекательной индустрии. Вот лишь несколько примеров практического применения нейросетей.
- Приложение FaceApp, показывающее, как человек будет выглядеть через какое-то количество лет.
- «Умные» плейлисты, например, Яндекс.Музыка или Spotify, которые делают уникальные подборки музыки на основе ваших интересов.
- Прогнозирование погоды — специальные алгоритмы на основе нейронных сетей предсказывают метеорологические изменения с точностью до минуты.
- Поиск в Google, Яндексе и любом другом сервисе — это большое количество алгоритмов, многие из которых основаны на нейросетях.
Нейросети ускоряют рутинную работу: классифицируют изображения, генерируют и классифицируют тексты и даже пишут музыку. Они также хорошо зарекомендовали себя для решения задач на основе визуальных данных.
Картинки от нейросетей используют для развлечения, соцсетей, сайтов, рекламы и в графическом дизайне, чтобы быстро накидать референсы или получить вдохновение. Пока ещё нейросети не научились работать с правками вроде «сделай шрифт крупнее» или «замени цвет фона с #F8F8FF на #F0F8FF». Поэтому ручной труд дизайнера по-прежнему в цене. Ниже приводим несколько курсов для тех, кто хочет создавать визуальный контент.
Пробуем рисовать картинку нейросетью: обзор сервисов
Мы подобрали и опробовали несколько онлайн-сервисов, которые работают на основе нейронных сетей и могут создавать разные изображения. Некоторые приложения бесплатны и доступны всем желающим. Посмотрите вместе с нами, как нейросеть рисует по словам онлайн бесплатно и попробуйте сами. Только осторожно, можно залипнуть на весь день!
Midjourney.com
Сайт midjourney.com
Популярный сервис, который генерирует практически любые картинки по текстовому описанию. Работает только в формате бота в Discord.
Плюсы:
- платформа с открытым доступом,
- изображения получаются в хорошем разрешении,
- высокая детализация картинок.
Минусы:
- ограничение в 25 бесплатных генераций, после нужно оформлять платную подписку.
Где работает: в форме бота в популярном среди геймеров мессенджере Discord.
Условия использования. Первые 25 генераций картинок бесплатные, затем нужно оформлять платную подписку. 200 попыток генерации изображения в месяц — 10$, безлимитный тариф — 30$. К сожалению, с российских карт оплатить подписку нельзя.
Как пользоваться. Сначала заходим на сервер Midjourney в Discord и присоединяемся к каналу. Если у вас нет учётной записи в этом сервисе, её нужно будет создать. Затем выбираем в меню слева один из чатов newbies и пишем в чате /imagine. Появляется плашка prompt.
После плашки вбиваем запрос на английском языке. Можно писать всё что угодно, кроме явно запрещённых вещей. Мы написали запрос «samurai dog on the streets of new york». Нажимаем «отправить».
Важно: в чат одновременно поступают десятки запросов от пользователей, поэтому уследить за своим может быть сложно. Если успеете, увидите, как нейросеть рисует ваш арт. В любом случае бот присылает в чат готовое изображение через несколько секунд. Найти готовое изображение можно в папке уведомлений в виде конверта, которая находится справа сверху.
Вот что получилось по нашему запросу.
Картинка по запросу «samurai dog on the streets of new york», сгенерированная Midjourney
Теперь сделаем более детализированный запрос: «A black french bulldog wearing a in formal suit and glasses, close-up photo,cinematic light, hyper realistic, 3d rendering, character design,25mm + extremely detailed + ultra-realistic, soft shadows + photorealistic skin». Изображение получилось таким.
Подробный запрос на Midjourney даёт детализированное изображение
Crayon (бывшая Dall-E mini)
Сайт craiyon.com
Сервис Crayon — это бывший сайт Dall-E mini, который, в свою очередь, был упрощённой версией нейросети Dall-E 2. Dall-E 2 — самая продвинутая нейросеть по генерации изображений на основе текста, но к ней нет свободного доступа. Зато Crayon — совершенно открытый и бесплатный сервис.
Плюсы:
- бесплатный и открытый сервис,
- простой интерфейс.
Минусы:
- изображения получаются низкого разрешения,
- невысокая детализация.
Где работает: сервис работает на сайте craiyon.com и через телеграм-бот.
Условия использования: полностью бесплатный и без регистрации.
Как пользоваться. На сайте не нужно авторизовываться и что-то настраивать, достаточно сформулировать запрос на английском и нажать на кнопку. Простой запрос «samurai dog on the streets of new york» дал не самый вдохновляющий результат.
Изображение по запросу «samurai dog on the streets of new york» в Crayon
Но, например, марсианский пейзаж по описанию «martian landscape, cinematic light, 3d rendering, extremely detailed, ultra-realistic» получился довольно реалистичным.
Марсианский пейзаж, нарисованный в Crayon. Качество картинки зависит не только от нейросети, но и от текстового описания.
ruDALL-E
Сайт rudalle.ru
Генератор изображений по текстовому описанию и проект команды Sber AI, SberDevices, Самарского университета, AIRI и SberCloud. Качество изображений уступает тому же Midjourney, зато можно написать текстовый запрос на русском языке.
Плюсы:
- бесплатный и открытый сервис,
- простой интерфейс,
- работает с запросами на русском языке,
- в приложении можно сделать голосовой запрос.
Минусы:
- время ожидания на сайте и в приложении 5–6 минут и больше,
- изображения лишь частично соответствуют запросу.
Где работает: в приложении Салют, в боте в Discord и на сайте.
Условия использования: полностью бесплатный и без регистрации на сайте, в приложении нужно залогиниться под своим персональным Сбер ID.
Как использовать. Старая модель ruDALL-E по запросу «корова на летнем поле, иллюстрация, высокое качество», выдала следующий рисунок.
Картинка по запросу в rudalle.ru
В приложении «Салют», которое использует обновлённую модель ruDALL-E Kandinsky и голосового помощника, время ожидания составило ещё больше, около 7 минут. По тому же запросу про корову изображение получилось такое. Вы видите корову? И мы нет.
Рисунок нейросети в приложении «Салют» по запросу «корова на летнем поле, иллюстрация, высокое качество». Иногда нейросеть не слишком хорошо отражает запрос.
Starryai
Сайт create.starryai.com
Сервис создаёт изображения на основе текстовых описаний и позиционируется как нейросеть для генерации NFT. Приложение работает на основе трёх алгоритмов: Altair рисует фантазийные, сказочные картинки, Orion — более реалистичные и сложные, Argo задуман для создания художественных и продуктовых рендеров.
Плюсы:
- бесплатный и открытый сервис,
- простой интерфейс с удобными настройками.
Минусы:
- есть ограничение в виде системы кредитов.
Где работает: на сайте.
Условия использования. Используется система кредитов, одна генерация — один кредит. Изначально пользователь получает 5 кредитов. Их также можно купить и заработать, например, посмотрев рекламу или поделившись своим артом в соцсетях.
Как использовать. В настройках сайта можно выбрать желаемый стиль изображения и загрузить картинку-референс. Также можно задать соотношение сторон готового изображения и время выполнения (чем дольше, тем качественнее готовая картинка и тем больше спишут кредитов). В день можно создавать до пяти изображений бесплатно.
Мы выбрали режим Altair и вбили запрос «Sunset At Sea, National Geographic Photo, Painting, Complex, Golden Hour, Landscape, Mysterious». Получилось симпатично.
Изображения морского заката, полученные на Starryai
WomboArt
Сайт и приложение для создания картинок и артов по заданной теме. В настройках сервиса можно выбрать художественный стиль и загрузить референс.
Плюсы:
- бесплатный и открытый сервис,
- простой интерфейс,
- большой выбор стилей.
Минусы:
- нельзя выбрать размеры изображения,
- на изображение при скачивании добавляется водяной знак.
Где работает: на сайте и в приложении.
Условия использования: полностью бесплатный и без регистрации.
Как использовать. На сайте можно залогиниться, но это необязательно. В окне Prompt вбиваем текстовое описание на английском языке, у нас это будет «metal flower». Выбираем стиль realistic. Затем нажимаем Generate и ждём, пока нейросеть сгенерирует иллюстрацию. В конце можно сохранить картинку с помощью кнопки Save. Наш результат выглядит так.
«Metal flower» по версии WomboArt
Какие ещё нейросети можно попробовать
Сайты, где можно увидеть, как нейросети рисуют по словам, не ограничиваются нашей подборкой. Таких сервисов много и у всех есть свои особенности. Перечислим ещё несколько популярных.
- ThisPersonDoesNotExist — генератор реалистичных фотографий лиц людей, которых на самом деле не существует.
- Colorize.cc — сайт, где можно раскрасить чёрно-белое фото.
- DALL-E 2 — способна генерировать высококачественные изображения, считается одной из передовых нейросетей. В 2022 году к системе открыли доступ в некоторых странах (России в списке нет).
- GauGan 2 — генератор изображений ландшафтов, зданий.
- Nvidia InPainting — сайт для замены изображений или удаления ненужных деталей на фотографии.
Где и как использовать изображения от нейросетей
В качестве иллюстраций для блога. Такой визуальный контент получается полностью оригинальным и можно не беспокоиться об авторских правах на изображение. К тому же нейросети часто рисуют в подчёркнуто фантазийном стиле, что используют авторы фанфиков и разнообразных артов. Более реалистичные картинки можно использовать в соцсетях и на сайтах.
Арт в стиле фэнтези. Источник: vk.com/midjourney_app
Для ретуши фотографий. Нейросети могут удалить ненужные детали с фото, поменять фон, омолодить, состарить человека на фото и добавить цвет в чёрно-белое изображение.
Фото, отреставрированное с помощью нейросети. Источник: naukatehnika.com
Создать реалистичное изображение человеческого лица. Алгоритмы генерируют фотографии несуществующих людей из тысяч реальных изображений.
Пример фото, сгенерированного на сайте thispersondoesnotexist.com
Создать логотип. Есть онлайн-сервисы, которые генерируют уникальные логотипы, если пользователь задал название компании, сферу деятельности, указал референсы и цветовую гамму.
Пример логотипа, созданного на сайте looka.com