Нейросетей, создающих изображения, сегодня довольно много. К их числу принадлежит и Kandinsky – передовая система генерации визуального контента, доступ к которой предоставляется компанией Сбер. Она известна тем, что способна создавать оригинальные, высококачественные визуальные работы на основе текстовых описаний, предоставленных ей пользователем. Каким же образом работает эта модель, и как с ее помощью создавать изображения? Попробуем разобраться.
Как работать с моделью
Процесс работы с Kandinsky довольно простой. Пользователь вводит текстовое описание того, что он хочет видеть на изображении, а нейросеть интерпретирует это описание и генерирует соответствующую картинку. Kandinsky обладает широким спектром возможностей – с его помощью можно создавать и реалистичные объекты, и абстрактные изображения в различных стилях.
Испытать возможности нейросети можно посредством следующих вариантов:
- На портале https://fusionbrain.ai.
- При помощи Телеграм-бота.
- Посредством бота, доступного в социальной сети Вконтакте.
- На портале https://rudalle.ru/kandinsky22.
- Пользователи голосового помощника “Салют” могут сделать это, активировав опцию “Включи художника”.
Примеры работ, сгенерированных нейросетью
Для того, чтобы испытать возможности обозреваемой модели искусственного интеллекта, сначала мы воспользовались порталом fusionbrain.ai. На скриншоте ниже вы можете увидеть, как выглядит страница, на которой, собственно, и происходит генерация изображения:
Для начала мы попросили нейросеть сделать довольно простую работу; промпт был таким: “Нарисуй пейзаж с морским побережьем на фоне заходящего солнца”. Генерация картинки происходила довольно долго – несколько минут мы ожидали, пока, наконец, на экране не появилось созданное ИИ изображение:
Качество картинки – вполне приемлемое. Кстати, как и во многих других нейросетях, предназначенных для создания изображений, в модели Kandinsky имеется возможность и выбора определенного художественного стиля, в котором будет создаваться картинка. Опция доступна в нижней панели – вкладка выбора стиля располагается там же, где пользователь вводит и промпт. Не меняя запрос, мы попросили Kandinsky сгенерировать такое же изображение, но теперь – в стиле Айвазовского. Результат тоже получился достаточно интересным:
А вот по запросу “Маленький красивый пудель играет белого цвета весело играет на поле, покрытом цветами маков и одуванчиков” нейросеть забыла дорисовать собаке лапу:
Как сгенерировать видео
Кстати, при помощи модели (как в Телеграм-боте, так и, к примеру, на странице https://fusionbrain.ai) также можно генерировать видео или анимацию. Генерация также происходит при помощи текстовых запросов; пользователю доступны настройки высоты и ширины кадра, последовательности сцен и пр. Ниже можно увидеть, как выглядит панель управления на странице создания видео:
Генерация изображения через Телеграм
Как отмечают немало пользователей данной нейросети, быстрее всего она создает картинки посредством Телеграм-бота. Для того чтобы в этом убедиться (или опровергнуть эту оценку), мы решили воспользоваться данным ботом:
В этот раз мы решили сделать промпт более детальным: “Уютная сельская деревушка, утопающая в зелени. Старые деревянные дома с резными наличниками, мощеные улочки, фруктовые сады, пруды с лебедями и жителей, занятых повседневными делами. Создать ощущение спокойствия и гармонии с природой”.
После отправки промпта в Телеграм-чате открывается выбор дополнительных опций, согласно котором будет происходить генерация изображения. Например, можно выбрать соотношение сторон, стиль и пр.:
Довольно-таки неплохо. Но какое же изображение создал для нас бот? Давайте посмотрим:
Качество картинки – среднее для нейросети, но и дефектов немало имеется (например, нейросеть не смогла сгенерировать без ошибок белого лебедя и других птиц). Кстати, и длительность создания изображения была не такой уж короткой. В боте указывалось, что ему на генерацию потребуется 10 секунд; на деле картинку пришлось ожидать намного дольше.
Далее мы попросили бота создать еще одно изображение. На сей раз – по запросу “Фантастический инопланетный пейзаж. Причудливые горные формы, парящие острова, светящиеся водоемы, странные растения и силуэты инопланетных существ в дымке. Создать ощущение загадочности и инопланетной атмосферы”.
Мы выбрали соотношение сторон 16:9, а также другой стиль – “Цифровая живопись”. На выходе в этот раз получилось несколько устрашающее изображение:
Каков вердикт? По мнению экспертов портала Creator Project, нейросеть Kandinsky будет полезной каждому, кому требуется генерировать картинки для работы или творчества. Несмотря на недостатки в работе, данная нейросеть удобна, имеет широкий горизонт применения, а также доступна в России. Все это делает ее довольно неплохим выбором среди конкурентов.