Google заявила, что вскоре позволит пользователям создавать изображения людей с помощью своего инструмента искусственного интеллекта Gemini. Это заявление последовало за тем, как в феврале компания убрала инструмент генерации изображений на основе ИИ.
В блоге Дэйв Ситрон, старший директор по продукту Gemini, сообщил, что ранний доступ к новому генератору Imagen 3 от Google будет доступен пользователям Gemini Advanced, Business и Enterprise на английском языке в ближайшие дни.
«Мы работали над техническим усовершенствованием продукта, а также улучшением оценочных наборов, проведением упражнений по выявлению уязвимостей и формулированием четких принципов продукта», — написал Ситрон.
Google приостановила функцию генерации изображений в начале этого года, указав, что она выдает «неточности» в исторических изображениях.
Неудачные примеры широко разошлись по социальным сетям. Один пользователь попросил инструмент создать изображение немецкого солдата 1943 года, в результате чего был создан расово разнообразный набор солдат в немецкой военной форме. Другой запрос на историческое изображение средневекового британского короля также сгенерировал расово разнообразные изображения, включая правительницу женщину.
Ситрон отметил, что Imagen 3 не поддерживает фотореалистичные изображения идентифицируемых лиц, изображения несовершеннолетних, а также чрезмерно кровавые, жестокие или сексуальные сцены.
«Конечно, как и с любым инструментом генеративного ИИ, не каждое изображение, сгенерированное Gemini, будет идеальным, но мы будем продолжать прислушиваться к отзывам от первых пользователей, пока продолжаем совершенствовать продукт, – написал Ситрон. – Мы будем постепенно расширять доступ, стремясь довести его до большего числа пользователей и языков в ближайшее время».
Источник: NBC News