Китайская компания ByteDance представила новую модель искусственного интеллекта OmniHuman-1 для генерации видео с реалистичным изображением человека. Нейросеть способна превращать обычные фотографии и фрагменты аудиозаписи в видеоролики, на которых люди двигаются, жестикулируют и говорят.
OmniHuman-1 обучали на 19 000 часах видеоконтента из «нераскрытых источников».
Отмечается, что OmniHuman-1 способна создавать видео с любым соотношением сторон и пропорциями, успешно имитировать движения и жесты людей, что было значительной проблемой для других аналогичных ИИ.
Разработчики также показали примеры сгенерированных видео, на одном из которых Альберт Эйнштейн 23 секунды рассказывает о науке.
Источник: Naked Science

Главный редактор
Социальные сети:
Telegram: https://t.me/creatorproject_ru
VK: https://vk.com/novosti_ai
Дзен: https://dzen.ru/ainewscp
RuTube: https://rutube.ru/channel/58102633/
YouTube: https://www.youtube.com/@creatorproject_ru
TikTok: https://www.tiktok.com/@creatorproject_ru
Likee: AI News (@creatorproject)