Китайская компания ByteDance представила новую модель искусственного интеллекта OmniHuman-1 для генерации видео с реалистичным изображением человека. Нейросеть способна превращать обычные фотографии и фрагменты аудиозаписи в видеоролики, на которых люди двигаются, жестикулируют и говорят.
OmniHuman-1 обучали на 19 000 часах видеоконтента из «нераскрытых источников».
Отмечается, что OmniHuman-1 способна создавать видео с любым соотношением сторон и пропорциями, успешно имитировать движения и жесты людей, что было значительной проблемой для других аналогичных ИИ.
Разработчики также показали примеры сгенерированных видео, на одном из которых Альберт Эйнштейн 23 секунды рассказывает о науке.
Источник: Naked Science
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.






Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: