Китайская компания ByteDance представила новую модель искусственного интеллекта OmniHuman-1 для генерации видео с реалистичным изображением человека. Нейросеть способна превращать обычные фотографии и фрагменты аудиозаписи в видеоролики, на которых люди двигаются, жестикулируют и говорят.
OmniHuman-1 обучали на 19 000 часах видеоконтента из «нераскрытых источников».
Отмечается, что OmniHuman-1 способна создавать видео с любым соотношением сторон и пропорциями, успешно имитировать движения и жесты людей, что было значительной проблемой для других аналогичных ИИ.
Разработчики также показали примеры сгенерированных видео, на одном из которых Альберт Эйнштейн 23 секунды рассказывает о науке.
Источник: Naked Science