Gradium, стартап, выделившийся из французской ИИ‑лаборатории Kyutai (поддерживаемой французским телеком‑миллиардером Ксавье Ньелем), во вторник вышел из тени, объявив о посевном раунде на $70 млн от плеяды именитых инвесторов.
Раунд возглавили FirstMark Capital и Eurazeo; в нем также приняли участие Ньель, DST Global Partners, миллиардер Эрик Шмидт и другие инвесторы.
Gradium разработал аудиолингвистические модели ИИ, рассчитанные на масштабную генерацию голоса с минимальной задержкой — по сути, ИИ‑голоса, отвечающие практически мгновенно. Компания была основана всего несколько месяцев назад, в сентябре, сооснователем Kyutai Нилем Зегидуром, который набрался опыта работы с голосовыми моделями в качестве исследователя в Google DeepMind.
По словам компании, ее цель — сделать голосовые модели быстрее и точнее для разработчиков. И, будучи европейским стартапом, она изначально запустилась с многоязычной поддержкой: английский, французский, немецкий, испанский и португальский; вскоре добавятся и другие языки.
Разумеется, Gradium входит в гонку с высокой конкуренцией. Для начала, у ведущих разработчиков LLM — OpenAI, Anthropic, Meta* Llama* и Mistral — уже есть голосовые, речевые и мультимодальные модели. Есть и хорошо финансируемые стартапы вроде ElevenLabs, а на Hugging Face — сотни голосовых и речевых моделей. Сейчас у разработчиков, которым нужны возможности ИИ‑голоса, выбор более чем широк.
Тем не менее спрос на то, что Gradium намерен предложить — ультрареалистичную голосовую выразительность и точность — со временем будет только расти по мере того, как ИИ будет переходить от текстовых чатов к агентам и расширять применение — от развлечений до рабочих сценариев.
Источник: TechCrunch
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Статьи и новости о нейросетях и искусственном интеллекте, просто и понятно о сложных технологиях. Освещает современные тенденции, объясняет, как работают ИИ-системы, и показывает, каким образом нейросети меняют различные сферы жизни. Регулярно собирает подборки и топы полезных нейросетей, тщательно отбирая актуальные инструменты и сервисы, которые могут существенно упростить рабочие и повседневные задачи. В своих подборках делится описаниями возможностей каждой нейросети, а также рекомендациями по их применению, чтобы помочь читателям быстро разобраться в новых технологиях и использовать их с максимальной пользой.
Социальные сети автора:






Сверхреалистичные голосовые модели — одно из самых быстро развивающихся направлений ИИ что для многих отличная новость.
Впечатляющая сумма! 💰 Это сигнал, что ультра-реалистичный голос — следующий рубеж ИИ. Gradium делает ставку на скорость, эмоции и естественность, чтобы голос стал универсальным интерфейсом без задержек.
Звучит амбициозно! Конкуренты вроде ElevenLabs уже на рынке, так что им нужно доказать уникальность. Потенциал в аудиокнигах, подкастах и персонализированном контенте, плюс акцент на этичности контроль над использованием, чтобы избежать глубоких фейков.
Миллиарды вкладываются в ИИ а это надо,час сколько граждан нуждающихся , лучше бы им помогли.
Интересная новость — $70 млн на разработку сверхреалистичных голосовых моделей звучит солидно. Если у них всё получится, можно ожидать серьёзный прорыв: от кино и игр до озвучки видео и помощников — технологии с таким уровнем реализма могут менять правила. А как вы думаете: какие применения голосовых моделей будут самыми востребованными — кино-аудио, контент-создание или что-то другое?
Gradium намерен убрать неживые металл и пластик из звучания своих голосовых ИИ-моделей и вложить в их живые эмоции? Очень бы хотелось услышать что-то подобное. Обычно по голосу можно было отличить озвучку человеком и механизмом (алгоритмом) — в банковских приложениях, например.