Лучшие новинки нейросетей, на которые стоит обратить внимание

Молодой человек с кассетой

Современные нейросети продолжат удивлять своими достижениями и нововведениями. В последние годы эта область искусственного интеллекта развивается так стремительно, что порой сложно уследить за всеми преобразованиями в данной области. Сегодня рассмотрим несколько недавних новинок, которые меняют представление о возможностях нейросетей. Уверены, что из этого списка Вы точно найдете для себя интересный и полезный сервис!

ElevenLabs

Начнем обзор с достаточно популярного в последнее время сервиса ElevenLabs. Данная нейросеть известна тем, что способна переводить текст в речь, генерируя голоса, которые максимально похожи на человеческие. Нейросеть ElevenLabs создана польской компанией-разработчиком, и в настоящее время именно она занимает лидирующее место среди аналогичных продуктов.

ElevenLabs позволяет осуществлять и интересные манипуляции с собственным голосом — например, его можно омолодить или же, напротив, состарить. Можно выбрать один из сотен голосов, которые доступны в библиотеке нейросети. ElevenLabs работает на 29 различных языках. При этом алгоритм нейросети самостоятельно определяет особенности зачитываемого текста и уже под него корректирует интонацию голоса — например, она будет отличаться в зависимости от того, озвучивает ли ElevenLabs поэму Шекспира или бизнес-план компании. Нейросеть имеет бесплатную демо-версию, в дальнейшем пользоваться ею можно по подписке. Минус в том, что прямая оплата из РФ невозможна.

Gemini

Известный чат-бот от Google, обладающий высокой скоростью генерации. Нейросеть способна отвечать на различные вопросы, писать собственные тексты. Также Gemini умеет создавать краткое содержание диктофонных записей, подбирать самые подходящие ответы для переписки в мессенджерах. Новейшая модель Gemini Ultra, как заявляют сами представители Google, превосходит по своим способностям GPT-4 в 30 из 32 проведенных сравнительных тестах. В целом же данная модель считается одним из главных конкурентов GPT-4.

Suno AI

Этот сервис известен тем, что способен генерировать качественные музыкальные треки и песни на основе заданного текстового запроса. Полученные шедевры зачастую не отличаются от тех, что были созданы человеком. При этом нейросеть Suno AI способна писать не только музыку, но и слова. Также она способна нарисовать обложку к музыкальному альбому.

Девочка поет

Источник: изображение создано при помощи нейросети Dall-E, доступной на сервисе Creator Project

Suno создает полноценные песни, длительность которых составляет до 2 минут. Она способна сгенерировать музыкальный трек практически в любом известном жанре. Также Suno AI работает на русском языке. Преимущество нейросети состоит в том, что из РФ она работает без ограничений.

GPT-4 Omni

Последняя новинка от ChatGPT поражает воображение — нейросеть способна к эмоциональному разговору, в процессе которого использует разные интонации; голосовой ассистент отличается способностью распознавать речь и поддерживать диалог в режиме реального времени. Интервал отклика на пользовательский запрос составляет всего 0,3 сек. Обработка текста в модели GPT-4o тоже была значительно улучшена, что касается не только английского, но и всех языков, на которых работает модель. Изображения также создаются практически без артефактов.

Illustration Generator от Icons8

Icons8 представил новый онлайн-инструмент для создания уникальных иллюстраций, называемый Illustration Generator. Этот сервис позволяет легко создавать последовательные изображения, сохраняя единый стиль и идентичность персонажей. Нейросеть, лежащая в основе инструмента, обучена на данных профессиональных художников Icons8, которые разработали более ста тысяч иллюстраций, что гарантирует аутентичность и высокое качество создаваемых картинок.

Illustration Generator предлагает множество возможностей, среди которых большая библиотека элементов для создания разнообразных сцен, настройка цветов всех объектов в соответствии с вашим стилем, а также интуитивно понятный интерфейс, доступный даже для новичков. Сервис генерирует изображения высокого качества, подходят как для печати, так и для веб-использования. Попробовать инструмент можно бесплатно, а для полного доступа требуется подписка стоимостью 19 долларов в месяц.

Две красивые девушки

Источник: изображение создано при помощи нейросети Dall-E, доступной на сервисе Creator Project

Уже скоро: интеграция Sora и ChatGPT

Уже скоро возможности данных нейросетей будут объединены для создания революционного инструмента, который обещает изменить процесс создания видео. OpenAI недавно представила новую демо-версию, позволяющую автоматически генерировать видеоконтент с повествованием и фоновыми звуками, используя аудиовход. Теперь пользователи могут задавать запросы, на основе которых ChatGPT создаст сценарий. Затем Voice Engine OpenAI озвучит его на любом языке, используя голос пользователя. Интеграция с Sora позволяет создавать полноценные видео, добавляя необходимую озвучку и фоновые звуки. Ожидается, что обновление будет доступно к концу года, по слухам, уже в ноябре.

Интересно? Поделиться: