Транскрибация (перевод из аудио в текст) может потребоваться в самых разных случаях. С ее помощью создают протоколы встреч, интервью, различных лекций. Для многих людей она также принадлежит и к числу творческих хобби – например, для тех, кто изучает иностранные языки. В прошлом транскрибирование текста было сложной задачей – программы, создаваемые для перевода из аудио в текст, допускали немало ошибок. Но сегодня качественную транскрибацию можно выполнить при помощи нейронных сетей, которые делают эту работу быстро и эффективно – так, что на выходе получается практически точная текстовая копия аудиофайла. Одной из нейросетей, которая используется для данной цели, выступает MacWhisper, речь о которой и пойдет в сегодняшнем обзоре.
Что такое MacWhisper
MacWhisper представляет собой инновационный инструмент, который используется для транскрибации аудио. Согласно отзывам пользователей, данная нейросеть в сравнении с другими отличается достаточно высокой скоростью работы – например, файл длительностью в 20 минут транскрибируется всего за 1,5 минуты.
Данное приложение было разработано Джорджи Бруином, который известен и множеством других полезных продуктов – например, Vivid, при помощи которого повышается яркость дисплея в MacBook. Транскрибация осуществляется на устройствах Mac локально – это особенно удобно, потому что все файлы будут сразу же сохраняться и будут в любое время доступными для пользователя.
Функционал приложения
MacWhisper не является бесплатным продуктом, однако и без приобретения тарифа пользователям доступны ряд опций. Например:
- Быстрая запись и легкая расшифровка аудиофайлов.
- Поиск нужной информации по всему расшифрованному файлу.
- Воспроизведение аудиофайла, синхронизированное с полученной расшифровкой.
- Режимы чтения и редактирования.
- Множество языков транскрибации.
Программа поддерживает ряд форматов – mp3, wav, m4ad и mp4. На бесплатном тарифе работают модели Tiny и Base (они доступны на английском языке). По платной подписке доступна модель Large, которая транскрибирует текст с большей точностью. Однако стоит отметить, что при этом она генерирует транскрибацию медленнее. Вместе с тем, первые две модели также выдают достаточно точные и быстрые результаты. В будущем разработчики планируют выпуск других дополнительных опций к данной программе.
Источник: macg.co, https://www.macg.co/logiciels/2023/02/macwhisper-2-telecharge-les-modeles-de-transcription-la-demande-135001
Возможности платной версии
Одной из основных особенностей приложения по платной подписке выступает поддержка пакетной транскрипции; данная опция позволяет быстро и эффективно обрабатывать множество аудиофайлов одновременно. Это будет полезно, к примеру, при необходимости добавить субтитры к целым сезонам сериалов; или если вам потребуется проанализировать большой объем интервью. Пользователи могут с легкостью загружать файлы и получать транскрипты буквально одним щелчком мыши.
Источник: https://applech2.com, https://applech2.com/archives/20230207-whisper-transcription-support-medium-and-large-whisper-models.html
Важным плюсом платной модели приложения является его интеграция с популярными моделями ИИ (ChatGPT от OpenAI, Claude от Anthropic). Данная возможность позволяет легко добавлять и редактировать подсказки, улучшая тем самым качество конечного продукта. Также приложение предлагает возможность ручного добавления дикторов в транскрипты, что делает экспорт более структурированным.
Еще одна удобная особенность платной модели состоит в наличии встроенного приложения в меню, обеспечивающее быстрый доступ к Whisper из любого места на вашем Mac. Пользователи могут мгновенно транскрибировать аудио, а затем легко вставлять результаты в другие приложения.
Недостатком данной нейросети для многих пользователей будет выступать то, что она доступна только лишь на устройствах Мас. Для того чтобы пользоваться ею на ОС Windows, необходимо установить дистрибутив с GitHub. Однако в таком случае зачастую намного более простым и быстрым решением будет обращение к тем нейронным сетям, которые выполняют транскрибацию быстро и качественно, но при этом являются доступными для любого пользователя. К примеру, функция транскрибации имеется на портале Креатор Проджект – здесь пользователи могут без лишних промедлений преобразовать аудиофайл в текстовую версию.