Новости

Слабое звено ИИ-браузеров: OpenAI делится подробностями о борьбе с инъекциями подсказок

27.12.202526.12.2025

Источник изображения: OpenAI

Даже несмотря на то что OpenAI усиливает защиту своего браузера Atlas AI от кибератак, компания признает: инъекции подсказок (prompt injection) — разновидность атак, при которой злоумышленники заставляют ИИ-агентов выполнять вредоносные инструкции, часто скрытые на веб-страницах или в электронных письмах, — это риск, который не исчезнет в обозримом будущем. Это вызывает вопросы о том, насколько безопасно такие агенты могут работать в открытом интернете.

Смотрите видео на удобном для вас ресурсе!

YouTube ВК.Видео RuTube ОК

«Инъекции подсказок, подобно мошенничеству и социальным инженерным атакам в интернете, вряд ли когда-либо будут полностью “решены”», — написала OpenAI в своем блоге в понедельник, подробно рассказав о том, как компания усиливает “броню” Atlas для борьбы с непрекращающимися атаками. В компании также признали, что “режим агента” в ChatGPT Atlas «расширяет поверхность атаки».

OpenAI запустила браузер ChatGPT Atlas в октябре, и исследователи в области безопасности поспешили опубликовать свои демонстрации, показывая, что достаточно написать несколько слов в Google Docs, чтобы изменить поведение браузера. В тот же день компания Brave опубликовала пост, объясняя, что косвенные инъекции подсказок — системная проблема для ИИ-браузеров, включая и Comet от Perplexity.

OpenAI не единственная, кто признает, что атаки через инъекции подсказок никуда не исчезнут. В начале этого месяца Национальный центр кибербезопасности Великобритании предупредил, что такие атаки на генеративные ИИ-приложения «возможно, никогда не получится полностью устранить», ставя под угрозу конфиденциальность данных на сайтах. Ведомство рекомендовало киберспециалистам не надеяться на полную защиту, а снижать риск и последствия подобных атак.

Со своей стороны, OpenAI заявила: «Мы рассматриваем инъекции подсказок как долгосрочный вызов для ИИ-безопасности и нам предстоит постоянно укреплять нашу защиту».

Рецепт OpenAI против этой сизифовой задачи — активный цикл быстрого реагирования, который, как утверждает компания, уже показывает хорошие результаты при обнаружении новых стратегий атак внутри компании ещё до того, как они будут использованы “на свободе”.

Эта стратегия мало отличается от того, о чем говорят конкуренты вроде Anthropic и Google: для борьбы с устойчивыми атаками, связанными с подсказками, защита должна быть многоуровневой и постоянно тестироваться в стрессовых сценариях. Например, последние исследования Google фокусируются на архитектурном и политическом контроле над агентными системами.

Однако подход OpenAI отличается созданием так называемого «автоматизированного нападающего на базе LLM». Этот нападающий — по сути, бот, обученный с подкреплением на роль хакера, в поисках способов внедрять вредоносные инструкции ИИ-агенту.

Бот может опробовать атаку в симуляторе до ее реального применения, причем симулятор показывает, как именно целевой ИИ будет «думать» и какие действия предпримет при обнаружении атаки. Бот может проанализировать ответ, скорректировать атаку и попробовать снова. Такое понимание внутренней логики агента внешним злоумышленникам недоступно, поэтому, в теории, бот OpenAI способен находить уязвимости быстрее, чем реальные атакующие.

Это распространенный прием в тестировании безопасности ИИ — создавать агента, который ищет крайние (edge) случаи, и быстро тестировать на них систему в симуляторе.

«Наш нападающий, обученный с подкреплением, способен довести агента до выполнения сложных, многоступенчатых вредоносных сценариев, растянутых на десятки (а то и сотни) шагов, — пишет OpenAI. — Мы также наблюдали новые стратегии атак, которые не встречались ни в ходе внутреннего red teaming с участием людей, ни во внешних отчетах».

Cкриншот, демонстрирующий атаку с помощью внедрения запроса (prompt injection) в браузере OpenAI Atlas — Источник изображения: OpenAI

В одной из демонстраций (частично показанной на изображении выше) OpenAI показала, как их автоматизированный нападающий внедрил вредоносное письмо во входящие пользователя. Когда агент позже просканировал почту, он выполнил скрытые инструкции из письма и отправил сообщение об увольнении вместо автоматического ответа об отсутствии на рабочем месте. Но после обновления безопасности “режим агента” смог распознать попытку инъекции подсказки и уведомить об этом пользователя.

Компания утверждает, что хотя абсолютно надежную защиту от инъекций подсказок обеспечить сложно, она делает ставку на масштабное тестирование и более быстрые циклы исправлений, чтобы укрепить свои системы до появления реальных атак.

Представитель OpenAI отказался сообщить, привело ли обновление Atlas к измеримому снижению числа успешных инъекций, но отметил, что компания работает с внешними партнерами над укреплением защиты Atlas еще до запуска.

Рами Маккарти, главный исследователь по безопасности в компании Wiz, говорит, что обучение с подкреплением действительно позволяет подстраиваться под поведение злоумышленников, однако это лишь часть комплексной задачи.

«Удобный способ оценивать риски в ИИ-системах — это автономность, умноженная на уровень доступа», — говорит Маккарти.

«Агентные браузеры часто оказываются в самой сложной зоне: умеренная степень автономности при очень высоком уровне доступа, — отмечает Маккарти. — Многие актуальные рекомендации отражают именно этот компромисс: например, ограничение доступа к аккаунтам снижает экспозицию, а подтверждение перед важными действиями — уменьшает автономность».

Оба этих подхода OpenAI советует пользователям для минимизации рисков, и представитель компании добавил, что Atlas также обучают всегда запрашивать подтверждение пользователя перед отправкой сообщений или выполнением платежей. OpenAI также рекомендует формулировать для агентов конкретные инструкции, а не просто открывать им доступ ко всей почте с указанием «сделать всё необходимое».

«Чем шире полномочия у агента, тем проще скрытому или вредоносному контенту повлиять на него — даже при наличии защитных мер», — отмечает OpenAI.

Хотя OpenAI заявляет, что защита пользователей Atlas от инъекций подсказок — приоритетная задача, Маккарти предлагает задуматься о том, насколько оправданы риски при использовании подобных браузеров.

«В большинстве повседневных сценариев агентные браузеры пока не приносят достаточной пользы, чтобы оправдать существующий уровень риска, — подчеркнул Маккарти. — Риски высоки, учитывая доступ к чувствительным данным — почте и платежной информации, хотя именно этот доступ и делает их столь мощными. Баланс со временем изменится, но на сегодняшний день компромисс всё еще весьма ощутим».

Источник: TechCrunch

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Статьи и новости о нейросетях и искусственном интеллекте, просто и понятно о сложных технологиях. Освещает современные тенденции, объясняет, как работают ИИ-системы, и показывает, каким образом нейросети меняют различные сферы жизни. Регулярно собирает подборки и топы полезных нейросетей, тщательно отбирая актуальные инструменты и сервисы, которые могут существенно упростить рабочие и повседневные задачи. В своих подборках делится описаниями возможностей каждой нейросети, а также рекомендациями по их применению, чтобы помочь читателям быстро разобраться в новых технологиях и использовать их с максимальной пользой.

Социальные сети автора:

Интересно? Поделиться:

6 комментариев к “Слабое звено ИИ-браузеров: OpenAI делится подробностями о борьбе с инъекциями подсказок”

Glintvein47:

27.12.2025 в 23:33

По-моему от ИИ вреда больше чем пользы. Особенно для простых людей. Власти и элиты по всему миру благодаря ИИ получили огромный ресурс для контроля своих граждан. И мошенники тоже не отстают, теперь кто угодно может запустить в вашу почту ложную и даже опасную информацию. И если можно проникнуть в почту, то наверное и банковскими картами посредством инъекций тоже можно управлять :(( Киберпанк уже близок.
Саша:

27.12.2025 в 23:42

Инъекции подсказок — это слабое звено ИИ-браузеров, и эта проблема может сохраняться ещё долго.
Edvins:

28.12.2025 в 08:19

Если меры не полностью эффективны, пользователи рискуют столкнуться с манипуляциями, что подрывает доверие к ИИ. Кроме того, это может спровоцировать гонку вооружений между хакерами и разработчиками.
pipip vovka:

28.12.2025 в 14:09

Тема действительно актуальная, особенно на фоне роста ИИ-браузеров. Инъекции подсказок выглядят как недооценённая угроза, и хорошо, что OpenAI говорит об этом открыто, а не постфактум. Интересно будет посмотреть, насколько эти меры окажутся эффективными в реальных сценариях и как быстро злоумышленники найдут обходные пути.
Mahir Labib:

29.12.2025 в 10:00

Проблема prompt-инъекций действительно серьёзная, хорошо что OpenAI усиливает защиту
Iura Melnic:

17.01.2026 в 12:23

Тема действительно нужная и полезная. Хорошо что открыто признались в этом и поделились этим. Это уже этот ИИ пытаются и впаривают везде где надо и где не надо. От ИИ много как пользы, так и вреда. Все дело в том в чьих руказ он находится.

Обсуждение закрыто.

Рекомендуем почитать

Кадр сгенерированный Sora

OpenAI закрывает Sora и делает ставку на Codex и «суперприложение» ChatGPT

Во вторник OpenAI объявила: «Мы прощаемся с Sora» — инструментом генерации видео, который компания запустила в конце 2024 года и…

Главная страница Picsart

Picsart представила маркетплейс ИИ-агентов для создателей контента и продавцов

Дизайнерская платформа Picsart на базе ИИ запустила маркетплейс ИИ-агентов, позволяя создателям «нанимать» ИИ-помощников для выполнения конкретных задач — например, изменения…

Британская энциклопедия

Encyclopedia Britannica и Merriam‑Webster подали в суд на OpenAI из‑за нарушения авторских прав

Encyclopedia Britannica и издатель словарей Merriam-Webster подали иск против OpenAI, утверждая, что компания использовала их защищённый авторским правом контент для…

Обзор Kimi K2.5

«Рой агентов» для решения пользовательских задач. Обзор Kimi K2.5

Китайская компания Moonshot AI выпустила Kimi K2.5 в феврале 2026 года, и главная особенность этой модели звучит почти фантастически. Дело…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.

Принять

Подробнее…

Политика конфиденциальности