Укрепление киберустойчивости в условиях развития возможностей ИИ
По мере того как наши модели расширяют свой потенциал в сфере кибербезопасности, мы инвестируем в их усиление, внедряем дополнительные меры защиты и сотрудничаем с экспертами по безопасности по всему миру.
Функциональные возможности ИИ в сфере кибербезопасности стремительно развиваются, открывая значительные перспективы для киберзащиты, но вместе с тем создавая новые риски двойного назначения, требующие тщательного управления. Например, показатели выполнения задач на соревнованиях capture-the-flag (CTF), выросли с 27 % у GPT‑5(открывается в новом окне) в августе 2025 года до 76 % у GPT‑5.1‑Codex‑Max(открывается в новом окне) в ноябре 2025 года.
Мы ожидаем, что будущие модели ИИ продолжат развиваться в этом направлении. В рамках подготовки мы ведем планирование и оценку исходя из того, что каждая новая модель может достичь «высокого» уровня функциональных возможностей в сфере кибербезопасности согласно нашей Программе готовности(открывается в новом окне). Под этим мы подразумеваем модели, способные либо самостоятельно разрабатывать рабочие эксплойты под уязвимости нулевого дня для удаленного взлома защищенных систем, либо оказывать существенную помощь в проведении сложных скрытых операций по проникновению в корпоративные или промышленные сети, направленных на достижение реального ущерба. В данном материале объясняется наш подход к обеспечению безопасности моделей, достигающих подобных уровней функциональности. Наша цель — гарантировать, что они приносят реальную пользу специалистам по защите, в то же время ограничивая возможности их неправомерного использования.
По мере развития этих возможностей OpenAI инвестирует в адаптацию наших моделей для решения задач киберзащиты и создание инструментов, позволяющих специалистам по безопасности эффективнее выполнять такие рабочие процессы, как аудит кода и устранение уязвимостей. Наша цель — чтобы наши модели и продукты приносили значительные преимущества защитникам, которые часто вынуждены работать в условиях нехватки ресурсов и численного превосходства противника.
Как и в других областях двойного назначения, оборонительные и наступательные киберпроцессы часто опираются на одни и те же базовые знания и методы. Мы инвестируем в меры защиты, чтобы гарантировать, что эти мощные возможности служат прежде всего защитным целям и ограничивают их использование в злоумышленных целях. Кибербезопасность затрагивает почти все сферы, что означает, что мы не можем полагаться только на одну категорию мер защиты — например, ограничение знаний или использование проверенного доступа, — а вместо этого нам необходим подход многоуровневой защиты, который сбалансирует риски и расширит возможности пользователей. На практике это означает формирование того, как осуществляется доступ к возможностям, как их использование направляется и как они применяются, чтобы передовые модели укрепляли безопасность, а не снижали барьеры для злоупотреблений.
Мы рассматриваем эту работу не как разовое усилие, а как последовательную долгосрочную инвестицию, чтобы дать защитникам преимущество и постоянно укреплять уровень защищенности критической инфраструктуры во всей более широкой экосистеме.
Наши модели разработаны и обучены для безопасной работы, поддерживаемой проактивными системами, которые выявляют и реагируют на киберзлоупотребления. Мы непрерывно совершенствуем эти меры защиты по мере развития наших технологических возможностей и изменения ландшафта киберугроз. Хотя ни одна система не может гарантировать полное предотвращение неправомерного использования в сфере кибербезопасности без серьезного ущерба для оборонных сценариев, наша стратегия заключается в минимизации рисков с помощью многоуровневого стека безопасности.
В основе этого лежит наш подход многоуровневой защиты, опирающийся на сочетание контроля доступа, укрепления инфраструктуры, контроля исходящего трафика и непрерывного мониторинга. Мы дополняем эти меры системами обнаружения и реагирования, а также специализированными программами анализа киберугроз и управления внутренними рисками, что позволяет быстро выявлять и блокировать новые угрозы. Эти меры безопасности разработаны для того, чтобы развиваться вместе с изменяющимся ландшафтом угроз. Мы исходим из того, что изменения неизбежны, и создаём всё так, чтобы быстро и адекватно адаптироваться.
Опираясь на этот фундамент:
- Обучение модели отказываться от выполнения вредоносных запросов или безопасно отвечать на них, оставаясь при этом полезной для образовательных и оборонительных сценариев использования: мы обучаем наши передовые модели отказываться от выполнения запросов или безопасно отвечать на запросы, которые могли бы способствовать явному киберзлоупотреблению, оставаясь при этом максимально полезными для законных образовательных и оборонительных сценариев использования.
- Системы обнаружения: мы совершенствуем и поддерживаем общесистемный мониторинг во всех продуктах, использующих передовые модели, чтобы выявлять потенциально вредоносную киберактивность. Когда активность выглядит небезопасной, мы можем блокировать вывод, направлять запросы к более безопасным или менее функциональным моделям или передавать их на принудительное рассмотрение. Наши меры реагирования сочетают автоматизированную и ручную проверку, учитывая такие факторы, как требования законодательства, серьезность нарушения и повторность поведения. Мы также тесно сотрудничаем с разработчиками и корпоративными клиентами для согласования стандартов безопасности и обеспечения ответственного использования технологий с внедрением четких процедур эскалации инцидентов.
- Комплексное (end-to-end) проведение red teaming: мы сотрудничаем с ведущими экспертными организациями в области red teaming для оценки и совершенствования наших мер защиты. Их задача — попытаться обойти все наши защитные механизмы, действуя комплексно, точно так же, как это сделал бы решительный и обладающий значительными ресурсами противник. Это помогает нам на ранних этапах выявлять пробелы и укреплять всю систему.
OpenAI с самого начала инвестировала в применение ИИ для защитных сценариев в сфере кибербезопасности, и наша команда тесно взаимодействует с экспертами по всему миру, чтобы совершенствовать как наши модели, так и их применение. Мы высоко ценим глобальное сообщество специалистов по кибербезопасности, которые неустанно трудятся над тем, чтобы сделать наш цифровой мир безопаснее, и стремимся предоставлять мощные инструменты для поддержки систем активной обороны. По мере внедрения новых мер защиты мы будем продолжать сотрудничать с сообществом специалистов по кибербезопасности, чтобы понять, где ИИ может существенно повысить устойчивость, а где наиболее важны продуманные меры защиты.
Наряду с этим сотрудничеством, мы инициируем ряд мер, призванных помочь специалистам по защите действовать быстрее, адаптировать наши защитные механизмы к реальным потребностям и ускорить процесс ответственного устранения уязвимостей в глобальном масштабе.
В ближайшее время мы представим программу доверенного доступа, в рамках которой планируем предоставлять прошедшим проверку пользователям и клиентам, работающим в сфере киберзащиты, многоуровневый доступ к расширенным возможностям наших новейших моделей для реализации оборонных сценариев. Мы все еще находимся в процессе определения точных границ: какие возможности мы можем предоставить в рамках широкого доступа, а какие требуют эшелонированных ограничений. Выводы, сделанные на этом этапе, могут повлиять на будущую архитектуру и дизайн данной программы. Мы стремимся к тому, чтобы программа доверенного доступа стала основой для устойчивой экосистемы.
Aardvark — наш аналитик в области информационной безопасности, который помогает разработчикам и командам безопасности находить и устранять уязвимости в любом масштабе, — теперь доступен в режиме закрытого бета-тестирования. Он сканирует кодовые базы на наличие уязвимостей и предлагает исправления (патчи), которые владельцы репозиториев могут оперативно внедрить. Он уже выявил новые уязвимости (CVE) в программном обеспечении с открытым исходным кодом, применяя логический анализ ко всей структуре кодовых баз. Мы планируем предоставлять бесплатное покрытие для отдельных некоммерческих репозиториев с открытым исходным кодом, чтобы способствовать повышению безопасности экосистемы программного обеспечения с открытым исходным кодом и цепочки поставок. Подайте заявку на участие здесь.
Мы создадим Совет по пограничным рискам — консультативную группу, которая привлечет опытных специалистов по киберзащите и практиков в области безопасности к тесному сотрудничеству с нашими командами. Этот совет сначала сосредоточится на кибербезопасности, а в будущем расширит сферу своей деятельности на другие области передовых возможностей. Участники будут помогать определять границу между полезными, ответственными возможностями и потенциальным злоупотреблением, а полученные выводы напрямую лягут в основу наших оценок и мер безопасности. Скоро мы поделимся подробностями.
Наконец, мы предполагаем, что злоупотребление в киберсфере может быть осуществимо с использованием любой передовой модели в отрасли. Для решения этой проблемы мы сотрудничаем с другими лабораториями через Frontier Model Forum — некоммерческую организацию, поддерживаемую ведущими ИИ-лабораториями и отраслевыми партнерами, — с целью выработки единого понимания моделей угроз и лучших практик. В данном контексте моделирование угроз помогает минимизировать риски путем выявления того, как возможности ИИ могут быть использованы в качестве оружия, где находятся критические «узкие места» для различных злоумышленников и в каких случаях пограничные модели могут дать им значимое преимущество. Это сотрудничество направлено на формирование согласованного в рамках всей экосистемы понимания субъектов угроз и векторов атак, что позволит лабораториям, владельцам репозиториев и защитникам эффективнее совершенствовать меры противодействия и обеспечивать быстрое распространение критически важной информации о безопасности. Мы также взаимодействуем с внешними командами для разработки систем оценки кибербезопасности(открывается в новом окне). Мы надеемся, что экосистема независимых оценок поможет в дальнейшем сформировать общее понимание возможностей моделей.
Эти усилия в совокупности отражают нашу долгосрочную приверженность укреплению оборонительной стороны экосистемы. По мере роста возможностей моделей наша цель — сделать так, чтобы эти возможности превращались в реальные рычаги влияния для защитников, опираясь на реальные потребности, экспертные знания и осмотрительное внедрение. Наряду с этой работой мы планируем изучить другие инициативы и гранты в сфере кибербезопасности, чтобы выявить прорывные идеи, которые могут не появиться в рамках традиционных процессов, и привлечь смелые, творческие подходы к защите от представителей академического сообщества, индустрии и сообщества с открытым исходным кодом. В целом, это постоянная работа, и мы планируем продолжать развивать эти программы по мере того, как будем узнавать, что наиболее эффективно способствует повышению безопасности в реальных условиях.


