Зміцнення кіберстійкості з розвитком можливостей ШІ
Оскільки наші моделі стають дедалі потужнішими у сфері кібербезпеки, ми інвестуємо в їх посилення, впровадження додаткових заходів захисту та співпрацю з експертами з безпеки з усього світу.
Кіберможливості в моделях ШІ стрімко розвиваються, що приносить як суттєві переваги для кіберзахисту, так і нові ризики подвійного використання, які потребують ретельного перегляду. Наприклад, показники можливостей, оцінених за допомогою завдань типу capture-the-flag (CTF), зросли з 27% для GPT‑5(відкривається у новому вікні) у серпні 2025 року до 76% для GPT‑5.1‑Codex‑Max(відкривається у новому вікні) у листопаді 2025 року.
Ми сподіваємося, що майбутні моделі ШІ продовжать рух у цьому напрямку; у процесі підготовки ми плануємо та оцінюємо кожну модель так, ніби вона може досягти «високого» рівня можливостей кібербезпеки, що вимірюється за нашою рамковою системою готовності(відкривається у новому вікні). Під цим ми маємо на увазі ризик того, що моделі можуть або розробляти працездатні віддалені експлойти нульового дня проти добре захищених систем, або суттєво допомагати у складних, прихованих операціях із проникнення в корпоративні чи промислові системи, спрямованих на реальні наслідки. У цій публікації пояснюється, як ми розробляємо запобіжні заходи для моделей, що досягають таких рівнів можливостей, і як ми забезпечуємо, щоб вони суттєво допомагали захисникам, водночас обмежуючи можливості для зловживання.
У міру розвитку цих можливостей OpenAI інвестує в посилення моделей для завдань оборонної кібербезпеки та створення інструментів, які дозволяють фахівцям із кіберзахисту легше виконувати робочі процеси, як-от аудит коду та усунення вразливостей. Наша мета — щоб наші моделі й продукти давали суттєві переваги захисникам, які часто поступаються чисельністю та мають обмежені ресурси.
Як і в інших галузях подвійного призначення, оборонні й наступальні кіберпроцеси часто спираються на ті самі базові знання й методи. Ми інвестуємо в захисні механізми, щоб допомогти забезпечити, аби ці потужні можливості передусім приносили користь для застосування в захисті та обмежували посилення можливостей для зловмисних цілей. Кібербезпека стосується майже кожної сфери, а це означає, що ми не можемо покладатися на якусь одну категорію заходів захисту — наприклад, лише на обмеження знань або використання перевіреного доступу; натомість нам потрібен підхід багаторівневого захисту, який забезпечує баланс ризиків і розширює можливості користувачів. На практиці це означає формувати те, як надається доступ до можливостей, як їх спрямовують і застосовують, щоб передові моделі посилювали безпеку, а не знижували бар'єри для зловживання.
Ми розглядаємо цю роботу не як разове зусилля, а як сталу, довгострокову інвестицію в надання захисникам переваги та безперервне зміцнення безпеки критичної інфраструктури в межах ширшої екосистеми.
Наші моделі розроблені й навчені працювати безпечно; крім того, вони підтримуються проактивними системами, які виявляють неправомірне використання в кіберсфері та реагують на нього. Ми постійно вдосконалюємо ці захисні механізми в міру того, як змінюються наші можливості та картина загроз. Хоча жодна система не може гарантувати абсолютного запобігання зловживанням у сфері кібербезпеки без істотного негативного впливу на застосування для оборони, наша стратегія полягає в тому, аби зменшувати ризик за допомогою багаторівневого комплексу безпеки.
В основі цього підходу лежить багаторівневий захист, що спирається на поєднання контролю доступу, зміцнення інфраструктури, контролю вихідного трафіку та моніторингу. Ми доповнюємо ці заходи системами виявлення та реагування, а також спеціалізованими програмами аналітики загроз і протидії внутрішнім ризикам, що дозволяє швидко виявляти та блокувати нові загрози. Ці засоби захисту розроблені для того, щоб еволюціонувати разом із картиною загроз. Ми виходимо з того, що зміни неминучі, і ведемо розробку таким чином, щоб можна було швидко й належним чином адаптуватися.
Спираючись на цю основу:
- Навчання моделі відмовляти або безпечно відповідати на шкідливі запити, залишаючись корисною для освітніх і захисних сценаріїв використання: ми навчаємо наші передові моделі відмовляти або безпечно відповідати на запити, які можуть сприяти явному кіберзловживанню, залишаючись максимально корисними в легітимних захисних та освітніх сценаріях.
- Системи виявлення: ми вдосконалюємо та підтримуємо загальносистемний моніторинг у всіх продуктах, що використовують передові моделі, для виявлення потенційно шкідливої кіберактивності. Коли активність видається небезпечною, ми можемо заблокувати вивід, спрямувати запити до безпечніших або менш функціональних моделей чи передати його на примусове застосування заходів. Наші заходи впливу поєднують автоматизовану та людську перевірку з урахуванням таких чинників, як юридичні вимоги, серйозність і повторювана поведінка. Ми також тісно співпрацюємо з розробниками та корпоративними клієнтами, щоб узгоджувати стандарти безпеки й уможливлювати відповідальне використання завдяки чітким шляхам ескалації.
- Наскрізний редтімінг: ми співпрацюємо з експертними організаціями з редтімінгу, щоб оцінювати й покращувати наші заходи безпеки. Їхнє завдання — намагатися обійти всі наші засоби захисту, працюючи наскрізно, так само, як це міг би робити рішучий і добре забезпечений ресурсами зловмисник. Це допомагає нам виявляти прогалини на ранніх етапах та зміцнювати всю систему.
OpenAI ще на ранніх етапах інвестувала в застосування ШІ для сценаріїв захисного застосування в кібербезпеці. Наша команда тісно співпрацює зі світовими експертами над удосконаленням як наших моделей, так і їхнього застосування. Ми цінуємо внесок глобальної спільноти фахівців із кібербезпеки, які невтомно працюють, щоб зробити наш цифровий світ безпечнішим, і прагнемо надавати їм потужні інструменти, що підтримують завдання захисту. У міру впровадження нових заходів захисту ми й надалі співпрацюватимемо з кібербезпековою спільнотою, щоб зрозуміти, де ШІ може суттєво посилити стійкість, а де найбільш важливими є продумані заходи захисту.
Поряд із цією співпрацею ми впроваджуємо комплекс заходів, покликаних допомогти захисникам діяти швидше, ґрунтувати наші запобіжні заходи на реальних потребах і прискорювати відповідальне усунення проблем у широкому масштабі.
Невдовзі ми запровадимо програму надійного доступу, у межах якої вивчатимемо можливість надання відповідним користувачам і клієнтам, які працюють у сфері кіберзахисту, багаторівневого доступу до розширених можливостей наших найновіших моделей для захисних сценаріїв використання. Ми все ще визначаємо належні межі того, до яких можливостей ми можемо надавати широкий доступ, а які потребують багаторівневих обмежень, що може вплинути на майбутній дизайн цієї програми. Ми прагнемо, щоб ця програма надійного доступу стала важливим кроком до створення стійкої екосистеми.
Aardvark, наш агент-дослідник із безпеки, який допомагає розробникам і командам безпеки виявляти та виправляти вразливості у великих масштабах, тепер доступний у закритій бета-версії. Він аналізує кодові бази на вразливості та пропонує виправлення, які адміністратори можуть швидко впровадити. Він уже виявив нові CVE у програмному забезпеченні з відкритим кодом, здійснивши міркування над усією кодовою базою. Ми плануємо надати безкоштовне покриття для вибраних некомерційних репозиторіїв із відкритим кодом, щоб зробити свій внесок у безпеку екосистеми та ланцюга поставок програмного забезпечення з відкритим кодом. Подати заявку можна тут.
Ми плануємо створити Раду з питань ризиків передових моделей — консультативну групу, яка об’єднає досвідчених кіберзахисників і фахівців із безпеки для тісної співпраці з нашими командами. Спочатку рада зосередиться на кібербезпеці, а згодом розширить свою діяльність на інші сфери передових технологій. Учасники надаватимуть рекомендації щодо межі між корисними та відповідальними можливостями і потенційним зловживанням, а ці висновки безпосередньо впливатимуть на наші оцінки та заходи безпеки. Незабаром ми поділимося додатковою інформацією.
Ми очікуємо, що зловживання у кіберсфері можуть бути можливими з боку будь-якої передової моделі у галузі. Аби вирішити цю проблему, ми співпрацюємо з іншими передовими лабораторіями через Frontier Model Forum — неприбуткову організацію, яку підтримують провідні лабораторії ШІ та галузеві партнери, — щоб сформувати спільне розуміння моделей загроз і найкращих практик. У цьому контексті моделювання загроз допомагає зменшити ризики шляхом виявлення того, як можливості ШІ можуть бути використані як зброя, де існують критичні вузькі місця для різних суб’єктів загроз і як передові моделі можуть забезпечити значне зростання. Ця співпраця має на меті сформувати узгоджене в межах усієї екосистеми розуміння суб’єктів загроз і шляхів атак, що дасть змогу лабораторіям, супровідникам і захисникам краще вдосконалювати свої заходи з пом’якшення ризиків та забезпечувати швидке поширення критично важливих висновків із безпеки в усій екосистемі. Ми також співпрацюємо із зовнішніми командами для розроблення оцінок у сфері кібербезпеки(відкривається у новому вікні). Ми сподіваємося, що екосистема незалежних оцінок ще більше сприятиме формуванню спільного розуміння можливостей моделей.
Разом ці зусилля демонструють нашу довгострокову відданість ідеї зміцнення захисної складової екосистеми. Що потужнішими стають моделі, то більше ми прагнемо забезпечити, щоб ці можливості перетворювалися на реальні переваги для захисників, що ґрунтуватимуться на реальних потребах, формуватимуться з урахуванням експертних висновків і впроваджуватимуться з належною обачністю. Поряд із цією роботою ми плануємо дослідити інші ініціативи та гранти у сфері кібербезпеки, щоб допомогти виявити проривні ідеї, які можуть не з’явитися через традиційні механізми, а також залучити сміливі, креативні підходи до захисту з академічних кіл, індустрії та спільноти відкритого коду. Це постійна робота, і ми плануємо й надалі вдосконалювати ці програми, дізнаючись, що найефективніше сприяє безпеці в реальному світі.


