Представяне на режим „Заключване“ и постоянни етикети „Повишен риск“ в ChatGPT
С развитието на системите с изкуствен интелект, които поемат по-сложни задачи – особено тези, свързани с мрежата и свързаните приложения – рисковете за сигурността се променят.
Един нововъзникващ риск стана особено важен: инжектирането на подкани. При тези атаки трета страна се опитва да заблуди система с ИИ за провеждане на разговори да изпълнява злонамерени инструкции или да разкрие поверителна информация.
Днес представяме две нови защити, предназначени да помогнат на потребителите и организациите да смекчат атаките чрез инжектиране на подкани, осигурявайки по-ясна видимост на риска и по-силни контролни мерки:
- Режим „Заключване“ в ChatGPT, усъвършенствана, незадължителна настройка за сигурност за високорискови потребители
- Етикети „Повишен риск“ за определени функции, които могат да въведат допълнителен риск в ChatGPT, ChatGPT Atlas и Codex
Тези допълнения надграждат нашите съществуващи защити на ниво модел, продукт и система. Това включва изолирана среда, защита срещу изтичане на данни чрез URL, наблюдение и изпълнение, както и корпоративни контролни мерки, като контрол на достъпа въз основа на роли и одитни регистри.
Режимът „Заключване“ е незадължителна, разширена настройка за сигурност, предназначена за малка група потребители, особено загрижени за сигурността – като ръководители или екипи по сигурността във водещи организации – които се нуждаят от повишена защита срещу усъвършенствани заплахи. Режимът не е необходим за повечето потребители. „Заключване“ строго ограничава взаимодействието на ChatGPT с външни системи, за да намали риска от изтичане на данни чрез инжектиране на подкани.
Режимът „Заключване“ детерминистично деактивира определени инструменти и функции в ChatGPT, които един атакуващ може да се опита да използва, за да извлече чувствителни данни от разговорите на потребителите или свързаните приложения чрез атаки като инжектиране на подкани.
Например, уеб сърфирането в режим „Заключване“ е ограничено до кеширано съдържание, така че никакви заявки в реално време не напускат контролираната мрежа на OpenAI. Това ограничение е създадено, за да предотврати изтичането на чувствителни данни към нападател чрез сърфиране. Някои функции са напълно деактивирани, когато не можем да осигурим силни детерминистични гаранции за безопасността на данните.

Режимът заключване е нова детерминистична настройка, която помага да се защитят данните от неволно споделяне с трети страни, като строго ограничава начина, по който ChatGPT може да взаимодейства с определени външни системи.
Бизнес плановете на ChatGPT вече осигуряват сигурност на данните от корпоративен клас. Режимът на заключване надгражда тези защити и е наличен за ChatGPT Enterprise, ChatGPT Edu, ChatGPT за здравеопазване и ChatGPT за учители. Администраторите могат да го активират в настройките на работното пространство(отваря се в нов прозорец), като създадат нова роля(отваря се в нов прозорец). Когато е активиран, режимът „Заключване“ добавя допълнителни ограничения към съществуващите администраторски настройки.
Научете повече за режима „Заключване“ в нашия Помощен център(отваря се в нов прозорец).
Тъй като някои критични работни процеси зависят от приложения, администраторите на работното пространство запазват по-подробен контрол. Те могат да изберат точно кои приложения и кои конкретни действия в тези приложения ще бъдат достъпни за потребителите в режим на блокиране. Освен това, отделно от режима „Заключване“, Платформата за регистри за съответствие на API(отваря се в нов прозорец) осигурява подробна видимост върху използването на приложения, споделените данни и свързаните източници, като помага на администраторите да поддържат контрол.
Планираме да направим режима „Заключване“ достъпен за потребителите през следващите няколко месеца.
Продуктите с изкуствен интелект могат да бъдат по-полезни, когато са свързани с Вашите приложения и интернет, и ние сме инвестирали значително в поддържане на сигурността на свързаните данни. В същото време някои мрежови възможности въвеждат нови рискове, които все още не са напълно адресирани от мерките за безопасност и сигурност на индустрията. Някои потребители може да се чувстват комфортно да поемат тези рискове и ние вярваме, че е важно потребителите да имат възможност да решат дали и как да ги използват, особено когато работят със своите лични данни.
Нашият подход е да предоставяме насоки в продукта за функции, които могат да представляват допълнителен риск. За да направим това по-ясно и последователно, стандартизираме начина, по който обозначаваме кратък списък от съществуващи функции. Тези функции вече ще използват постоянен етикет „Повишен риск“ в ChatGPT, ChatGPT Atlas и Codex, за да могат потребителите да получават едни и същи насоки, където и да ги срещнат.
Например, в нашия асистент за кодиране Codex разработчиците могат да предоставят на Codex достъп до мрежата, за да може да извършва действия в интернет, като например да търси документация. Съответният екран с настройки включва етикета „Повишен риск“, заедно с ясно обяснение какво се променя, какви рискове могат да бъдат въведени и кога този достъп е подходящ.

Екранна снимка на екран с настройки на Codex, където потребителите могат да конфигурират мрежовия достъп на Codex.
Продължаваме да инвестираме в укрепването на нашите мерки за безопасност и сигурност, особено за нови, възникващи или нарастващи рискове. Докато укрепваме предпазните мерки за тези функции, ще премахнем етикета „Повишен риск“, след като установим, че подобренията в сигурността са смекчили достатъчно тези рискове за обща употреба. Също така ще продължим да актуализираме кои функции ще носят този етикет с течение на времето, за да съобщаваме по най-добрия начин риска на потребителите.


