Salta al contingut principal
OpenAI

13 de febrer del 2026

SeguretatProducte

Presentem el mode de confinament i les etiquetes de risc elevat a ChatGPT

S'està carregant…

A mesura que els sistemes d’IA assumeixen tasques més complexes, especialment les que impliquen el web i aplicacions connectades, els riscos de seguretat canvien.

Un risc emergent ha esdevingut especialment important: la injecció d'indicacions. En aquests atacs, un tercer intenta enganyar un sistema d’IA conversacional perquè segueixi instruccions malicioses o reveli informació sensible.

Avui presentem dues noves proteccions dissenyades per ajudar usuaris i organitzacions a mitigar els atacs d’injecció d'indicacions, amb una visibilitat més clara del risc i controls més sòlids:

  • Mode de confinament a ChatGPT, una configuració de seguretat avançada i opcional per a usuaris de més risc
  • Etiquetes de «Risc elevat» per a determinades funcionalitats de ChatGPT, ChatGPT Atlas i Codex que poden comportar risc addicional

Aquestes incorporacions se sumen a les nostres proteccions existents als nivells de model, producte i sistema. Això inclou aïllament en entorn segur, proteccions contra l’exfiltració de dades basada en URL, supervisió i aplicació, i controls empresarials com l’accés basat en rols i els registres d’auditoria.

Ajudar les organitzacions a protegir els empleats amb més risc de ciberatacs

El mode de confinament és una configuració de seguretat avançada i opcional dissenyada per a un petit grup d’usuaris molt conscients de la seguretat —com ara directius o equips de seguretat d’organitzacions destacades— que requereixen més protecció contra amenaces avançades. No és necessari per a la majoria d’usuaris. El mode de confinament limita estrictament com ChatGPT pot interactuar amb sistemes externs per reduir el risc d’exfiltració de dades basada en injecció d'indicacions.

El mode de confinament desactiva de manera determinista determinades eines i funcionalitats de ChatGPT que un adversari podria intentar explotar per exfiltrar dades sensibles de les converses dels usuaris o d’aplicacions connectades mitjançant atacs com ara les injeccions d'indicacions.

Per exemple, la navegació web en el mode de confinament es limita a contingut en memòria cau, de manera que cap sol·licitud de xarxa en temps real surt de la xarxa controlada per OpenAI. Aquesta restricció està dissenyada per evitar que dades sensibles siguin exfiltrades a un atacant mitjançant la navegació. Algunes funcions es desactiven completament quan no podem oferir garanties deterministes sòlides sobre la seguretat de les dades.

Diagrama titulat «Mode de confinament» que mostra ChatGPT dins d’un perímetre segur amb connexions a una memòria cau web privada, Baixa fitxers, Accedeix al web mitjançant Llenç i Navega pel web públic. Un «Atacant» extern i el web públic es representen fora del perímetre, amb punts d’entrada bloquejats que indiquen accés restringit en el mode de confinament.

El mode de confinament és una nova configuració determinista que ajuda a protegir les dades perquè no es comparteixin inadvertidament amb tercers limitant estrictament com ChatGPT pot interactuar amb certs sistemes externs.

Els plans Business de ChatGPT ja ofereixen seguretat de dades de nivell empresarial. El mode de confinament es basa en aquestes proteccions i està disponible per a ChatGPT Enterprise, ChatGPT Edu, ChatGPT for Healthcare i ChatGPT for Teachers. Els administradors poden activar-lo a Configuració de l’espai de treball(s'obre en una finestra nova) creant un rol(s'obre en una finestra nova) nou. Quan està activat, el mode de confinament afegeix restriccions addicionals a sobre de la configuració d’administració existent.

Obteniu més informació sobre el mode de confinament al nostre Centre d'ajuda(s'obre en una finestra nova).

Com que alguns fluxos de treball crítics depenen d’aplicacions, els administradors de l’espai de treball mantenen controls més detallats. Poden triar exactament quines aplicacions —i quines accions específiques dins d’aquestes aplicacions— estan disponibles per als usuaris en mode de confinament. A més, i de manera independent del mode de confinament, la plataforma de registres de l’API de compliment normatiu(s'obre en una finestra nova) ofereix visibilitat detallada sobre l’ús d’aplicacions, les dades compartides i les fonts connectades, ajudant els administradors a mantenir la supervisió.

Tenim previst posar el mode de confinament a disposició dels consumidors en els propers mesos.

Ajudar els usuaris a prendre decisions informades sobre el risc

Els productes d’IA poden ser més útils quan estan connectats a les vostres aplicacions i al web, i hem invertit molt en mantenir segures les dades connectades. Al mateix temps, algunes funcionalitats relacionades amb la xarxa introdueixen nous riscos que encara no estan del tot resolts per les mesures de seguretat i protecció del sector. Alguns usuaris poden sentir-se còmodes assumint aquests riscos, i creiem que és important que puguin decidir si els fan servir i com, especialment quan treballen amb les seves dades privades.

El nostre enfocament ha estat oferir orientació dins del producte per a funcions que poden comportar risc addicional. Per fer-ho més clar i coherent, estem estandarditzant com etiquetem una breu llista de funcionalitats existents. Aquestes funcions faran servir ara una etiqueta coherent de «Risc elevat» a ChatGPT, ChatGPT Atlas i Codex, de manera que els usuaris rebin la mateixa orientació allà on les trobin.

Per exemple, a Codex, el nostre assistent de programació, els desenvolupadors poden concedir a Codex accés a la xarxa perquè pugui fer accions al web, com ara consultar documentació. La pantalla de configuració corresponent inclou l’etiqueta «Risc elevat», juntament amb una explicació clara de què canvia, quins riscos es poden introduir i quan és adequat aquest accés.

Panell de configuració d’«Accés a internet de l’agent» amb l’interruptor activat, que mostra opcions per a una llista de dominis permesos, dominis addicionals permesos (inclòs openai.com), mètodes HTTP permesos i un avís destacat que assenyala riscos de seguretat elevats en activar l’accés a internet.

Una captura de pantalla de la configuració de Codex on els usuaris poden configurar a quina xarxa té accés Codex.

Què ve després

Continuem invertint a reforçar les nostres salvaguardes de seguretat i protecció, especialment davant de riscos nous, emergents o creixents. A mesura que reforcem les salvaguardes d’aquestes funcionalitats, retirarem l’etiqueta de «Risc elevat» un cop determinem que els avenços en seguretat han mitigat prou aquests riscos per a un ús general. També continuarem actualitzant amb el temps quines funcionalitats porten aquesta etiqueta per comunicar millor el risc als usuaris.

Autor

OpenAI