14 de abril de 2026

Acceso de confianza para la próxima era de la ciberdefensa

Seguimos desarrollando el acceso de confianza, las medidas de protección y el apoyo al ecosistema para ayudar a los defensores cibernéticos a protegernos a todos.

Cargando...

Vamos a ampliar nuestro programa Trusted Access for Cyber (TAC) a miles de defensores individuales verificados y a cientos de equipos encargados de proteger software crítico. Durante años, hemos estado construyendo un programa de defensa cibernética sobre los principios de acceso democratizado, implementación iterativa y resiliencia del ecosistema. Como preparación para modelos cada vez más capaces de OpenAI en los próximos meses, estamos perfeccionando nuestros modelos específicamente para habilitar casos de uso de ciberseguridad defensiva, comenzando hoy con una variante de GPT‑5.4 entrenada para ser ciberpermisiva: GPT‑5.4‑Cyber. En esta publicación, compartimos cómo esperamos que nuestro enfoque de ampliar la defensa cibernética en sintonía con el aumento de las capacidades del modelo sirva de guía para las pruebas y la implementación de futuras versiones.

El uso progresivo de la IA acelera el trabajo de los defensores —quienes se encargan de mantener seguros los sistemas, los datos y los usuarios— y les permite encontrar y solucionar problemas con mayor rapidez en la infraestructura digital de la que todos dependen. Del mismo modo, los atacantes usan⁠ la IA con la intención de causar daño. Nos venimos preparando para esto. Desde 2023, hemos apoyado a los defensores a través del Programa de Subvenciones de Ciberseguridad⁠ y hemos reforzado las medidas de protección mediante el Marco de preparación⁠. Ese mismo año, empezamos a evaluar las capacidades cibernéticas de nuestros modelos y, en 2025, comenzamos a incluir medidas de protección específicas para ciberseguridad ⁠(se abre en una nueva ventana)en las implementaciones de modelos⁠. A principios de este año, reforzamos nuestro apoyo a los defensores con el lanzamiento de Codex Security⁠ para detectar y corregir vulnerabilidades a gran escala. Nuestro enfoque respecto a este avance continuo de las capacidades se guía por tres principios:

Acceso democratizado: nuestro objetivo es poner estas herramientas al alcance del mayor número posible de personas, al tiempo que evitamos el uso indebido. Diseñamos mecanismos que evitan decidir de forma arbitraria quién obtiene acceso para un uso legítimo y quién no. Eso significa utilizar criterios y métodos claros y objetivos, como procedimientos sólidos de KYC y verificación de identidad, para determinar quién puede acceder⁠ a funcionalidades más avanzadas y automatizar estos procesos con el tiempo. En definitiva, nuestro objetivo es poner a disposición de los actores legítimos, tanto grandes como pequeños, capacidades defensivas avanzadas, incluidos aquellos responsables de proteger las infraestructuras críticas, los servicios públicos y los sistemas digitales de los que depende la gente a diario.
Implementación iterativa: aprendemos más al lanzar estos sistemas con cautela⁠ y mejorarlos con el tiempo. A medida que comprendemos mejor tanto sus capacidades como sus riesgos, actualizamos nuestros modelos y sistemas de seguridad en consecuencia. Esto implica comprender los beneficios y riesgos específicos de cada modelo, mejorar la resistencia al jailbreak y otros ataques maliciosos, y reforzar las capacidades defensivas, todo ello sin dejar de mitigar los daños.
Invertir en la resiliencia del ecosistema: respaldamos y aceleramos la labor de la comunidad de defensores mediante vías de acceso confiables, subvenciones⁠ específicas, contribuciones a iniciativas de seguridad de código abierto⁠(se abre en una nueva ventana) y tecnologías como Codex Security⁠, que ayudan a los defensores a encontrar y corregir vulnerabilidades más rápidamente.

Nuestra estrategia para la resiliencia en ciberseguridad y para acelerar la defensa

Durante años, nuestra estrategia de ciberseguridad ha sido invertir en investigación, prevenir el uso indebido y acelerar el trabajo de los defensores. A medida que las capacidades de los modelos han avanzado, hemos ampliado nuestros programas para alcanzar estos objetivos, que se basan en las siguientes convicciones:

El riesgo cibernético ya está aquí y se está acelerando, pero podemos actuar. La infraestructura digital hace años que es vulnerable⁠(se abre en una nueva ventana), incluso antes de que surgiera la IA avanzada. Ahora, los modelos existentes pueden ayudar a detectar vulnerabilidades, razonar sobre bases de código y respaldar partes significativas del flujo de trabajo cibernético, y los actores de amenazas están probando nuevos enfoques impulsados por IA. Hemos visto cómo los sofisticados arneses logran capacidades cada vez más potentes al aprovechar más recursos computacionales durante la fase de pruebas con los modelos existentes. Eso significa que las medidas de protección no pueden esperar a que se alcance un único objetivo futuro.
El acceso se amplía según quién utilice estos sistemas y cómo se utilicen. Las capacidades cibernéticas son intrínsecamente de doble uso, así que el riesgo no viene determinado únicamente por el modelo. También depende del usuario, de las señales de confianza⁠(se abre en una nueva ventana) a su alrededor y del nivel de acceso que se les otorga.
- Un acceso amplio a modelos generales con medidas de protección puede coexistir con controles más específicos para capacidades de mayor riesgo, respaldados por una verificación más sólida, señales de intención más claras y una mejor visibilidad del uso.
- Para permitir un uso responsable a gran escala, necesitamos sistemas que validen a los usuarios y los casos de uso fiables de manera más automatizada y objetiva. Esto nos permite ampliar el acceso basándonos en pruebas y señales reales de confianza, en vez de depender de decisiones manuales. No creemos que sea práctico ni adecuado decidir de forma centralizada quién puede defenderse. Más bien, nuestro objetivo es facilitar el acceso al mayor número posible de defensores legítimos, basándonos en la verificación, las señales de confianza y la responsabilidad.
Las defensas deben crecer continuamente en función de la capacidad. A medida que aumentan las capacidades de los modelos, las defensas deben adaptarse al mismo ritmo. Hemos observado mejoras constantes en la codificación de los agentes, lo cual tiene implicaciones directas para la ciberseguridad, y hemos adaptado nuestro enfoque en consecuencia.
- Comenzamos el entrenamiento de seguridad específico para ciberseguridad con GPT‑5.2 y luego lo ampliamos con medidas de protección adicionales mediante GPT‑5.3‑Codex y GPT‑5.4, donde también clasificamos el modelo con una capacidad cibernética "alta" según nuestro Marco de preparación. Al mismo tiempo, reforzamos el apoyo a los defensores: lanzamos un programa de subvenciones de ciberseguridad de 10 millones de dólares⁠, llegamos a más de 1000 proyectos de código abierto con Codex para Open Source⁠(se abre en una nueva ventana), que ofrece análisis de seguridad gratuitos, y seguimos mejorando Codex Security.
- Codex Security, que se lanzó en versión beta privada hace seis meses y en una versión preliminar para investigación a principios de este año⁠, supervisa automáticamente las bases de código, valida problemas y propone soluciones. A medida que los modelos han mejorado, también lo han hecho la precisión y la utilidad del sistema. Desde el lanzamiento reciente, Codex Security ha contribuido a corregir más de 3000 vulnerabilidades críticas y de gravedad alta, junto con muchos más hallazgos corregidos de menor severidad en todo el ecosistema.
- A lo largo de estos lanzamientos, también hemos perfeccionado la forma en que los modelos gestionan las solicitudes sensibles, ajustando los límites de rechazo mientras ampliamos el acceso confiable mediante programas como TAC.
El desarrollo de software debe hacerse más seguro. El ecosistema más sólido es aquel que identifica, valida y corrige continuamente los problemas de seguridad a medida que se desarrolla el software. Al integrar modelos avanzados de programación con agentes en los flujos de trabajo de desarrollo, podemos ofrecer a los desarrolladores comentarios inmediatos y prácticos mientras desarrollan, pasando de auditorías esporádicas e inventarios estáticos de errores a una reducción continua y tangible del riesgo.

Ampliar el programa Trusted Access for Cyber y GPT‑5.4‑Cyber

Queremos empoderar a los defensores mediante un amplio acceso a capacidades de vanguardia, incluidos modelos diseñados específicamente para la ciberseguridad. En febrero, presentamos el programa Trusted Access for Cyber⁠ (TAC) que incluye tanto la verificación automática de la identidad de las personas (para reducir las trabas que suponen las medidas de protección en las tareas relacionadas con la ciberseguridad) como la colaboración con un grupo selecto de organizaciones para ofrecer modelos más flexibles en materia de ciberseguridad.

Hoy ampliamos este programa introduciendo niveles adicionales de acceso para los usuarios dispuestos a colaborar con OpenAI para acreditarse como defensores de la ciberseguridad. Los clientes de los niveles más altos tendrán acceso a GPT‑5.4‑Cyber, un modelo optimizado específicamente para ofrecer capacidades cibernéticas adicionales y con menos restricciones funcionales. Se trata de una versión de GPT‑5.4 que reduce el umbral de rechazo para las tareas legítimas de ciberseguridad y habilita nuevas capacidades para flujos de trabajo defensivos avanzados, incluyendo funciones de ingeniería inversa de binarios que permiten a los profesionales de la seguridad analizar software compilado en busca de posible malware, vulnerabilidades y solidez de la seguridad sin necesidad de acceder a su código fuente.

Dado que este modelo es más permisivo, comenzaremos con una implementación limitada e iterativa dirigida a proveedores de seguridad, organizaciones e investigadores de confianza. El acceso a los modelos permisivos y con capacidades cibernéticas puede tener limitaciones, sobre todo cuando se usan sin visibilidad, como la Retención cero de datos⁠(se abre en una nueva ventana) (ZDR). Esto es particularmente cierto para los desarrolladores y las organizaciones que acceden a nuestros modelos a través de plataformas de terceros, donde OpenAI puede tener menos visibilidad directa sobre el usuario, el entorno o el propósito de la solicitud.

Obtener acceso al programa TAC es fácil:

Los usuarios pueden verificar su identidad en chatgpt.com/cyber⁠(se abre en una nueva ventana).
Las empresas pueden solicitar acceso de confianza⁠ para su equipo a través de su representante de OpenAI.

Todos los clientes aprobados a través de este proceso tendrán acceso a versiones de los modelos existentes con menos restricciones en cuanto a las medidas de protección que podrían activarse ante actividades cibernéticas de doble uso, lo que les permitirá seguir contribuyendo a la educación en materia de seguridad, la programación defensiva y la investigación responsable de vulnerabilidades. Los clientes que ya forman parte del programa TAC y que deseen acreditarse además como defensores cibernéticos legítimos pueden manifestar su interés⁠(se abre en una nueva ventana) en obtener niveles adicionales de acceso, incluida la solicitud de acceso a GPT‑5.4‑Cyber.

Perspectivas para el próximo lanzamiento de nuestro modelo y más allá

Nuestras defensas de ciberseguridad son el resultado de varios meses de mejora iterativa. Creemos que las salvaguardas actuales reducen suficientemente el riesgo cibernético como para respaldar el despliegue amplio de los modelos actuales. Esperamos que estas salvaguardas sean suficientes para los próximos modelos más potentes, mientras que los modelos entrenados explícitamente para ser más permisivos en el trabajo de ciberseguridad requerirán implementaciones más restrictivas y controles adecuados.

A largo plazo, para garantizar que la ciberseguridad de la IA siga siendo suficiente, también prevemos que se necesitarán defensas más amplias para los modelos futuros, cuyas capacidades superarán rápidamente incluso a los mejores modelos diseñados específicamente para este fin que existen actualmente.

2026

Autor

OpenAI

Sigue leyendo

Ver todos

OpenAI y Hugging Face abordan incidente de seguridad

Seguridad21 jul 2026

Safety and alignment in an era of long-horizon models

Seguridad20 jul 2026

Why teens deserve access to safe AI — card image

Por qué los adolescentes merecen acceso a una IA segura

Seguridad16 jul 2026