Tarjeta de modelo gpt‑oss‑120b & gpt‑oss‑20b
Presentamos gpt-oss-120b y gpt-oss-20b, dos modelos de razonamiento con pesos abiertos disponibles bajo la licencia Apache 2.0 y nuestra política de uso de gpt-oss. Desarrollados con la retroalimentación de la comunidad de código abierto, estos modelos solo de texto son compatibles con nuestra Responses API y están diseñados para usarse en flujos de trabajo agénticos con seguimiento estricto de instrucciones, uso de herramientas como la búsqueda web y la ejecución de código Python, y capacidades de razonamiento, incluida la posibilidad de ajustar el esfuerzo de razonamiento para tareas que no requieren razonamiento complejo. Los modelos son personalizables, ofrecen Chain‑of‑Thought (CoT) completo y admiten salidas estructuradas.
La seguridad es fundamental en nuestro enfoque de los modelos abiertos. Presentan un perfil de riesgo diferente al de los modelos propietarios: Una vez liberados, atacantes decididos podrían afinarlos para esquivar rechazos de seguridad o directamente optimizarlos para causar daño, sin que OpenAI pueda aplicar mitigaciones adicionales ni revocar el acceso.
En algunos contextos, los desarrolladores y las empresas deberán implementar salvaguardas adicionales para replicar las protecciones a nivel de sistema incorporadas en los modelos que se ofrecen a través de nuestra API y productos. Llamamos a este documento una tarjeta de modelo, y no una tarjeta de sistema, porque los modelos gpt-oss se usarán como parte de una amplia variedad de sistemas creados y mantenidos por numerosas partes interesadas. Aunque los modelos están diseñados por defecto para cumplir con las políticas de seguridad de OpenAI, otros actores también tomarán e implementarán sus propias decisiones sobre cómo mantener seguros esos sistemas.
Realizamos evaluaciones de capacidad escalables en gpt-oss-120b y confirmamos que el modelo predeterminado no alcanza nuestros umbrales indicativos de High capability en ninguna de las tres Categorías Rastreadas de nuestro Preparedness Framework (Biological and Chemical capability, Cyber capability y AI Self-Improvement). También investigamos dos preguntas adicionales:
- ¿Podrían actores adversarios afinar gpt-oss-120b para alcanzar High capability en los dominios Biological and Chemical o Cyber? Simulando las acciones potenciales de un atacante, afinamos de forma adversarial gpt‑oss‑120b para estas dos categorías. El Safety Advisory Group (“SAG”) de OpenAI revisó estas pruebas y concluyó que, incluso con un fine-tuning sólido que aprovechó el training stack líder de OpenAI, gpt-oss-120b no alcanzó High capability en los dominios de Biological and Chemical Risk ni Cyber risk.
- ¿Publicar gpt‑oss‑120b avanzaría significativamente la frontera de las capacidades biológicas en modelos foundation abiertos? Concluimos que la respuesta es no: En la mayoría de las evaluaciones, el rendimiento predeterminado de uno o más modelos abiertos existentes casi iguala el rendimiento de gpt-oss-120b tras un adversarial fine-tuning.
Como parte de este lanzamiento, OpenAI reafirma su compromiso de impulsar una IA beneficiosa y elevar los estándares de seguridad en todo el ecosistema.


