Ficha de modelo gpt‑oss‑120b & gpt‑oss‑20b
Presentamos gpt-oss-120b y gpt-oss-20b, dos modelos de razonamiento con pesos abiertos disponibles con la licencia Apache 2.0 y nuestra política de uso de gpt-oss. Desarrollados con los comentarios de la comunidad de código abierto, estos modelos exclusivamente de texto son compatibles con nuestra Responses API y están diseñados para usarse en flujos de trabajo agénticos con un seguimiento estricto de instrucciones, uso de herramientas como la búsqueda web y la ejecución de código Python, y capacidades de razonamiento, incluida la posibilidad de ajustar el esfuerzo de razonamiento para tareas que no requieren razonamientos complejos. Los modelos son personalizables, ofrecen Chain‑of‑Thought (CoT) completo y admiten salidas estructuradas.
La seguridad es un pilar fundamental de nuestro enfoque hacia los modelos abiertos. Presentan un perfil de riesgo diferente al de los modelos propietarios: Una vez publicados, atacantes decididos podrían afinarlos para eludir rechazos de seguridad o incluso optimizarlos directamente para causar daño, sin que OpenAI tenga posibilidad de aplicar mitigaciones adicionales ni revocar el acceso.
En algunos contextos, los desarrolladores y las empresas tendrán que implementar salvaguardas adicionales para reproducir las protecciones a nivel de sistema integradas en los modelos que se sirven mediante nuestra API y productos. Denominamos este documento una tarjeta de modelo, en lugar de una tarjeta de sistema, porque los modelos gpt-oss se utilizarán como parte de una amplia variedad de sistemas creados y mantenidos por distintos grupos de interés. Aunque los modelos están diseñados por defecto para seguir las políticas de seguridad de OpenAI, otros actores también tomarán e implementarán sus propias decisiones sobre cómo mantener seguros esos sistemas.
Realizamos evaluaciones de capacidad escalables en gpt-oss-120b y confirmamos que el modelo predeterminado no alcanza nuestros umbrales indicativos de High capability en ninguna de las tres Categorías Seguidas de nuestro Preparedness Framework (Biological and Chemical capability, Cyber capability y AI Self-Improvement). También investigamos dos preguntas adicionales:
- ¿Podrían actores adversarios afinar gpt-oss-120b para alcanzar High capability en los dominios Biological and Chemical o Cyber? Simulando las acciones potenciales de un atacante, afinamos de forma adversarial gpt‑oss‑120b para estas dos categorías. El Safety Advisory Group (“SAG”) de OpenAI revisó estas pruebas y concluyó que, incluso tras un fine-tuning exhaustivo realizado con el training stack líder de OpenAI, gpt-oss-120b no alcanzó el nivel High capability en Biological and Chemical Risk ni en Cyber risk.
- ¿La publicación de gpt‑oss‑120b avanzaría de forma significativa la frontera de las capacidades biológicas en modelos foundation abiertos? Concluimos que la respuesta es no: En la mayoría de las evaluaciones, el rendimiento predeterminado de uno o más modelos abiertos existentes se acerca mucho al rendimiento de gpt-oss-120b tras un adversarial fine-tuning.
Como parte de este lanzamiento, OpenAI reafirma su compromiso de impulsar una IA beneficiosa y elevar los estándares de seguridad en todo el ecosistema.


