5 de agosto de 2025

Ficha de modelo gpt‑oss‑120b & gpt‑oss‑20b

Introducción

Presentamos gpt-oss-120b y gpt-oss-20b, dos modelos de razonamiento con pesos abiertos disponibles con la licencia Apache 2.0 y nuestra política de uso de gpt-oss. Desarrollados con los comentarios de la comunidad de código abierto, estos modelos exclusivamente de texto son compatibles con nuestra Responses API y están diseñados para usarse en flujos de trabajo agénticos con un seguimiento estricto de instrucciones, uso de herramientas como la búsqueda web y la ejecución de código Python, y capacidades de razonamiento, incluida la posibilidad de ajustar el esfuerzo de razonamiento para tareas que no requieren razonamientos complejos. Los modelos son personalizables, ofrecen Chain‑of‑Thought (CoT) completo y admiten salidas estructuradas.

La seguridad es un pilar fundamental de nuestro enfoque hacia los modelos abiertos. Presentan un perfil de riesgo diferente al de los modelos propietarios: Una vez publicados, atacantes decididos podrían afinarlos para eludir rechazos de seguridad o incluso optimizarlos directamente para causar daño, sin que OpenAI tenga posibilidad de aplicar mitigaciones adicionales ni revocar el acceso.

En algunos contextos, los desarrolladores y las empresas tendrán que implementar salvaguardas adicionales para reproducir las protecciones a nivel de sistema integradas en los modelos que se sirven mediante nuestra API y productos. Denominamos este documento una tarjeta de modelo, en lugar de una tarjeta de sistema, porque los modelos gpt-oss se utilizarán como parte de una amplia variedad de sistemas creados y mantenidos por distintos grupos de interés. Aunque los modelos están diseñados por defecto para seguir las políticas de seguridad de OpenAI, otros actores también tomarán e implementarán sus propias decisiones sobre cómo mantener seguros esos sistemas.

Realizamos evaluaciones de capacidad escalables en gpt-oss-120b y confirmamos que el modelo predeterminado no alcanza nuestros umbrales indicativos de High capability en ninguna de las tres Categorías Seguidas de nuestro Preparedness Framework (Biological and Chemical capability, Cyber capability y AI Self-Improvement). También investigamos dos preguntas adicionales:

¿Podrían actores adversarios afinar gpt-oss-120b para alcanzar High capability en los dominios Biological and Chemical o Cyber? Simulando las acciones potenciales de un atacante, afinamos de forma adversarial gpt‑oss‑120b para estas dos categorías. El Safety Advisory Group (“SAG”) de OpenAI revisó estas pruebas y concluyó que, incluso tras un fine-tuning exhaustivo realizado con el training stack líder de OpenAI, gpt-oss-120b no alcanzó el nivel High capability en Biological and Chemical Risk ni en Cyber risk.
¿La publicación de gpt‑oss‑120b avanzaría de forma significativa la frontera de las capacidades biológicas en modelos foundation abiertos? Concluimos que la respuesta es no: En la mayoría de las evaluaciones, el rendimiento predeterminado de uno o más modelos abiertos existentes se acerca mucho al rendimiento de gpt-oss-120b tras un adversarial fine-tuning.

Como parte de este lanzamiento, OpenAI reafirma su compromiso de impulsar una IA beneficiosa y elevar los estándares de seguridad en todo el ecosistema.

Autor

OpenAI

Sigue leyendo

Ver todo

Safety and alignment in an era of long-horizon models

Seguridad20 jul 2026

Why teens deserve access to safe AI — card image

Por qué los adolescentes merecen acceso a una IA segura

Seguridad16 jul 2026

GPT-Red: abrir la puerta a la automejora para la robustez

Seguridad15 jul 2026