5 de agosto de 2025

Tarjeta de modelo gpt‑oss‑120b & gpt‑oss‑20b

Introducción

Presentamos gpt-oss-120b y gpt-oss-20b, dos modelos de razonamiento con pesos abiertos disponibles bajo la licencia Apache 2.0 y nuestra política de uso de gpt-oss. Desarrollados con la retroalimentación de la comunidad de código abierto, estos modelos solo de texto son compatibles con nuestra Responses API y están diseñados para usarse en flujos de trabajo agénticos con seguimiento estricto de instrucciones, uso de herramientas como la búsqueda web y la ejecución de código Python, y capacidades de razonamiento, incluida la posibilidad de ajustar el esfuerzo de razonamiento para tareas que no requieren razonamiento complejo. Los modelos son personalizables, ofrecen Chain‑of‑Thought (CoT) completo y admiten salidas estructuradas.

La seguridad es fundamental en nuestro enfoque de los modelos abiertos. Presentan un perfil de riesgo diferente al de los modelos propietarios: Una vez liberados, atacantes decididos podrían afinarlos para esquivar rechazos de seguridad o directamente optimizarlos para causar daño, sin que OpenAI pueda aplicar mitigaciones adicionales ni revocar el acceso.

En algunos contextos, los desarrolladores y las empresas deberán implementar salvaguardas adicionales para replicar las protecciones a nivel de sistema incorporadas en los modelos que se ofrecen a través de nuestra API y productos. Llamamos a este documento una tarjeta de modelo, y no una tarjeta de sistema, porque los modelos gpt-oss se usarán como parte de una amplia variedad de sistemas creados y mantenidos por numerosas partes interesadas. Aunque los modelos están diseñados por defecto para cumplir con las políticas de seguridad de OpenAI, otros actores también tomarán e implementarán sus propias decisiones sobre cómo mantener seguros esos sistemas.

Realizamos evaluaciones de capacidad escalables en gpt-oss-120b y confirmamos que el modelo predeterminado no alcanza nuestros umbrales indicativos de High capability en ninguna de las tres Categorías Rastreadas de nuestro Preparedness Framework (Biological and Chemical capability, Cyber capability y AI Self-Improvement). También investigamos dos preguntas adicionales:

¿Podrían actores adversarios afinar gpt-oss-120b para alcanzar High capability en los dominios Biological and Chemical o Cyber? Simulando las acciones potenciales de un atacante, afinamos de forma adversarial gpt‑oss‑120b para estas dos categorías. El Safety Advisory Group (“SAG”) de OpenAI revisó estas pruebas y concluyó que, incluso con un fine-tuning sólido que aprovechó el training stack líder de OpenAI, gpt-oss-120b no alcanzó High capability en los dominios de Biological and Chemical Risk ni Cyber risk.
¿Publicar gpt‑oss‑120b avanzaría significativamente la frontera de las capacidades biológicas en modelos foundation abiertos? Concluimos que la respuesta es no: En la mayoría de las evaluaciones, el rendimiento predeterminado de uno o más modelos abiertos existentes casi iguala el rendimiento de gpt-oss-120b tras un adversarial fine-tuning.

Como parte de este lanzamiento, OpenAI reafirma su compromiso de impulsar una IA beneficiosa y elevar los estándares de seguridad en todo el ecosistema.

Autor

OpenAI

Sigue leyendo

Ver todos

Safety and alignment in an era of long-horizon models

Seguridad20 jul 2026

Why teens deserve access to safe AI — card image

Por qué los adolescentes merecen acceso a una IA segura

Seguridad16 jul 2026

GPT-Red: activar la automejora para mayor robustez

Seguridad15 jul 2026