Ir al contenido principal
OpenAI

12 de febrero de 2025

SeguridadLanzamientoHito

Compartir las especificaciones del último modelo

Hemos actualizado la especificación del modelo basándonos en los comentarios externos y en nuestra investigación continua para definir el comportamiento deseado del modelo.

Cargando…

A continuación, compartimos una actualización importante de la especificación del modelo, un documento que define cómo queremos que se comporten nuestros modelos de IA. Esta actualización refuerza nuestro compromiso con la personalización, transparencia y libertad intelectual a la hora de explorar, debatir y crear con la IA sin restricciones arbitrarias, al mismo tiempo que mantenemos medidas de seguridad para reducir el riesgo de daños reales. Esta actualización se basa en la versión que presentamos en mayo de 2024, a partir de nuestra experiencia al aplicarla en varios contextos, desde la investigación de la alineación hasta el servicio a los usuarios de todo el mundo. 

También compartimos algunos resultados preliminares sobre el grado de cumplimiento de los modelos con los principios de la especificación del modelo en una amplia variedad de escenarios. Los resultados muestran el progreso que hemos conseguido hasta ahora y también nos señalan los aspectos que todavía podemos perfeccionar. Tanto la especificación del modelo como nuestros propios modelos continuarán evolucionando conforme la pongamos en práctica, la compartamos y recibamos comentarios de los distintos actores implicados. Para fomentar un uso amplio y la colaboración, publicamos esta versión de la especificación del modelo en el dominio público con una licencia Creative Commons CC0. Esto significa que los desarrolladores e investigadores pueden utilizarla, adaptarla y desarrollarla libremente en sus propios trabajos.

Objetivos y principios

El objetivo de OpenAI es crear modelos que sean útiles, seguros y estén alineados con las necesidades de los usuarios y desarrolladores, al tiempo que avanzamos en nuestra misión de garantizar que la inteligencia artificial general beneficie a toda la humanidad. Para alcanzar este objetivo, necesitamos desplegar modelos de forma iterativa que empoderen a desarrolladores y usuarios, al mismo tiempo que evitamos que nuestros modelos causen daños graves a los propios usuarios o a terceros, y mantenemos la licencia de operación de OpenAI.

Estos objetivos pueden entrar en conflicto en ocasiones, y la especificación del modelo equilibra estos compromisos indicando al modelo que siga una cadena de mando claramente definida, junto con principios adicionales que establecen límites y comportamientos predeterminados para distintos escenarios. Este marco prioriza el control por parte de los usuarios y desarrolladores, manteniéndose siempre dentro de límites claros y bien definidos:

  • Cadena de mando: Define cómo el modelo prioriza las instrucciones de la plataforma (OpenAI), del desarrollador y del usuario, en ese orden. La especificación del modelo incluye principalmente recomendaciones útiles para la mayoría de situaciones, aunque tanto usuarios como desarrolladores pueden ajustarlas según sus necesidades. Así, usuarios y desarrolladores pueden adaptar totalmente el funcionamiento del modelo, respetando en todo momento las reglas fijadas por la propia plataforma. 
  • Buscar la verdad juntos: Nuestros modelos, como cualquier buen asistente de confianza, están diseñados para que los usuarios puedan tomar las mejores decisiones por sí mismos. Esto implica encontrar un equilibrio entre (1) evitar influir a los usuarios con una agenda determinada, priorizando la objetividad y estando dispuestos a explorar cualquier tema desde cualquier perspectiva, y (2) esforzarse por comprender los objetivos del usuario, aclarar las suposiciones y detalles poco claros, y ofrecer comentarios críticos cuando sea necesario. Es algo que hemos tenido muy en cuenta y mejorado con el tiempo.
  • Obtener los mejores resultados: Establece estándares básicos de competencia, incluyendo precisión factual, creatividad y uso programático.
  • Mantenerse dentro de los límites: Explica cómo el modelo equilibra la autonomía del usuario con las precauciones necesarias para evitar facilitar daños o abusos. Con esta nueva versión, buscamos ofrecer una cobertura total de las razones por las que el modelo podría negarse a cumplir determinadas peticiones, ya sean de usuarios o desarrolladores.
  • Ser cercano: Explica que el modelo, por defecto, mantiene un tono cercano, empático y dispuesto a ayudar, y detalla cómo puede ajustarse este estilo según las necesidades.
  • Usar un estilo adecuado: Ofrece pautas predeterminadas sobre el formato y la presentación. Ya sean listas ordenadas, fragmentos de código concisos o una conversación por voz, nuestro objetivo es garantizar la claridad y la facilidad de uso.

Defensa de la libertad intelectual

La versión actualizada de la especificación del modelo adopta explícitamente la libertad intelectual: la idea de que la IA debe permitir a las personas explorar, debatir y crear sin restricciones arbitrarias, independientemente de lo complejo o controvertido que sea el tema. En un mundo donde las herramientas de IA influyen cada vez más en el debate público, el libre intercambio de información y puntos de vista es esencial para el progreso y la innovación.

Esta filosofía está integrada en las secciones «Mantenerse dentro de los límites» y «Buscar la verdad juntos». Por ejemplo, el modelo no debe dar nunca instrucciones específicas para fabricar bombas ni ayudar a infringir la privacidad de nadie, pero sí está pensado para responder con criterio a cuestiones políticas o culturales delicadas, evitando siempre tomar partido o promover una postura concreta. En definitiva, hemos consolidado la idea de que se puede debatir cualquier tema, siempre que no se cause un perjuicio grave al usuario o a otras personas (como podría ser facilitar actos terroristas).

Medición del progreso

Para entender mejor cómo funcionan los modelos en la práctica, hemos comenzado a reunir una serie de indicaciones complejas, con el objetivo de comprobar si se ajustan a los principios de la especificación del modelo. Las indicaciones se han elaborado combinando generación automática por el modelo y revisión experta humana, para asegurar que abarquen tanto situaciones comunes como casos más complejos.

Un gráfico con barras alternas blancas y amarillas sobre un fondo negro, que representa comparativas de datos. Las barras amarillas presentan un diseño punteado, añadiendo un toque de textura al gráfico.

Los resultados preliminares muestran mejoras significativas en el cumplimiento de la especificación del modelo por parte del modelo, en comparación con nuestro mejor sistema de mayo pasado. Aunque parte de esta mejora puede deberse a cambios en las políticas, creemos que, en su mayoría, es resultado de una mayor alineación del modelo. Si bien los avances son positivos, somos conscientes de que todavía queda mucho por mejorar.

Para nosotros, esto es solo el comienzo de un proceso que seguirá evolucionando. Nuestra intención es seguir incorporando nuevos retos, sobre todo casos identificados en situaciones reales, que todavía no están totalmente cubiertos por nuestros modelos o por la especificación del modelo. 

Al desarrollar esta versión de la especificación del modelo, incorporamos comentarios recibidos sobre la primera versión, así como aprendizajes de la investigación sobre alineación y del despliegue en el mundo real. De cara al futuro, nuestro objetivo es considerar las aportaciones de un público mucho más diverso. Con el objetivo de avanzar en esa línea, hemos realizado estudios piloto con unas 1000 personas, quienes han evaluado el funcionamiento del modelo, han revisado las normas propuestas y han aportado sus comentarios. Aunque estos estudios todavía no representan todos los puntos de vista posibles, las primeras aportaciones ya nos han ayudado a introducir algunos cambios. Somos conscientes de que es un proceso que requiere mejora constante, por lo que seguimos aprendiendo y perfeccionando nuestra forma de trabajar.

Publicación en abierto de la especificación del modelo

Ponemos a disposición de todos esta nueva versión de la especificación del modelo en el dominio público, con la licencia Creative Commons CC0. Así, tanto desarrolladores como investigadores tienen total libertad para emplear, modificar o ampliar la especificación del modelo en sus proyectos. También estamos publicando en abierto las indicaciones de evaluación empleadas anteriormente y nuestro objetivo es lanzar más código, recursos y herramientas para la evaluación y alineación de la especificación en el futuro.

Puedes encontrar estas indicaciones y el código fuente de la especificación del modelo en un nuevo repositorio de Github(se abre en una ventana nueva), donde planeamos publicar regularmente nuevas versiones de la especificación en el futuro.

¿Cuáles son las perspectivas de futuro?

A medida que nuestros sistemas de IA evolucionen, seguiremos revisando estos principios, invitando a la comunidad a compartir sus opiniones y comunicando abiertamente nuestros avances. De ahora en adelante, no publicaremos entradas en el blog para cada actualización de la especificación del modelo. En cambio, podrás encontrar y seguir todas las actualizaciones en model-spec.openai.com(se abre en una ventana nueva).

Queremos seguir abriendo la puerta a nuevos usos de manera segura, adaptando nuestra estrategia a medida que avanzamos en investigación e innovación. El papel cada vez mayor de la IA en nuestra vida cotidiana hace que sea esencial seguir aprendiendo, mejorando y fomentando un diálogo abierto. Este planteamiento recoge tanto lo aprendido como nuestra creencia de que la alineación de la inteligencia artificial es un camino en constante evolución, y queremos invitarte a recorrerlo con nosotros. Si tienes comentarios sobre esta especificación, puedes compartirlos aquí.