Avances en ciencia y matemáticas con GPT‑5.2
GPT‑5.2 es nuestro modelo más potente hasta la fecha para trabajos de matemáticas y ciencias.
Una de nuestras expectativas para la IA avanzada es que impulse la investigación científica en beneficio de todas las personas, ayudando a los equipos a explorar más ideas, evaluarlas con mayor rapidez y convertir los descubrimientos en resultados de impacto.
Durante el último año, hemos colaborado estrechamente con especialistas en matemáticas, física, biología e informática para entender dónde la IA puede aportar valor y dónde aún presenta limitaciones. El mes pasado, publicamos un artículo que recopila estudios de caso iniciales en matemáticas —incluidos avances en el campo de las matemáticas teóricas— así como en física, biología, ciencias de la computación, astronomía y ciencia de materiales, donde GPT‑5 asistió a distintos equipos de investigación. Estos ejemplos muestran que el modelo ya comienza a contribuir al trabajo científico real. Con GPT‑5.2 observamos que estos avances se vuelven más consistentes y fiables.
GPT‑5.2 Pro y GPT‑5.2 Thinking son nuestros modelos más potentes hasta ahora para trabajos científicos y matemáticos.
El razonamiento matemático sólido es esencial para garantizar la fiabilidad en el trabajo científico y técnico. Permite que los modelos sigan una lógica de varios pasos, mantengan la coherencia de las cantidades y eviten errores sutiles que pueden acumularse en análisis reales, desde simulaciones y estadísticas hasta predicciones y modelización. Las mejoras en evaluaciones como FrontierMath no reflejan una habilidad aislada, sino un razonamiento general más robusto y una mayor capacidad de abstracción, cualidades que se aplican directamente a flujos de trabajo científicos como la programación, el análisis de datos y el diseño experimental.
Estas capacidades también están estrechamente vinculadas al avance hacia la inteligencia general. Un sistema que puede analizar con fiabilidad mediante la abstracción, mantener la coherencia a lo largo de extensas cadenas de razonamiento y generalizar entre distintos dominios demuestra rasgos fundamentales para la IAG: no se trata de trucos para tareas concretas, sino de habilidades de razonamiento amplias y transferibles, valiosas en la ciencia, la ingeniería y la toma de decisiones en el mundo real.
Creemos que los modelos GPT‑5.2 Pro y GPT‑5.2 Thinking son los mejores del mundo para apoyar y acelerar el trabajo de los científicos. En GPQA Diamond, una evaluación de preguntas y respuestas a nivel de posgrado diseñada por Google, GPT‑5.2 Pro alcanza un 93,2 %, seguido de cerca por GPT‑5.2 Thinking con un 92,4 %.
En GPQA Diamond(se abre en una ventana nueva), los modelos contestan preguntas de opción múltiple sobre física, química y biología. No se habilitaron herramientas y el esfuerzo de razonamiento se puso al máximo.
En FrontierMath (niveles 1-3), una evaluación de matemáticas a nivel experto, GPT‑5.2 Thinking alcanzó un nuevo récord, resolviendo el 40,3 % de los problemas.
En FrontierMath(se abre en una ventana nueva), los modelos resuelven problemas matemáticos de nivel experto. Se habilitó una herramienta de Python y se configuró el esfuerzo de razonamiento al máximo.
Caso de estudio
Este resultado sugiere una orientación útil sobre cómo los sistemas de IA pueden prestar asistencia a la investigación científica, especialmente en dominios con fundamentos teóricos axiomáticos, como las matemáticas y la informática teórica. En entornos de este tipo, los modelos de vanguardia pueden ayudar a explorar demostraciones, comprobar hipótesis e identificar conexiones que, de otro modo, requerirían un esfuerzo humano considerable para descubrir.
Al mismo tiempo, estos sistemas no reemplazan a los investigadores humanos. El juicio experto, la verificación y la comprensión del dominio siguen siendo esenciales. Incluso los modelos más avanzados pueden cometer errores o basarse en suposiciones implícitas. Sin embargo, también pueden generar argumentos detallados y estructurados que merecen ser analizados y refinados por personas. Por ello, avanzar de manera fiable con IA requiere flujos de trabajo que integren validación, transparencia y colaboración a lo largo de todo el proceso.
Visto como estudio de caso, este resultado muestra un enfoque emergente en la práctica de la investigación. Modelos como GPT‑5.2 pueden servir como herramientas para apoyar el razonamiento matemático y acelerar la exploración en fases iniciales, mientras que la responsabilidad de la precisión, la interpretación y el contexto recae en los investigadores humanos. Usados con cuidado, estos sistemas pueden agilizar aspectos importantes del trabajo teórico sin sustituir el papel central del juicio humano en la investigación científica.


