Un modelo de OpenAI ha refutado una conjetura central de la geometría discreta
Durante casi 80 años, los matemáticos han estudiado una pregunta engañosamente sencilla: si colocas puntos en el plano, ¿cuántos pares pueden estar a una distancia de exactamente ?
Este es el problema planar de la distancia unitaria, planteado por primera vez por Paul Erdős en 1946. Es una de las preguntas más conocidas de la geometría combinatoria, fácil de enunciar y notablemente difícil de resolver. El libro de 2005 Research Problems in Discrete Geometry, de Brass, Moser y Pach, lo llama «posiblemente el problema más conocido (y el más sencillo de explicar) de la geometría combinatoria». Noga Alon, destacado combinatorista de Princeton, lo describe como «uno de los problemas favoritos de Erdős». Erdős incluso ofreció un premio en metálico por resolver este problema.
Hoy compartimos un avance en el problema de la distancia unitaria. Desde el trabajo original de Erdős, la creencia predominante ha sido que las construcciones de «cuadrícula cuadrada» que se muestran más abajo eran esencialmente óptimas para maximizar el número de pares a distancia unitaria. Un modelo interno de OpenAI ha refutado esta conjetura sostenida durante décadas, aportando una familia infinita de ejemplos que produce una mejora polinómica. La prueba ha sido revisada por un grupo de matemáticos externos. También han escrito un artículo complementario que explica el argumento y aporta más antecedentes y contexto sobre la importancia del resultado.
El resultado también destaca por cómo se encontró. La prueba provino de un nuevo modelo de razonamiento de uso general, y no de un sistema entrenado específicamente para matemáticas, con andamiaje para buscar estrategias de demostración o dirigido en particular al problema de la distancia unitaria. Como parte de un esfuerzo más amplio por comprobar si los modelos avanzados pueden contribuir a la investigación de frontera, lo evaluamos con una colección de problemas de Erdős. En este caso, produjo una prueba que resolvía el problema abierto.
Esta prueba es un hito importante para las comunidades de las matemáticas y la IA. Marca la primera vez que un problema abierto destacado, central para un subcampo de las matemáticas, ha sido resuelto de forma autónoma por la IA. También demuestra la profundidad de razonamiento que ahora admiten estos sistemas. Las matemáticas ofrecen un banco de pruebas especialmente claro para el razonamiento: los problemas son precisos, las posibles pruebas pueden verificarse y un argumento largo solo funciona si el razonamiento se mantiene coherente de principio a fin. También destaca el método con el que se resolvió el problema. La prueba aplica ideas inesperadas y sofisticadas de la teoría algebraica de números a una cuestión geométrica elemental.
Tim Gowers, galardonado con la Medalla Fields, califica el resultado en el artículo complementario de «un hito en las matemáticas de IA». Según el destacado teórico de números Arul Shankar, «En mi opinión, este artículo demuestra que los modelos actuales de IA van más allá de ser simples ayudantes de los matemáticos humanos: son capaces de tener ideas originales e ingeniosas, y luego llevarlas a buen término».
La prueba está disponible aquí(se abre en una ventana nueva). El artículo complementario de destacados matemáticos externos está disponible aquí(se abre en una ventana nueva). Puedes encontrar una versión abreviada de la cadena de pensamiento del modelo aquí(se abre en una ventana nueva).
Construcción conocida anteriormente de muchas distancias unitarias a partir de una retícula cuadrada reescalada.
Sea el mayor número posible de pares a distancia unitaria entre puntos del plano. Es fácil construir ejemplos que alcanzan una tasa de crecimiento lineal: colocar puntos en una línea da pares, mientras que una retícula cuadrada da alrededor de pares. La mejor construcción conocida hasta ahora, derivada de una retícula cuadrada reescalada, resulta dar aún más: para una constante . Como tiende a infinito con , el término adicional del exponente tiende a , lo que significa que estas construcciones logran un crecimiento solo ligeramente más rápido que el lineal. Durante décadas, se creyó de forma generalizada que esta tasa era esencialmente la mejor posible y que ninguna construcción podía superar significativamente la retícula cuadrada. En términos técnicos, Erdős conjeturó una cota superior de , en la que el adicional indica un término que tiende a con .
Nuestro nuevo resultado refuta esta conjetura. Más precisamente, para infinitos valores de , la prueba construye configuraciones de puntos con al menos pares a distancia unitaria, para algún exponente fijo . (La prueba original de IA no da un explícito, pero un próximo refinamiento del profesor de matemáticas de Princeton Will Sawin ha demostrado que puede tomarse .)
La historia del problema ayuda a entender por qué el resultado es sorprendente. La mejor cota inferior conocida había permanecido esencialmente sin cambios desde la construcción original de Erdős de 1946. La mejor cota superior, , se remonta al trabajo de Spencer, Szemerédi y Trotter en 1984 y, pese a refinamientos posteriores y a trabajos conexos sobre la estructura del problema por parte de Székely, Katz y Silier, Pach, Raz y Solymosi, entre otros, la cota superior ha permanecido esencialmente sin cambios. Como prueba a favor de la conjetura, Matoušek y Alon-Bucić-Sauermann estudiaron el problema con distancias no euclídeas en el plano y demostraron que «la mayoría» de estas distancias no euclídeas obedecen la conjetura en cierto sentido.
Sorprendentemente, los ingredientes clave de la construcción proceden de una parte muy distinta de las matemáticas conocida como teoría algebraica de números, que estudia conceptos como la factorización en extensiones de los enteros conocidas como cuerpos algebraicos de números.
Tras verificar la prueba inicial, investigamos la tasa de éxito de nuestros modelos en este problema con distintas cantidades de cómputo en tiempo de prueba. Los resultados se muestran aquí.
A grandes rasgos, la prueba comienza con una idea geométrica familiar y la lleva en una dirección inesperada.
La cota inferior original de Erdős puede entenderse a través de los enteros gaussianos: números de la forma , donde y son enteros e es la raíz cuadrada de . Los enteros gaussianos amplían los enteros ordinarios y, como ellos, disfrutan de propiedades como la factorización única en primos. Estas extensiones de los enteros ordinarios o de los racionales se conocen como cuerpos algebraicos de números. El nuevo argumento sustituye los enteros gaussianos por generalizaciones más complicadas de la teoría algebraica de números, con simetrías más ricas que pueden crear muchas más diferencias de longitud unitaria.
El argumento preciso utiliza herramientas como torres infinitas de cuerpos de clases y la teoría de Golod–Shafarevich para mostrar que los cuerpos numéricos necesarios para el argumento existen realmente. Estas ideas eran bien conocidas por los teóricos algebraicos de números, pero fue una gran sorpresa que estos conceptos tengan implicaciones para cuestiones geométricas en el plano euclídeo.
Este resultado marca un momento importante en la interacción entre la IA y las matemáticas: un sistema de IA ha resuelto de forma autónoma un problema abierto que llevaba décadas sin resolver en el centro de un campo activo. También ofrece un primer vistazo a un nuevo tipo de colaboración entre la IA y los matemáticos humanos. En este caso, el trabajo complementario de matemáticos externos ofrece una imagen sustancialmente más rica que la solución original por sí sola.
Como escribe Thomas Bloom en la nota complementaria:
«Al evaluar la importancia y la influencia de una prueba generada por IA, una pregunta que me hago es: ¿nos ha enseñado esto algo nuevo sobre el problema? ¿Entendemos mejor ahora la geometría discreta? Creo que la respuesta es un sí matizado: esto muestra que las construcciones de teoría de números tienen mucho más que decir sobre este tipo de cuestiones de lo que sospechábamos; además, que la teoría de números necesaria puede ser muy profunda. Sin duda, muchos teóricos algebraicos de números examinarán de cerca otros problemas abiertos de geometría discreta en los próximos meses.»
La conexión inesperada entre la teoría algebraica de números y la geometría discreta revelada por la solución es parte de lo que hace notable el resultado. No se limita a resolver una conjetura concreta, sino que puede ofrecer a los matemáticos un puente para empezar a explorar otros problemas relacionados.
Bloom también apunta a una posibilidad más amplia:
«Las fronteras del conocimiento son muy irregulares, y sin duda los próximos meses y años traerán éxitos similares en muchas otras áreas de las matemáticas, donde problemas abiertos sin solucionar desde hace décadas se resuelvan gracias a que una IA revele conexiones inesperadas y lleve la maquinaria técnica existente hasta su límite. La IA nos está ayudando a explorar más plenamente la catedral de las matemáticas que hemos construido a lo largo de los siglos; ¿qué otras maravillas aún no vistas esperan entre bastidores?»
Este resultado ofrece un ejemplo prometedor: la IA aporta no solo una solución, sino también un descubrimiento matemático cuya importancia se vuelve más clara y rica gracias a la comprensión humana posterior.
La conclusión es más amplia que este resultado concreto. Un mejor razonamiento matemático puede convertir la IA en un socio de investigación más sólido: algo capaz de sostener líneas de pensamiento difíciles, conectar ideas entre áreas distantes del conocimiento, sacar a la luz vías prometedoras que los expertos quizá no habrían priorizado y ayudar a los investigadores a avanzar en problemas que, de otro modo, serían demasiado complejos o exigirían demasiado tiempo.
Esas capacidades importan más allá de las matemáticas. Si un modelo puede mantener coherente un argumento complicado, conectar ideas entre áreas distantes del conocimiento y producir trabajo que resista el escrutinio de expertos, esas también son capacidades útiles en biología, física, ciencia de materiales, ingeniería y medicina, y forman parte de nuestro camino a más largo plazo hacia una investigación más automatizada: sistemas que puedan ayudar a científicos e ingenieros a explorar más ideas y abordar cuestiones técnicas más difíciles.
La IA está a punto de empezar a desempeñar un papel muy significativo en las partes creativas de la investigación y, lo que es más importante, en la propia investigación en IA. Aunque este progreso no es inesperado, refuerza la urgencia que sentimos por comprender esta próxima fase del desarrollo de la IA, los desafíos de alinear sistemas muy inteligentes y el futuro de la colaboración entre humanos e IA.
Ese futuro sigue dependiendo del juicio humano. La experiencia se vuelve más valiosa, no menos. La IA puede ayudar a buscar, sugerir y verificar. Las personas eligen los problemas que importan, interpretan los resultados y deciden qué preguntas abordar después.


