Un modelo de OpenAI ha refutado una conjetura central de la geometría discreta
Durante casi 80 años, los matemáticos han estudiado una pregunta engañosamente simple: si colocas puntos en el plano, ¿cuántos pares de puntos pueden estar exactamente a distancia ?
Este es el problema de las distancias unitarias en el plano, planteado por primera vez por Paul Erdős en 1946. Es una de las preguntas más conocidas de la geometría combinatoria, fácil de enunciar y notablemente difícil de resolver. El libro de 2005 Research Problems in Discrete Geometry, de Brass, Moser y Pach, lo llama "posiblemente el problema más conocido (y el más simple de explicar) de la geometría combinatoria". Noga Alon, un destacado especialista en combinatoria de Princeton, lo describe como "uno de los problemas favoritos de Erdős". Erdős incluso ofreció un premio en efectivo por resolver este problema.
Hoy compartimos un avance en el problema de la distancia unitaria. Desde el trabajo original de Erdős, la creencia predominante ha sido que las construcciones de “cuadrícula cuadrada” que se muestran más abajo eran esencialmente óptimas para maximizar el número de pares a distancia unitaria. Un modelo interno de OpenAI ha refutado esta conjetura de larga data, al proporcionar una familia infinita de ejemplos que produce una mejora polinómica. La prueba ha sido revisada por un grupo de matemáticos externos. También escribieron un artículo complementario que explica el argumento y ofrece más antecedentes y contexto sobre la importancia del resultado.
El resultado también es notable por la forma en que se encontró. La prueba provino de un nuevo modelo de razonamiento de propósito general, en lugar de un sistema entrenado específicamente para matemáticas, estructurado para buscar estrategias de prueba o enfocado en particular en el problema de la distancia unitaria. Como parte de un esfuerzo más amplio para probar si los modelos avanzados pueden contribuir a la investigación de frontera, lo evaluamos en una colección de problemas de Erdős. En este caso, produjo una prueba que resuelve el problema abierto.
Esta prueba es un hito importante para las comunidades de matemáticas e IA. Marca la primera vez que un problema abierto destacado, central para un subcampo de las matemáticas, ha sido resuelto de forma autónoma por IA. También demuestra la profundidad de razonamiento que ahora admiten estos sistemas. Las matemáticas ofrecen un entorno de prueba particularmente claro para el razonamiento: los problemas son precisos, las pruebas potenciales pueden verificarse y un argumento largo solo funciona si el razonamiento se mantiene coherente de principio a fin. El método mediante el cual se resolvió el problema también es notable. La prueba aplica ideas inesperadas y sofisticadas de la teoría algebraica de números a una cuestión geométrica elemental.
El medallista Fields Tim Gowers, al escribir en el artículo complementario, llama al resultado “un hito en las matemáticas de IA”. Según el destacado teórico de números Arul Shankar, “En mi opinión, este artículo demuestra que los modelos actuales de IA van más allá de ser solo asistentes de los matemáticos humanos: son capaces de tener ideas originales e ingeniosas, y luego llevarlas a buen término”.
La prueba está disponible aquí(se abre en una nueva ventana). El artículo complementario de destacados matemáticos externos está disponible aquí(se abre en una nueva ventana). Puedes encontrar una versión abreviada de la cadena de pensamiento del modelo aquí(se abre en una nueva ventana).
Construcción previamente conocida de muchas distancias unitarias a partir de una cuadrícula cuadrada reescalada.
Sea el mayor número posible de pares a distancia unitaria entre puntos en el plano. Es fácil construir ejemplos que alcanzan una tasa de crecimiento lineal: colocar puntos en una línea da pares, mientras que una cuadrícula cuadrada da alrededor de pares. La construcción previamente mejor conocida, derivada de una cuadrícula cuadrada reescalada, resulta dar aún más: para una constante . Como tiende a infinito con , el término adicional en el exponente tiende a , lo que significa que estas construcciones logran un crecimiento solo ligeramente más rápido que el lineal. Durante décadas, se creyó ampliamente que esta tasa era esencialmente la mejor posible y que ninguna construcción podía mejorar de manera significativa la cuadrícula cuadrada. En términos técnicos, Erdős conjeturó una cota superior de , en la que el adicional indica un término que tiende a con .
Nuestro nuevo resultado refuta esta conjetura. Más precisamente, para infinitos valores de , la prueba construye configuraciones de puntos con al menos pares a distancia unitaria, para algún exponente fijo . (La prueba original de IA no da un explícito, pero un refinamiento próximo del profesor de matemáticas de Princeton Will Sawin mostró que se puede tomar .)
Los antecedentes del problema ayudan a entender por qué el resultado es sorprendente. La mejor cota inferior conocida había permanecido esencialmente sin cambios desde la construcción original de Erdős de 1946. La mejor cota superior, , se remonta al trabajo de Spencer, Szemerédi y Trotter en 1984 y, pese a refinamientos posteriores y trabajos estructurales relacionados de Székely, Katz y Silier, Pach, Raz y Solymosi, entre otros, permanece esencialmente sin cambios. Como evidencia a favor de la conjetura, Matoušek y Alon-Bucić-Sauermann estudiaron el problema con distancias no euclidianas en el plano y demostraron que "la mayoría" de estas distancias no euclidianas obedecen la conjetura en cierto sentido.
Sorprendentemente, los ingredientes clave de la construcción provienen de una parte muy distinta de las matemáticas conocida como teoría algebraica de números, que estudia conceptos como la factorización en extensiones de los enteros conocidas como campos numéricos algebraicos.
Después de verificar la prueba inicial, investigamos la tasa de éxito de nuestros modelos en este problema con distintas cantidades de cómputo en tiempo de prueba. Los resultados se muestran a continuación.
A grandes rasgos, la prueba comienza con una idea geométrica familiar y la lleva en una dirección inesperada.
La cota inferior original de Erdős puede entenderse a través de los enteros gaussianos: números de la forma , donde y son enteros e es la raíz cuadrada de . Los enteros gaussianos extienden los enteros ordinarios y, como ellos, disfrutan de propiedades como la factorización única en primos. Tales extensiones de los enteros ordinarios o de los racionales se conocen como campos numéricos algebraicos. El nuevo argumento reemplaza los enteros gaussianos por generalizaciones más complicadas de la teoría algebraica de números, con simetrías más ricas que pueden crear muchas más diferencias de longitud unitaria.
El argumento preciso usa herramientas como torres infinitas de campos de clases y la teoría de Golod–Shafarevich para mostrar que los campos numéricos requeridos para el argumento realmente existen. Estas ideas eran bien conocidas por los teóricos algebraicos de números, pero fue una gran sorpresa que estos conceptos tengan implicaciones para cuestiones geométricas en el plano euclidiano.
Este resultado marca un momento importante en la interacción entre la IA y las matemáticas: un sistema de IA ha resuelto de forma autónoma un problema abierto de larga data en el centro de un campo activo. También ofrece un primer vistazo a un nuevo tipo de colaboración entre la IA y los matemáticos humanos. En este caso, el trabajo complementario de matemáticos externos ofrece una imagen sustancialmente más rica que la solución original por sí sola.
Como escribe Thomas Bloom en la nota complementaria:
“Al evaluar la importancia y la influencia de una prueba generada por IA, una pregunta que me hago es: ¿esto nos ha enseñado algo nuevo sobre el problema? ¿Entendemos mejor la geometría discreta ahora? Creo que la respuesta es un sí moderado: esto muestra que las construcciones de teoría de números tienen mucho más que decir sobre este tipo de preguntas de lo que sospechábamos; además, que la teoría de números requerida puede ser muy profunda. Sin duda, muchos teóricos algebraicos de números examinarán de cerca otros problemas abiertos de la geometría discreta en los próximos meses.”
La conexión inesperada entre la teoría algebraica de números y la geometría discreta revelada por la solución es parte de lo que hace notable el resultado. No solo resuelve una conjetura específica, sino que también puede ofrecer a los matemáticos un puente para empezar a explorar otros problemas relacionados.
Bloom también apunta a una posibilidad más amplia:
“Las fronteras del conocimiento son muy irregulares y, sin duda, los próximos meses y años verán éxitos similares en muchas otras áreas de las matemáticas, donde problemas abiertos de larga data sean resueltos por una IA que revele conexiones inesperadas y lleve la maquinaria técnica existente hasta su límite. La IA nos está ayudando a explorar más plenamente la catedral de las matemáticas que hemos construido a lo largo de los siglos; ¿qué otras maravillas aún no vistas esperan entre bastidores?”
Este resultado ofrece un ejemplo prometedor: la IA contribuye no solo con una solución, sino con un descubrimiento matemático cuya importancia se vuelve más clara y más rica mediante la comprensión humana posterior.
La conclusión es más amplia que este resultado en particular. Un mejor razonamiento matemático puede convertir a la IA en un socio de investigación más sólido: algo que puede sostener líneas de pensamiento difíciles, conectar ideas entre áreas distantes del conocimiento, sacar a la luz caminos prometedores que los expertos quizá no habrían priorizado y ayudar a los investigadores a avanzar en problemas que, de otro modo, serían demasiado complejos o demandarían demasiado tiempo para abordarlos.
Esas capacidades importan más allá de las matemáticas. Si un modelo puede mantener coherente un argumento complicado, conectar ideas entre áreas distantes del conocimiento y producir trabajo que resista el escrutinio de expertos, esas también son capacidades útiles en biología, física, ciencia de materiales, ingeniería y medicina, y forman parte de nuestro camino a más largo plazo hacia una investigación más automatizada: sistemas que puedan ayudar a científicos e ingenieros a explorar más ideas y abordar preguntas técnicas más difíciles.
La IA está a punto de empezar a asumir un papel muy serio en las partes creativas de la investigación y, lo más importante, en la propia investigación en IA. Aunque este progreso no es inesperado, refuerza la urgencia que sentimos por comprender esta siguiente fase del desarrollo de la IA, los desafíos de alinear sistemas muy inteligentes y el futuro de la colaboración entre humanos e IA.
Ese futuro sigue dependiendo del juicio humano. La experiencia se vuelve más valiosa, no menos. La IA puede ayudar a buscar, sugerir y verificar. Las personas eligen los problemas que importan, interpretan los resultados y deciden qué preguntas seguir a continuación.


