El razonamiento matemático es un aspecto dinámico de las habilidades cognitivas humanas, impulsando el progreso en los descubrimientos científicos y los desarrollos tecnológicos. A medida que nos esforzamos por desarrollar inteligencia común industrial que coincida con la cognición humana, es esencial equipar la IA con capacidades de razonamiento matemático liberal. Si perfectamente los sistemas de IA actuales pueden manejar problemas matemáticos básicos, luchan con el confuso razonamiento necesario para disciplinas matemáticas avanzadas como el álgebra y la geometría. Sin requisa, esto podría estar cambiando, ya que Google Deepmind ha hecho avances significativos para avanzar en las capacidades de razonamiento matemático de un sistema de IA. Este avance se realiza en la Olimpíada Matemática Internacional (OMI) 2024. Establecido en 1959, la OMI es la competencia matemática más antigua y prestigiosa, desafiando a los estudiantes de secundaria en todo el mundo con problemas en álgebra, combinatoria, geometría y teoría de números. Cada año, los equipos de jóvenes matemáticos compiten para resolver seis problemas muy desafiantes. Este año, Google Deepmind introdujo dos sistemas de IA: Alphaproof, que se centra en el razonamiento matemático formal y la Alfageometría 2, que se especializa en resolver problemas geométricos. Estos sistemas de IA lograron resolver cuatro de seis problemas, actuando a nivel de un medallista de plata. En este artículo, exploraremos cómo funcionan estos sistemas para resolver problemas matemáticos.
Alphaproof: Combinación de IA y idioma formal para el teorema matemático
Alphaproof es un sistema de IA diseñado para probar declaraciones matemáticas utilizando el idioma formal Lean. Integra Géminis, un maniquí de idioma previamente capacitado, con Alphazero, un cálculo de estudios de refuerzo reconocido por dominar el ajedrez, el shogi y el Go.
El maniquí Gemini traduce las declaraciones de problemas del idioma natural en las formales, creando una biblioteca de problemas con diferentes niveles de dificultad. Esto tiene dos propósitos: convertir un idioma natural impreciso en un idioma formal preciso para compulsar las pruebas matemáticas y usar habilidades predictivas de Gemini para producir una tira de posibles soluciones con precisión del idioma formal.
Cuando Alphaproof encuentra un problema, genera posibles soluciones y sondeo pasos de prueba en Lean para verificarlos o refutarlos. Este es esencialmente un enfoque neuroimbólico, donde la red neuronal, Géminis, traduce las instrucciones del idioma natural en el idioma formal simbólico que se inclina para probar o refutar la información. Similar al mecanismo de repertorio de autocompresión de Alphazero, donde el sistema aprende jugando juegos contra sí mismo, Alphaproof se entrena al intentar probar declaraciones matemáticas. Cada intento de prueba refina el maniquí de idioma de Alphaproof, con pruebas exitosas que refuerzan la capacidad del maniquí para asaltar problemas más desafiantes.
Para la Olimpíada Matemática Internacional (OMI), Alphaproof fue entrenado demostrando o refutando millones de problemas que cubren diferentes niveles de dificultad y temas matemáticos. Esta capacitación continuó durante la competencia, donde Alphaproof refinó sus soluciones hasta que encontró respuestas completas a los problemas.
Alphageometry 2: Integrando LLM y IA simbólica para resolver problemas de geometría
Alphageometry 2 es la última iteración de la serie Alphageometry, diseñada para asaltar los problemas geométricos con una anciano precisión y eficiencia. Sobre la colchoneta de la colchoneta de su predecesor, Alphageometry 2 emplea un enfoque neuroimbólico que fusiona los modelos neuronales de idioma prócer (LLM) con IA simbólica. Esta integración combina la método basada en reglas con la capacidad predictiva de las redes neuronales para identificar puntos auxiliares, esenciales para resolver problemas de geometría. La LLM en alfageometría predice nuevas construcciones geométricas, mientras que la IA simbólica aplica una método formal para producir pruebas.
Cuando se enfrenta a un problema geométrico, la LLM de Alphageometry evalúa numerosas posibilidades, prediciendo construcciones cruciales para la resolución de problemas. Estas predicciones sirven como pistas valiosas, guiando el motor simbólico alrededor de deducciones precisas y avanzando más cerca de una alternativa. Este enfoque reformador permite a la alfageometría asaltar desafíos geométricos complejos que se extienden más allá de los escenarios convencionales.
Una progreso secreto en Alphageometry 2 es la integración del Gemini LLM. Este maniquí está entrenado desde cero en datos significativamente más sintéticos que su predecesor. Este extenso entrenamiento lo equipa para manejar problemas de geometría más difíciles, incluidos aquellos que involucran movimientos de objetos y ecuaciones de ángulos, proporciones o distancias. Encima, Alphageometry 2 presenta un motor simbólico que opera dos órdenes de magnitud más rápido, lo que le permite explorar soluciones alternativas con velocidad sin precedentes. Estos avances hacen de la Alphageometry 2 una útil poderosa para resolver problemas geométricos intrincados, estableciendo un nuevo habitual en el campo.
Alphaproof y Alphageometry 2 en IMO
Este año, en la Olimpíada Matemática Internacional (IMO), los participantes fueron evaluados con seis problemas diversos: dos en álgebra, uno en teoría de números, uno en geometría y dos en combinatoria. Los investigadores de Google tradujeron estos problemas en idioma matemático formal para Alphaproof y Alphageometry 2. Alphaproof abordó dos problemas de álgebra y un problema de teoría de números, incluido el problema más difícil de la competencia, resuelto por solo cinco concursantes humanos este año. Mientras tanto, la Alfageometría 2 resolvió con éxito el problema de la geometría, aunque no descifró los dos desafíos de combinatoria
Cada problema en la OMI vale siete puntos, sumando a un mayor de 42. Alphaproof y Alphageometry 2 obtuvieron 28 puntos, logrando puntajes perfectos en los problemas que resolvieron. Esto los colocó en el extremo superior de la categoría de medalla de plata. El filo de la medalla de oro este año fue de 29 puntos, atrapado por 58 de los 609 concursantes.
Venidero brinco: idioma natural para desafíos matemáticos
Alphaproof y Alphageometry 2 han mostrado avances impresionantes en las habilidades matemáticas de resolución de problemas de la IA. Sin requisa, estos sistemas aún dependen de expertos humanos para traducir problemas matemáticos en idioma formal para el procesamiento. Encima, no está claro cómo estas habilidades matemáticas especializadas podrían incorporarse en otros sistemas de IA, como para explorar hipótesis, probar soluciones innovadoras a problemas de larga data y gobernar eficientemente aspectos de las pruebas.
Para exceder estas limitaciones, los investigadores de Google están desarrollando un sistema de razonamiento de idioma natural basado en Gemini y su última investigación. Este nuevo sistema tiene como objetivo avanzar en las capacidades de resolución de problemas sin requerir la traducción formal del idioma y está diseñado para integrarse sin problemas con otros sistemas de IA.
El resultado final
El desempeño de Alphaproof y Alphageometry 2 en la Olimpíada Matemática Internacional es un brinco trascendental delante en la capacidad de AI para asaltar un razonamiento matemático confuso. Entreambos sistemas demostraron un rendimiento a nivel de medalla de plata al resolver cuatro de seis problemas desafiantes, demostrando avances significativos en pruebas formales y resolución de problemas geométricos. A pesar de sus logros, estos sistemas de IA aún dependen de los aportes humanos para traducir problemas en un idioma formal y enfrentan desafíos de integración con otros sistemas de IA. La investigación futura tiene como objetivo mejorar aún más estos sistemas, potencialmente integrando el razonamiento del idioma natural para extender sus capacidades en una grado más amplia de desafíos matemáticos.