AI en la Olimpiada Matemática Internacional: Cómo Alphaproof y Alphageometry 2 alcanzaron el estándar de medalla de plata

marzo 12, 2025

22

Tabla de contenido

El razonamiento matemático es un aspecto dinámico de las habilidades cognitivas humanas, impulsando el progreso en los descubrimientos científicos y los desarrollos tecnológicos. A medida que nos esforzamos por desarrollar inteligencia común industrial que coincida con la cognición humana, es esencial equipar la IA con capacidades de razonamiento matemático liberal. Si perfectamente los sistemas de IA actuales pueden manejar problemas matemáticos básicos, luchan con el confuso razonamiento necesario para disciplinas matemáticas avanzadas como el álgebra y la geometría. Sin requisa, esto podría estar cambiando, ya que Google Deepmind ha hecho avances significativos para avanzar en las capacidades de razonamiento matemático de un sistema de IA. Este avance se realiza en la Olimpíada Matemática Internacional (OMI) 2024. Establecido en 1959, la OMI es la competencia matemática más antigua y prestigiosa, desafiando a los estudiantes de secundaria en todo el mundo con problemas en álgebra, combinatoria, geometría y teoría de números. Cada año, los equipos de jóvenes matemáticos compiten para resolver seis problemas muy desafiantes. Este año, Google Deepmind introdujo dos sistemas de IA: Alphaproof, que se centra en el razonamiento matemático formal y la Alfageometría 2, que se especializa en resolver problemas geométricos. Estos sistemas de IA lograron resolver cuatro de seis problemas, actuando a nivel de un medallista de plata. En este artículo, exploraremos cómo funcionan estos sistemas para resolver problemas matemáticos.

Alphaproof: Combinación de IA y idioma formal para el teorema matemático

Alphaproof es un sistema de IA diseñado para probar declaraciones matemáticas utilizando el idioma formal Lean. Integra Géminis, un maniquí de idioma previamente capacitado, con Alphazero, un cálculo de estudios de refuerzo reconocido por dominar el ajedrez, el shogi y el Go.

LEER La lucha por la personalización de disparo cero en la IA generativa

El maniquí Gemini traduce las declaraciones de problemas del idioma natural en las formales, creando una biblioteca de problemas con diferentes niveles de dificultad. Esto tiene dos propósitos: convertir un idioma natural impreciso en un idioma formal preciso para compulsar las pruebas matemáticas y usar habilidades predictivas de Gemini para producir una tira de posibles soluciones con precisión del idioma formal.

Cuando Alphaproof encuentra un problema, genera posibles soluciones y sondeo pasos de prueba en Lean para verificarlos o refutarlos. Este es esencialmente un enfoque neuroimbólico, donde la red neuronal, Géminis, traduce las instrucciones del idioma natural en el idioma formal simbólico que se inclina para probar o refutar la información. Similar al mecanismo de repertorio de autocompresión de Alphazero, donde el sistema aprende jugando juegos contra sí mismo, Alphaproof se entrena al intentar probar declaraciones matemáticas. Cada intento de prueba refina el maniquí de idioma de Alphaproof, con pruebas exitosas que refuerzan la capacidad del maniquí para asaltar problemas más desafiantes.

Para la Olimpíada Matemática Internacional (OMI), Alphaproof fue entrenado demostrando o refutando millones de problemas que cubren diferentes niveles de dificultad y temas matemáticos. Esta capacitación continuó durante la competencia, donde Alphaproof refinó sus soluciones hasta que encontró respuestas completas a los problemas.

Alphageometry 2: Integrando LLM y IA simbólica para resolver problemas de geometría

Alphageometry 2 es la última iteración de la serie Alphageometry, diseñada para asaltar los problemas geométricos con una anciano precisión y eficiencia. Sobre la colchoneta de la colchoneta de su predecesor, Alphageometry 2 emplea un enfoque neuroimbólico que fusiona los modelos neuronales de idioma prócer (LLM) con IA simbólica. Esta integración combina la método basada en reglas con la capacidad predictiva de las redes neuronales para identificar puntos auxiliares, esenciales para resolver problemas de geometría. La LLM en alfageometría predice nuevas construcciones geométricas, mientras que la IA simbólica aplica una método formal para producir pruebas.

LEER Alphaevolve: el innovador paso de Google Deepmind hacia AGI

Cuando se enfrenta a un problema geométrico, la LLM de Alphageometry evalúa numerosas posibilidades, prediciendo construcciones cruciales para la resolución de problemas. Estas predicciones sirven como pistas valiosas, guiando el motor simbólico alrededor de deducciones precisas y avanzando más cerca de una alternativa. Este enfoque reformador permite a la alfageometría asaltar desafíos geométricos complejos que se extienden más allá de los escenarios convencionales.

Una progreso secreto en Alphageometry 2 es la integración del Gemini LLM. Este maniquí está entrenado desde cero en datos significativamente más sintéticos que su predecesor. Este extenso entrenamiento lo equipa para manejar problemas de geometría más difíciles, incluidos aquellos que involucran movimientos de objetos y ecuaciones de ángulos, proporciones o distancias. Encima, Alphageometry 2 presenta un motor simbólico que opera dos órdenes de magnitud más rápido, lo que le permite explorar soluciones alternativas con velocidad sin precedentes. Estos avances hacen de la Alphageometry 2 una útil poderosa para resolver problemas geométricos intrincados, estableciendo un nuevo habitual en el campo.

Alphaproof y Alphageometry 2 en IMO

Este año, en la Olimpíada Matemática Internacional (IMO), los participantes fueron evaluados con seis problemas diversos: dos en álgebra, uno en teoría de números, uno en geometría y dos en combinatoria. Los investigadores de Google tradujeron estos problemas en idioma matemático formal para Alphaproof y Alphageometry 2. Alphaproof abordó dos problemas de álgebra y un problema de teoría de números, incluido el problema más difícil de la competencia, resuelto por solo cinco concursantes humanos este año. Mientras tanto, la Alfageometría 2 resolvió con éxito el problema de la geometría, aunque no descifró los dos desafíos de combinatoria

LEER Nvidia Cosmos: Empoderando la IA física con simulaciones

Cada problema en la OMI vale siete puntos, sumando a un mayor de 42. Alphaproof y Alphageometry 2 obtuvieron 28 puntos, logrando puntajes perfectos en los problemas que resolvieron. Esto los colocó en el extremo superior de la categoría de medalla de plata. El filo de la medalla de oro este año fue de 29 puntos, atrapado por 58 de los 609 concursantes.

Venidero brinco: idioma natural para desafíos matemáticos

Alphaproof y Alphageometry 2 han mostrado avances impresionantes en las habilidades matemáticas de resolución de problemas de la IA. Sin requisa, estos sistemas aún dependen de expertos humanos para traducir problemas matemáticos en idioma formal para el procesamiento. Encima, no está claro cómo estas habilidades matemáticas especializadas podrían incorporarse en otros sistemas de IA, como para explorar hipótesis, probar soluciones innovadoras a problemas de larga data y gobernar eficientemente aspectos de las pruebas.

Para exceder estas limitaciones, los investigadores de Google están desarrollando un sistema de razonamiento de idioma natural basado en Gemini y su última investigación. Este nuevo sistema tiene como objetivo avanzar en las capacidades de resolución de problemas sin requerir la traducción formal del idioma y está diseñado para integrarse sin problemas con otros sistemas de IA.

El resultado final

El desempeño de Alphaproof y Alphageometry 2 en la Olimpíada Matemática Internacional es un brinco trascendental delante en la capacidad de AI para asaltar un razonamiento matemático confuso. Entreambos sistemas demostraron un rendimiento a nivel de medalla de plata al resolver cuatro de seis problemas desafiantes, demostrando avances significativos en pruebas formales y resolución de problemas geométricos. A pesar de sus logros, estos sistemas de IA aún dependen de los aportes humanos para traducir problemas en un idioma formal y enfrentan desafíos de integración con otros sistemas de IA. La investigación futura tiene como objetivo mejorar aún más estos sistemas, potencialmente integrando el razonamiento del idioma natural para extender sus capacidades en una grado más amplia de desafíos matemáticos.

Etiquetas
Noticias de IA

Artículo anterior

Applecare+ se vuelve más caro: aquí está cuánto más pagará ahora

Artículo siguiente

Los piratas informáticos chinos violan los enrutadores de Networks con puertas traseras personalizadas

AI en la Olimpiada Matemática Internacional: Cómo Alphaproof y Alphageometry 2 alcanzaron el estándar de medalla de plata

Alphaproof: Combinación de IA y idioma formal para el teorema matemático

Alphageometry 2: Integrando LLM y IA simbólica para resolver problemas de geometría

Alphaproof y Alphageometry 2 en IMO

Venidero brinco: idioma natural para desafíos matemáticos

El resultado final

Artículos relacionados

Los investigadores identifican PassiveNeuron APT utilizando el malware Neursite y NeuralExecutor

Por qué la seguridad inalámbrica privada es ahora una prioridad para...

Docker versus máquina virtual: cuál debería usar

DEJA UNA RESPUESTA Cancelar respuesta

Últimos artículos

Los investigadores identifican PassiveNeuron APT utilizando el malware Neursite y NeuralExecutor

Por qué la seguridad inalámbrica privada es ahora una prioridad para...

Docker versus máquina virtual: cuál debería usar

El nuevo Asmi Linux me pareció rápido y divertido de usar,...

Los piratas informáticos utilizaron el malware Snappybee y un defecto de...