15.2 C
Madrid
viernes, octubre 24, 2025
spot_img
spot_img

Alphaevolve: el innovador paso de Google Deepmind hacia AGI

Google Deepmind ha presentado Alphaevolve, un agente de codificaciΓ³n evolutivo diseΓ±ado para descubrir de forma autΓ³noma algoritmos novedosos y soluciones cientΓ­ficas. Presentado en el documento titulado Β«Alphaevolve: un agente de codificaciΓ³n para el descubrimiento irrefutable y algorΓ­tmicoΒ« Esta investigaciΓ³n representa un paso fundamental en direcciΓ³n a la inteligencia universal fabricado (AGI) e incluso la superinteligencia fabricado (ASI). En oportunidad de someterse del ajuste fino petrificado o los conjuntos de datos marcados con humanos, Alphaevolve toma un camino completamente diferente, uno que se centra en la creatividad autΓ³noma, la innovaciΓ³n algorΓ­tmica y la supervisiΓ³n continua.

En el corazΓ³n de Alphaevolve hay una tuberΓ­a evolutiva autΓ³noma impulsada por grandes modelos de idiomas (LLM). Esta tuberΓ­a no solo genera expectativas, sino que muta, evalΓΊa, selecciona y mejorΓ­a el cΓ³digo a travΓ©s de las generaciones. Alphaevolve comienza con un software original y lo refina iterativamente mediante la preΓ‘mbulo de cambios cuidadosamente estructurados.

Estos cambios toman la forma de diferencias generadas por LLM: modificaciones de cΓ³digo sugeridas por un maniquΓ­ de jerga basado en ejemplos anteriores e instrucciones explΓ­citas. Un ‘diff’ en ingenierΓ­a de software se refiere a la diferencia entre dos versiones de un archivo, que generalmente resaltan las lΓ­neas que se eliminarΓ‘n o reemplazarΓ‘n y se agregarΓ‘n nuevas lΓ­neas. En AlphaEvolve, el LLM genera estas diferencias analizando el software flagrante y proponiendo pequeΓ±as ediciones, agregando una funciΓ³n, optimizaciΓ³n de un onda o cambiando un hiperparΓ‘metro, basado en un aviso que incluye mΓ©tricas de rendimiento y ediciones exitosas anteriores.

Cada software modificado se prueba luego utilizando evaluadores automatizados adaptados a la tarea. Los candidatos mΓ‘s efectivos se almacenan, hacen narraciΓ³n y recombinan como inspiraciΓ³n para futuras iteraciones. Con el tiempo, este onda evolutivo conduce a la apariciΓ³n de algoritmos cada vez mΓ‘s sofisticados, a menudo superando los diseΓ±ados por expertos humanos.

Comprender la ciencia detrΓ‘s de Alphaevolve

En esencia, Alphaevolve se pedestal en principios de cΓ‘lculo evolutivo, un subcampo de inteligencia fabricado inspirada en la crecimiento biolΓ³gica. El sistema comienza con una implementaciΓ³n bΓ‘sica del cΓ³digo, que prostituciΓ³n como un Β«organismoΒ» original. A travΓ©s de las generaciones, Alphaevolve modifica este cΓ³digo (variaciones de preΓ‘mbulo o Β«mutacionesΒ», y evalΓΊa la aptitud de cada variaciΓ³n utilizando una funciΓ³n de puntuaciΓ³n perfectamente definida. Las variantes de mejor rendimiento sobreviven y sirven como plantillas para la prΓ³xima gestaciΓ³n.

Este onda evolutivo se coordina a travΓ©s de:

  • Muestreo de inmediato: Alphaevolve construye indicaciones seleccionando e integrando muestras de cΓ³digo previamente exitosas, mΓ©tricas de rendimiento e instrucciones especΓ­ficas de tareas.
  • MutaciΓ³n y propuesta de cΓ³digo: El sistema utiliza una mezcla de potentes LLMS, Gemini 2.0 Flash y Pro, para difundir modificaciones especΓ­ficas a la colchoneta de cΓ³digo flagrante en forma de DIFFS.
  • Mecanismo de evaluaciΓ³n: Una funciΓ³n de evaluaciΓ³n automatizada evalΓΊa el rendimiento de cada candidato ejecutΓ‘ndolo y devolviendo puntajes escalares.
  • Almohadilla de datos y regulador: Un regulador distribuido orquestina este onda, el almacenamiento da como resultado una colchoneta de datos evolutiva y equilibrando la exploraciΓ³n con la explotaciΓ³n a travΓ©s de mecanismos como los mapas.
LEER  Sistemas de texto a video de jailbreak con indicaciones reescritas

Este proceso evolutivo automatizado rico en feedback difiere radicalmente de las tΓ©cnicas habitual de ajuste fino. Alfaevole para difundir soluciones novedosas, de detenciΓ³n rendimiento y, a veces, contraintuitivas, lo que supera el margen de lo que el estudios involuntario puede conseguir de forma autΓ³noma.

ComparaciΓ³n de Alphaevolve con RLHF

Para apreciar la innovaciΓ³n de Alphaevolve, es crucial compararla con el estudios de refuerzo de la feedback humana (RLHF), un enfoque dominante utilizado para ajustar modelos de idiomas grandes.

En RLHF, las preferencias humanas se utilizan para entrenar un maniquΓ­ de retribuciΓ³n, que conductor el proceso de estudios de un LLM a travΓ©s de algoritmos de estudios de refuerzo como la optimizaciΓ³n de polΓ­ticas proximales (PPO). RLHF mejorΓ­a la fila y la utilidad de los modelos, pero requiere una billete humana extensa para difundir datos de feedback y generalmente opera en un rΓ©gimen petrificado de ajuste fino.

Alphaevolve, en contraste:

  • Elimina la feedback humana del onda a merced de los evaluadores ejecutables de la mΓ‘quina.
  • Apoya el estudios continuo a travΓ©s de la selecciΓ³n evolutiva.
  • Explora espacios de alternativa mucho mΓ‘s amplios conveniente a mutaciones estocΓ‘sticas y ejecuciΓ³n asincrΓ³nica.
  • Puede difundir soluciones que no solo estΓ‘n alineadas, sino que novedoso y cientΓ­ficamente significativo.

Donde el comportamiento de los ajustes rlhf, alphaevolve descubrimiento y inventa. Esta distinciΓ³n es crΓ­tica cuando se considera trayectorias futuras en direcciΓ³n a AGI: Alphaevolve no solo hace mejores predicciones, sino que encuentra nuevos caminos en direcciΓ³n a la verdad.

Aplicaciones y avances

1. Descubrimiento algorΓ­tmico y avances matemΓ‘ticos

AlphaEvolve ha demostrado su capacidad para descubrimientos innovadores en problemas algorΓ­tmicos centrales. En particular, descubriΓ³ un operaciΓ³n novedoso para multiplicar dos matrices de valencia de engorroso de 4 Γ— 4 usando solo 48 multiplicaciones escalares, superando el resultado de Strassen en 1969 de 49 multiplicaciones y rompiendo un techo teΓ³rico de 56 abriles. Alphaevolve logrΓ³ esto a travΓ©s de tΓ©cnicas avanzadas de descomposiciΓ³n del tensor que evolucionΓ³ sobre muchas iteraciones, superando a varios enfoques de ΓΊltima gestaciΓ³n.

MΓ‘s allΓ‘ de la multiplicaciΓ³n de matriz, Alphaevolve hizo contribuciones sustanciales a la investigaciΓ³n matemΓ‘tica. Fue evaluado en mΓ‘s de 50 problemas abiertos en campos, como combinatoria, teorΓ­a de nΓΊmeros y geometrΓ­a. CoincidiΓ³ con los resultados mΓ‘s conocidos en aproximadamente el 75% de los casos y los excediΓ³ en rodeando del 20%. Estos Γ©xitos incluyeron mejoras en el problema de superposiciΓ³n mΓ­nima de ERDΕ‘, una alternativa mΓ‘s densa al problema del nΓΊmero de besos en 11 dimensiones y configuraciones de embalaje geomΓ©trica mΓ‘s eficientes. Estos resultados subrayan su capacidad para realizar como un explorador matemΓ‘tico autΓ³nomo: refinar, iterando y evolucionando soluciones cada vez mΓ‘s Γ³ptimas sin intervenciΓ³n humana.

LEER  Jpeg ai difumina la lΓ­nea entre real y sintΓ©tico

2. OptimizaciΓ³n en la pila de enumeraciΓ³n de Google

Alphaevolve ademΓ‘s ha entregado mejoras de rendimiento tangible en la infraestructura de Google:

  • En ProgramaciΓ³n del centro de datosdescubriΓ³ una nueva heurΓ­stica que mejorΓ³ la colocaciΓ³n gremial, recuperando el 0.7% de los posibles de enumeraciΓ³n previamente varados.
  • Para Kernels de entrenamiento de GΓ©minisAlphaevolve ideΓ³ una mejor logΓ­stica de alicatado para la multiplicaciΓ³n matricial, produciendo una velocidad del nΓΊcleo del 23% y una reducciΓ³n universal del 1% en el tiempo de entrenamiento.
  • En DiseΓ±o de circuito de TPUidentificΓ³ una simplificaciΓ³n para la deducciΓ³n aritmΓ©tica en el RTL (nivel de transferencia de registro), verificada por los ingenieros e incluidos en los chips TPU de prΓ³xima gestaciΓ³n.
  • TodavΓ­a optimizΓ³ cΓ³digo de flashatenciΓ³n generado por compilador Al editar representaciones intermedias XLA, reduciendo el tiempo de inferencia en las GPU en un 32%.

Juntos, estos resultados validan la capacidad de Alphaevolve para trabajar en mΓΊltiples niveles de conceptualizaciΓ³n, desde matemΓ‘ticas simbΓ³licas hasta optimizaciΓ³n de hardware de bajo nivel, y entregar ganancias de rendimiento del mundo positivo.

  • ProgramaciΓ³n evolutiva: Un ideal de IA usando mutaciΓ³n, selecciΓ³n y herencia para refinar iterativamente soluciones.
  • SuperoptimizaciΓ³n del cΓ³digo: La bΓΊsqueda automatizada de la implementaciΓ³n mΓ‘s valioso de una funciΓ³n, a menudo produciendo mejoras sorprendentes y contraintuitivas.
  • Meta crecimiento rΓ‘pida: AlphaEvolve no solo evoluciona el cΓ³digo; TodavΓ­a evoluciona cΓ³mo comunica las instrucciones a LLMS, lo que permite el autocuraciΓ³n del proceso de codificaciΓ³n.
  • PΓ©rdida de discretizaciΓ³n: Un tΓ©rmino de regularizaciΓ³n alienta los resultados a alinearse con los tΓ­tulos medio enteros o enteros, crΓ­tico para la claridad matemΓ‘tica y simbΓ³lica.
  • PΓ©rdida de ilusiΓ³n: Un mecanismo para inyectar aleatoriedad en soluciones intermedias, alentando la exploraciΓ³n y evitando los mΓ­nimos locales.
  • OperaciΓ³n de mapas de elites: Un tipo de operaciΓ³n de riqueza de calidad que mantiene una poblaciΓ³n diversa de soluciones de detenciΓ³n rendimiento en las dimensiones de caracterΓ­sticas, lo que permite la innovaciΓ³n sΓ³lida.

Implicaciones para AGI y ASI

Alphaevolve es mΓ‘s que un optimizador: es un futuro en el que los agentes inteligentes puedan demostrar una autonomΓ­a creativa. La capacidad del sistema para formular problemas abstractos y diseΓ±ar sus propios enfoques para resolverlos representa un paso significativo en direcciΓ³n a la inteligencia universal fabricado. Esto va mΓ‘s allΓ‘ de la predicciΓ³n de datos: implica un razonamiento estructurado, la formaciΓ³n de estrategias y la acomodo a la feedback, las marcas de comportamiento inteligente.

Su capacidad para difundir y refinar las hipΓ³tesis ademΓ‘s indica una crecimiento en cΓ³mo aprenden las mΓ‘quinas. A diferencia de los modelos que requieren un entrenamiento supervisado extenso, Alphaevolve mejorΓ­a a travΓ©s de un onda de experimentaciΓ³n y evaluaciΓ³n. Esta forma dinΓ‘mica de inteligencia le permite navegar espacios de problemas complejos, descartar soluciones dΓ©biles y elevar las mΓ‘s fuertes sin supervisiΓ³n humana directa.

Al ejecutar y validar sus propias ideas, Alphaevolve funciona como el teΓ³rico y el experimentalista. Se avanza mΓ‘s allΓ‘ de realizar tareas predefinidas y en el Γ‘mbito del descubrimiento, simulando un proceso irrefutable autΓ³nomo. Cada mejorΓ­a propuesta se prueba, comparΓ³ y reintegra, lo que sigue para un refinamiento continuo basado en resultados reales en oportunidad de objetivos estΓ‘ticos.

LEER  DeepCoder-14b: el modelo de IA de cΓ³digo abierto que mejora la productividad e innovaciΓ³n del desarrollador

QuizΓ‘s lo mΓ‘s trascendente, Alphaevolve es una instancia temprana de superaciΓ³n personal recursiva, donde un sistema de IA no solo aprende sino que mejorΓ­a los componentes de sΓ­ mismo. En varios casos, Alphaevolve mejorΓ³ la infraestructura de entrenamiento que respalda sus propios modelos de colchoneta. Aunque todavΓ­a estΓ‘ restringido por las arquitecturas actuales, esta capacidad establece un precedente. Con mΓ‘s problemas enmarcados en entornos evaluables, Alphaevolve podrΓ­a ascender en direcciΓ³n a un comportamiento cada vez mΓ‘s sofisticado y autoptimizante, un nota fundamental de la superinteligencia fabricado (ASI).

Limitaciones y trayectoria futura

La tΓ©rmino flagrante de Alphaevolve es su dependencia de las funciones de evaluaciΓ³n automatizadas. Esto limita su utilidad a los problemas que se pueden formalizar matemΓ‘ticamente o algorΓ­tmicamente. TodavΓ­a no puede trabajar significativamente en dominios que requieren comprensiΓ³n humana tΓ‘cita, discernimiento subjetivo o experimentaciΓ³n fΓ­sica.

Sin incautaciΓ³n, las instrucciones futuras incluyen:

  • IntegraciΓ³n de la evaluaciΓ³n hΓ­brida: combinaciΓ³n del razonamiento simbΓ³lico con preferencias humanas y crΓ­ticas de jerga natural.
  • Despliegue en entornos de simulaciΓ³n, lo que permite la experimentaciΓ³n cientΓ­fica incorporada.
  • La destilaciΓ³n de las expectativas evolucionadas en LLMS bases, creando modelos de colchoneta mΓ‘s capaces y eficientes en muestras.

Estas trayectorias apuntan en direcciΓ³n a sistemas cada vez mΓ‘s agentes capaces de resolver problemas autΓ³nomos y de detenciΓ³n aventura.

ConclusiΓ³n

Alphaevolve es un profundo paso delante, no solo en las herramientas de IA, sino en nuestra comprensiΓ³n de la inteligencia de la mΓ‘quina en sΓ­. Al fusionar la bΓΊsqueda evolutiva con el razonamiento y la feedback de LLM, redefine lo que las mΓ‘quinas pueden descubrir de forma autΓ³noma. Es una seΓ±al temprana pero significativa de que los sistemas de compaΓ±Γ­a autΓ³noma capaces de un pensamiento irrefutable positivo ya no son teΓ³ricos.

Mirando en direcciΓ³n a el futuro, la cimentaciΓ³n que sustenta el alfaevolvo podrΓ­a aplicarse de forma recursiva a sΓ­ misma: progresar sus propios evaluadores, mejorar la deducciΓ³n de mutaciΓ³n, refinar las funciones de puntuaciΓ³n y optimizar las tuberΓ­as de entrenamiento subyacentes para los modelos de los que depende. Este onda de optimizaciΓ³n recursivo representa un mecanismo tΓ©cnico para el inicio en direcciΓ³n a AGI, donde el sistema no simplemente completa las tareas, sino que mejorΓ­a la infraestructura que permite su estudios y razonamiento.

Con el tiempo, a medida que Alphaevolve se escalera en dominios mΓ‘s complejos y abstractos, y a medida que disminuye la intervenciΓ³n humana en el proceso, puede exhibir ganancias de inteligencia aceleradas. Este ciclo de auto-refuerzo de mejorΓ­a iterativa, aplicada no solo a problemas externos, sino ademΓ‘s a su propia estructura algorΓ­tmica, es un componente teΓ³rico secreto de AGI y todos los beneficios que podrΓ­a proporcionar a la sociedad. Con su combinaciΓ³n de creatividad, autonomΓ­a y recursiΓ³n, Alphaevolve puede ser recordado no solo como un producto de DeepMind, sino como un plan para las primeras mentes artificiales verdaderamente generales y coche evolucionadas.

spot_img

ArtΓ­culos relacionados

spot_img

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquΓ­

Últimos artículos