Google DeepMind ha introdotto AlphaEvolve Il 14 maggio, un agente di intelligenza artificiale basato su Gemini scoprirà e ottimizzerà in modo autonomo algoritmi in ambiti sia teorici che pratici. Tra i risultati principali figurano il superamento di un record di 56 anni nella moltiplicazione di matrici, lo sviluppo di soluzioni per problemi matematici aperti come il "kissing number" a 11 dimensioni e l'ottenimento di miglioramenti misurabili in termini di efficienza nell'infrastruttura di Google, dalla pianificazione dei data center alla progettazione di chip e all'addestramento di modelli di grandi dimensioni. Il sistema sfrutta un ciclo evolutivo di proposta e valutazione, combinando la velocità di Gemini Flash con la profondità di Gemini Pro, e segna un passo significativo verso l'innovazione scientifica e industriale guidata dall'intelligenza artificiale.
Contesto e contesto
AlphaEvolve si basa sui precedenti successi di DeepMind nella scoperta di algoritmi basati sull'intelligenza artificiale, in particolare AlfaTensore, che nel 2022 ha superato per la prima volta l'algoritmo di Strassen per la moltiplicazione di matrici 4x4. A differenza dei suoi predecessori, AlphaEvolve è progettato come un scopo generale agente in grado di sviluppare intere basi di codice anziché singole funzioni, estendendo l'invenzione generata dall'intelligenza artificiale da attività isolate ad ampi flussi di lavoro algoritmici.
Le principali innovazioni di AlphaEvolve
Battuto un record di moltiplicazione di matrici vecchio di 56 anni
- Moltiplicazione di matrici complesse 4×4:AlphaEvolve ha scoperto un algoritmo che richiede 48 moltiplicazioni scalari invece delle 49 richieste dall'approccio fondamentale di Strassen del 1969, un'impresa che i matematici avevano cercato di raggiungere per oltre cinque decenni.
- Miglioramenti generali:In totale, AlphaEvolve ha migliorato 14 distinte impostazioni di moltiplicazione di matrici, superando sistematicamente sia i metodi creati manualmente dall'uomo sia quelli derivati dall'intelligenza artificiale.
Nuove soluzioni per problemi matematici aperti
- Problema del numero baciante (11 dimensioni): L'IA ha aumentato il limite inferiore noto da 592 a 593 sfere che toccano una sfera centrale, un incremento ma dimostrabilmente nuovo avanzare in una sfida geometrica vecchia di secoli.
- Sondaggio su oltre 50 problemi:Quando applicato ai domini di analisi, combinatoria, geometria e teoria dei numeri, AlphaEvolve ha replicato lo stato dell'arte nel 75% dei casi e migliorata su soluzioni esistenti in circa il 20 percento dei casi.
Approccio tecnico
La pipeline principale di AlphaEvolve è composta da:
- Generazione di proposte tramite Gemini Flash per un'esplorazione più ampia e Gemini Pro per un ragionamento approfondito.
- Valutazione automatizzata, dove i programmi di verifica controllano rigorosamente sia la correttezza che la prestazione di ciascun candidato.
- Selezione evolutiva, mantenendo le varianti con punteggio più alto e ripetendo l'operazione finché non emergono soluzioni ottimali o quasi ottimali.
Questo ciclo trasforma i grandi modelli linguistici in una “fabbrica di algoritmi”, cooptando i principi dell’informatica evolutiva e della dimostrazione automatizzata di teoremi per promuovere una vera innovazione, anziché una mera parafrasi del codice esistente.
Impatto nel mondo reale
Infrastrutture e guadagni di efficienza
- Pianificazione del data center: Ha raggiunto un 1 per cento miglioramento dell'efficienza dell'orchestrazione, che si traduce in notevoli risparmi energetici e sui costi su scala Google.
- Kernel di formazione LLM: Ottimizzato un kernel chiave di moltiplicazione di matrici utilizzato nell'addestramento dei modelli Gemini, fornendo un 23 per cento accelerare tale operazione e ridurre il tempo di formazione complessivo 1 per cento—che equivalgono a milioni di dollari di risparmi annui sui costi di elaborazione.
Esplorazione scientifica
Oltre alla distribuzione interna, DeepMind prevede di lanciare un Programma di accesso anticipato per ricercatori accademici selezionati, consentendo un'esplorazione più ampia nella scienza dei materiali, nella scoperta di farmaci e in altri campi che richiedono soluzioni algoritmiche complesse.
Prospettive e sfide future
Sebbene i progressi specifici del dominio finora ottenuti siano impressionanti, gli esperti avvertono che l'estensione dell'approccio evolutivo di AlphaEvolve a problemi scientifici sempre più complessi e articolati richiederà ulteriori innovazioni nella progettazione dei verificatori e nell'affidabilità dei modelli. Ciononostante, i risultati dimostrati Sinergia tra intelligenza artificiale e uomo nell'inquadramento dei problemi, nella convalida e nel perfezionamento iterativo si apre una promettente strada verso la scoperta potenziata dall'intelligenza artificiale a una scala irraggiungibile dai soli esseri umani.
Conclusione
AlphaEvolve rappresenta una pietra miliare nella progettazione di algoritmi basati sull'intelligenza artificiale, coniugando l'ampiezza creativa di modelli linguistici di grandi dimensioni con una ricerca evolutiva disciplinata e una verifica formale. Offrendo sia progressi teorici, come il miglioramento dei limiti matematici, sia tangibili guadagni di efficienza nelle operazioni di Google, AlphaEvolve sottolinea il potenziale trasformativo di scoperta scientifica automatizzataMentre DeepMind si prepara ad aprire le porte a ricercatori esterni, la comunità più ampia può aspettarsi collaborazioni senza precedenti ai confini dell'intelligenza artificiale e della scienza.
Iniziamo
CometAPI fornisce un'interfaccia REST unificata che aggrega centinaia di modelli di intelligenza artificiale, inclusa la famiglia Gemini, in un endpoint coerente, con gestione integrata delle chiavi API, quote di utilizzo e dashboard di fatturazione. Questo significa che non dovrete più destreggiarvi tra URL e credenziali di più fornitori.
Gli sviluppatori possono accedere Pre-API Flash Gemini 2.5 ecc. attraverso CometaAPIPer iniziare, esplora le capacità del modello nel Playground e consulta il Guida API per le istruzioni dettagliate.
