AlphaGo Zero: apprendere partendo da zero

AlphaGo Zero: apprendere partendo da zero

AlphaGo Zero: apprendere partendo da zero

Articolo

AlphaGo Zero: apprendere partendo da zero

A cura di Esploratori Culturali

La ricerca sull’intelligenza artificiale ha compiuto rapidi progressi in un’ampia gamma di settori, dal riconoscimento vocale alla classificazione delle immagini, dalla genomica alla scoperta di nuovi farmaci. In molti casi, si tratta di sistemi specialistici che sfruttano enormi quantità di esperienza umana e dati. Tuttavia, in alcuni casi questa conoscenza umana può essere troppo costosa, troppo inaffidabile o semplicemente non disponibile. Di conseguenza, un’ambizione di vecchia data della ricerca sull’intelligenza artificiale è quella di aggirare questo passaggio, creando algoritmi che raggiungano prestazioni nei domini più impegnativi senza alcun input umano. Di seguito, si propone un recente esempio che ha rappresentato un passo significativo verso questo obiettivo.

I giochi da tavolo, come gli scacchi e la dama, sono spesso utilizzati per sperimentare i sistemi di intelligenza artificiale, perché hanno regole chiare e che non cambiano nel tempo e sono quindi ideali per le simulazioni. Negli ultimi anni, in particolare, DeepMind, la divisione di Google specializzata nella ricerca sull’intelligenza artificiale, ha sviluppato AlphaGo, un software nato per il gioco del “Go”.

Il gioco del “Go”

Go è un antico gioco da tavolo cinese, tra i più complessi al mondo in termini di tattica e strategia. A Go si gioca in due, davanti a una griglia 19 x 19 che viene chiamata goban. Per vincere è necessario conquistare una porzione di goban superiore a quella dell’avversario, collocando le proprie pedine sulla griglia. Su un singolo goban ci sono 4,63 x 10170 diverse posizioni possibili, dato che fa ben capire quale sia l’enorme livello di complessità del gioco: esistono, infatti, più configurazioni delle pedine sulla scacchiera che atomi nell’Universo, ed è impossibile persino per un computer conoscere tutte le possibili mosse.

AlphaGo e AlphaGo Zero

Le prime versioni di AlphaGo si erano inizialmente allenate su migliaia di partite fatte da giocatori umani amatoriali e professionali per imparare a giocare a Go. Invece, l’ultima evoluzione del programma, AlphaGo Zero, impara a giocare semplicemente giocando contro sé stesso, partendo da un gioco completamente casuale. È in grado di farlo utilizzando una nuova forma di apprendimento rinforzata, in cui AlphaGo Zero diventa il proprio insegnante. Il sistema inizia con una rete neurale che non sa nulla del gioco di Go. Quindi gioca contro sé stesso, combinando questa rete neurale con un potente algoritmo di ricerca. Mentre gioca, la rete neurale viene calibrata e aggiornata per prevedere le mosse, così come l’eventuale vincitore della partita. Questa rete neurale aggiornata viene quindi ricombinata con l’algoritmo di ricerca per creare una nuova versione più potente di AlphaGo Zero e il processo ricomincia. In ogni iterazione, le prestazioni del sistema migliorano di una piccola quantità e la qualità dei giochi di auto-apprendimento aumenta, portando a reti neurali sempre più accurate.

Questa tecnica è più potente delle precedenti versioni di AlphaGo perché non è più vincolata dai limiti della conoscenza umana. È in grado di imparare tabula rasa dal giocatore più forte del mondo: AlphaGo stesso. Dopo soli tre giorni di allenamento giocando contro se stesso, infatti, AlphaGo Zero ha battuto 100 partite a 0 la versione di AlphaGo precedentemente pubblicata, quella che aveva sconfitto il 18 volte campione del mondo Lee Sedol. Dopo 40 giorni di auto allenamento, AlphaGo Zero è diventato anche più forte, sovraperformando la versione di AlphaGo conosciuta come “Master”, che aveva sconfitto i migliori giocatori del mondo e il numero uno al mondo Ke Jie.

Nel corso di milioni di partite giocate contro sé stesso, il sistema ha progressivamente imparato il gioco di Go partendo da zero, accumulando migliaia di anni di conoscenza umana in un periodo di pochi giorni. AlphaGo Zero ha scoperto nuove tecniche, sviluppando strategie non convenzionali e nuove mosse creative che hanno superato le tecniche utilizzate nelle partite precedenti.

L’intelligenza artificiale promette di essere un moltiplicatore dell’ingegno umano e di aiutare i ricercatori nella soluzione di alcune delle sfide più importanti che l’umanità sta affrontando. Sebbene sia ancora agli inizi, AlphaGo Zero costituisce un passo fondamentale verso questo obiettivo.

Se tecniche simili potessero essere applicate ad altri complessi problemi, come il ripiegamento delle proteine, la riduzione del consumo energetico o la ricerca di nuovi materiali rivoluzionari, come superconduttori di nuova generazione, le scoperte che ne deriverebbero avrebbero il potenziale di influire positivamente sulla società.

AlphaGo Zero: apprendere partendo da zero
Tags: