di Gianmarco Botti

Una macchina batte un uomo. Non è un automobile che ottiene un tempo migliore di un maratoneta, né una calcolatrice che ogni giorno, in casa nostra, ci mostra quanto siamo inefficienti nell’eseguire calcoli. È un programma complesso, a base di deep neural networks (per capirci, un tentativo di riprodurre artificialmente le strutture di apprendimento umane)e capace di apprendere dalle sfide che affronta, che sconfigge il campione mondiale di go, gioco da tavolo dalla storia millenaria, originario della Cina. Le regole sono semplici: in una griglia di 19×19 righe, si posizionano piccole pietre bianche e nere sulle intersezioni. Come negli scacchi, il bianco muove per primo. Scopo del gioco è circondare una somma di porzioni di territorio maggiore della somma dell’avversario.Le regole della sfida sono altrettanto semplici: match modello torneo, cinque partite, due ore a partita per giocatore, dalle quali “pescare” per riflettere sulla mossa successiva. A tempo terminato, ciascun contendente ha soltanto 60 secondi per muovere. Si sfidano AlphaGo, programma sviluppato da Google DeepMind al solo scopo di, ovviamente, giocare a Go, e Lee Sedol, trentatreenne sud coreano, campione del mondo e nono dan della disciplina.

Del secondo ci riserviamo di parlare poco, un po’ perché non è lui il nostro protagonista e un po’ per semplice e sporca invidia.

Sul primo, invece, occorre spendere qualche parola di più: orgoglioso figlio di tecnologie di apprendimento automatico e reti neurali artificiali, ha affrontato la sfida propostagli a soli due anni di età, vincendo 4 a 1, dopo aver sconfitto nel 2015, per un punteggio di 5-0, il campione europeo Fan Hui. È come se un soldato semplice con un paio di mesi di addestramento risultasse un avversario imbattibile per un istruttore veterano. Un bambino molto precoce. Ma è davvero così semplice?

Prendiamo il nostro bambino appena nato (lo chiameremo Alfa) e mettiamolo di fronte al tavolo da Go. Alfa non piange, non dorme, né gattona per la stanza. Sa perfettamente cos’è quello che si trova davanti e sa come usarlo. Da adesso in avanti non avrà mai sonno né tentennamenti, non vorrà fare altro che diventare migliore nel compito che gli è stato assegnato: vincere scegliendo la mossa più corretta tra le 10170 disponibili nel gioco del Go. Gli verrà dunque data la possibilità di imparare da un database di 30 milioni di mosse provenienti da passate partite di giocatori esperti, che studierà, memorizzerà e proverà diventando abile quanto i più grandi maestri di Go. Dopodiché, non avrà bisogno di altro. Supponiamo di poter replicare il nostro Alfa. Facciamone due copie. Queste d’ora in poi giocheranno l’una contro l’altra, come se realmente avessero due identità separate, al massimo delle proprie capacità, numerosissime partite, esplorando un enorme spettro di possibilità. Alfa starà a guardare. Al termine di ogni partita, istruirà entrambi i giocatori su come correggere la propria strategia. Dopo due anni di duro addestramento, sarà messo di fronte a Lee Sedol, si farà un sorriso e giocherà finalmente una partita divertente. Anche qui, però, non sarà solo: nel frattempo gli sarà stato aggiunto al fianco un piccolo aiutante, che farà in modo che usi il tempo che ha a disposizione nel migliore dei modi matematicamente possibili. All’altro lato del tavolo, Lee Sedol è agitato. In palio per il vincitore c’è un milione di dollari, che ad Alfa non interessano. Lee, come ogni essere umano, desidera. Lee è nervoso perché il suo match sarà seguito da milioni di persone. A Lee è concesso prendere pause, durante le estenuanti partite, che è previsto dureranno in media 4 ore. Non ha però nessuno che lo aiuti a tenere di conto il proprio tempo: potrà distrarsi o rimanere bloccato quanto vorrà, potrà anche passare mezz’ora a grattarsi il naso, se vorrà.

Ad Alfa, queste cose non interessano: lui vuole soltanto fare la mossa migliore.

È superfluo dire che questa non è una storiella: l’addestramento del programma che ha combattuto con Lee si è svolto proprio in questo modo. È diventato il migliore, ha giocato contro se stesso, ha imparato da sé stessi ogni volta migliori dei precedenti, è stato affiancato da un programma di gestione del tempo di calcolo, ha sconfitto il suo avversario. Umano o computer che fosse. In ogni partita, Lee ha finito il tempo a propria disposizione molto prima del suo avversario e ha dovuto compiere le mosse seguenti sotto l’assillo del limite di 60 secondi. Il quarto round, unico trionfo del coreano, vinto con una mossa che era stata probabilmente preparata da inizio partita e con una strategia a lungo termine che ha sorpreso lo stesso AlphaGo, è come una medaglia al valore per aver perso con onore una guerra difficile, se non impossibile. Qui, dicono commentatori e lo stesso Lee, il programma ha cominciato a giocare diversamente, come se, forte del suo vantaggio iniziale, volesse soltanto mantenere il margine di vittoria senza sforzarsi troppo. Alla mossa decisiva di Lee e al ribaltarsi della partita, AlphaGo, in difficoltà, ha iniziato a compiere errori sui quali l’avversario ha potuto capitalizzare, fino ad arrivare alla resa della macchina.

Il risultato della sfida è di un’importanza capitale. Per la prima volta, un programma ha avuto ragione di un essere umano in un campo che, sino a poco tempo fa, si pensava fosse precluso alle intelligenze artificiali, per via del livello ancora non sufficientemente avanzato da esse raggiunto; in tutto questo, AlphaGo ha dovuto comportarsi in modo più simile possibile ad un essere umano, apprendendo dai propri errori in un senso differente dal semplice metodo di controllo esaustivo di tutte le possibilità disponibili. Nel Go non figurano grandi mosse decisive, non vi è qualcosa di equivalente al perdere una regina negli scacchi. Di conseguenza, le scelte da compiere sono molto meno ovvie. Il ventaglio di mosse disponibili ad ogni turno per giocatore è considerevolmente più ampio rispetto agli scacchi e ciò rende più difficile calcolare ogni possibile risultato di una mossa. Un essere umano, tuttavia, è particolarmente bravo in compiti di questo tipo, che richiedono una certa capacità di ipotizzare lunghe catene di possibilità e valutare e prevedere le mosse che l’avversario potrebbe compiere di conseguenza. Occorre, per dirlo in poche parole, essere qualcosa di più di un computer per poter sconfiggere un professionista.

AlphaGo ha dimostrato che è possibile scuotere domini umani apparentemente inaccessibili e che la ricerca sull’intelligenza artificiale sta andando rapidamente oltre le nostre aspettative. Ora un programma, una creatura artificiale, resta ancora una volta sola sul campo di battaglia, come tanti suoi predecessori che hanno saputo renderci obsoleti nei contesti più disparati. Domandiamoci: quando non si può più perdere che contro se stessi, è ancora possibile considerarsi sconfitti?