Lo stregone dei dati - The data warlock #008
La newsletter dedicata al rapporto tra dati, informazioni e tecnologie trasformative. Per gestire l'azienda come una "data & technology company".
“Devo aver guadagnato circa dieci milioni di dollari durante la mia carriera. Parte del gruzzolo è stato speso nel gioco e parte per le donne. Il resto l'ho speso stupidamente.”
George Raft
Benvenuto alla newsletter de Lo Stregone dei dati. Seguimi in questo viaggio alla ricerca del tesoro nascosto della competitività di impresa. Saranno necessari molti incantesimi per superare le prove disseminate lungo il percorso, ma non temere: quelli che sembrano sortilegi in realtà sono il risultato dell’applicazione delle tecnologie digitali all’universo di dati che ci circonda.
Il mondo, in fondo, è un’informazione, e questa è la chiave per viverci e prosperare.
Abbonati, condividi e se vuoi contattami a alessandro.cederle@thedatawarlock.com.
Momenti di gloria
DISCLAIMER: questa newsletter non può e non deve essere considerata in alcun modo un incoraggiamento al gioco d’azzardo. Va ricordato che alla fine vince sempre il banco; il che vuol dire che tutti gli altri, alla lunga, perdono. Se va bene perdono solo dei soldi.
Il 10 agosto 2006, in una sala del Rio All Suite Hotel and Casino a Las Vegas (dove se no?) Jamie Gold vince 12 milioni di dollari nelle World Series of Poker, il torneo più grande del mondo, che quell’anno può contare su un montepremi di più di 85 milioni di dollari. Si tratta della più alta vincita di tutti i tempi.
Qualche anno prima , in un ambiente del tutto diverso, è iniziata una rivoluzione che cambierà radicalmente il mondo del gioco d’azzardo.
Si tratta della c.d. “teoria dei giochi”, fondata nel 1949 da Von Neumann, un matematico, fisico e informatico ungherese. János Lajos Neumann (questo è il suo nome prima di essere naturalizzato come cittadino statunitense) fornisce base scientifica, matematica e statistica al gioco definito come l’”interazione strategica tra agenti razionali”.
Il poker è un gioco particolare per due ragioni:
diversamente da altri giochi non è dato conoscere le carte in mano all’avversario
occorre ipotizzare che la strategia dell’avversario sia irrazionale, frutto di una logica inesatta e della simulazione (il “bluff”).
Gli algoritmi necessari per dare una base statistica e razionale alle mani del poker vengono dunque sviluppati a partire già dal dopoguerra; ma i calcoli necessari per applicarli sono formidabili e per parecchio tempo mancherà la potenza elaborativa necessaria. Data una certa apertura iniziale, infatti, per tracciare l’albero delle possibili varianti di una partita di Texas Hold’em semplificata (solo due giocatori e con puntate di entità prefissata) è necessario censire 316,000,000,000,000,000 possibili variazioni. Per simulare una partita realistica le variazioni possibili superano il numero degli atomi nell’universo.
Counterfactual regret optimization
Tutto fermo dunque, finché arriva sul palcoscenico la Counterfactual Regret Optimization, CRF per gli amici - nulla a che fare con Cristiano Ronaldo. La Counterfactual Regret Optimization (suona bene vero?) è infatti l’algoritmo che ha reso possible governare quest’immensa complessità.
Se avete un pizzico di pazienza, provo a spiegarvi come funziona.
La prima cosa da dire è che la CFR impara il modo migliore di giocare un gioco giocando contro sé stessa.
Si inizia con un’apertura casuale (ad esempio una somministrazione casuale di due carte per giocatore, nel caso della Texana) e l’algoritmo prova tutte le possibili combinazioni di mosse che possono seguire l’apertura; gioca dunque contro sé stesso tutte le possibili combinazioni, e verifica quale sia quella più efficace.
Ripete il processo miliardi di volte e gradualmente mette a fuoco la strategia da privilegiare.
Ma cosa significa “combinazione più efficace” e “strategia da privilegiare”? Cosa cerca esattamente l’algoritmo, come fa a discriminare? La CFR gioca all’italiana, è catenacciara = primo non prenderle. Alla Trapattoni, insomma. Vale a dire: il risultato finale considerato accettabile è quello che consente di non fare peggio di un pareggio. Non è necessario vincere, basta non perdere.
Ad ogni passaggio, ad ogni giocata, l’algortimo dunque computa tutte le combinazioni e calcola se quella stessa giocata avrebbe prodotto risultati migliori, o peggiori, qualora fosse stata scelta al posto di tutte le altre. Dove “migliore” o “peggiore” va intesa nel modo che abbiamo detto.
Questo appunto è il valore del “regret”, del rimpianto. Si cerca di minimizzare il rimpianto e di eliminare le mosse che avrebbero condotto ad una sconfitta. Di nuovo, non quelle che avrebbero condotto a una vittoria.
Ad ogni nuova partita dunque, sulla base del computo dei ripianti, l’algoritmo privilegia quelle giocate che li hanno minimizzati.
Pio pio …
Tutto ciò è molto bello, semplifica il problema computazionale, ma ancora richiede una potenza di calcolo formidabile che la mette fuori dalla portata del giocatore medio.
Finché nel 2015 un matematico polacco si inventa Piosolver, un programma che al prezzo di 249 $ (nella versione base) e grazie ad alcune semplificazioni rende possibile costruire su un normale PC gli alberi decisionali che mostrano e pesano le diverse alternative di gioco, suggerendo al giocatore la strategia più efficace in termini di rilanci e giocate.
L’utilizzo del programma ovviamente non è possibile durante le partite, ma questo in realtà accende uno dei motivi di interesse della storia. I giocatori infatti lo utilizzano per verificare la strategia più efficace nelle mani che hanno già giocato, quando il torneo è ormai finito. Confrontano quello che hanno fatto con i parametri suggeriti dal computer in base alle condizioni iniziali, in modo da discriminare il comportamento agito nella partita appena conclusa. Su questa base adattano e evolvono nel tempo la loro strategia.
Utilizzato in questo modo, a posteriori, come strumento di apprendimento più che come guida operativa in tempo reale, il programma permette a un giocatore mediocre di raggiungere livelli una volta appannaggio dei soli professionisti affermati.
Vincoli
Non tutto però è così semplice.
Prima di tutto questi programmi non spiegano il “perché” sia il caso di adottare una certa strategia e di fare certe giocate; ti dicono solo cosa devi fare. Sta poi all’umano applicare una logica euristica, che cerca di identificare una logica, consente di individuare una linea razionale e dunque riproducibile poi sul tavolo da gioco.
Ogni tanto, inoltre, conviene scordarsi il metodo e le strategie suggerite dall’algoritmo e divergere dalle stesse, affidandosi piuttosto all’istinto e alla fantasia. Soprattutto quando si gioca con giocatori più deboli, i polli insomma, che hanno una strategia di gioco e un’abilità sul tavolo meno evoluta. In questo caso conviene lasciare un pochino più di spazio all’intuito, li si spenna con più facilità.
Infine c’è sempre l’emozione che, per così dire, interferisce. La tensione che nasce dalla fatica di sessioni di gioco che possono durare fino a 12 ore e l’ansia legata a poste colossali inducono comportamenti non razionali, incompatibili con le regole dettate dall’algortimo e che dunque conducono, sui grandi numeri, alla sconfitta.
Take away
Ci sono parecchie lezioni che è possibile ricavare da questa storia.
Ho usato 7 volte il termine “algoritmo”. Lo so, non si fa, farò meglio nel futuro.
C’è un potere enorme negli algoritmi (e 8) applicati al processo decisionale. Se pensate che vengono utilizzati con successo nel gioco d’azzardo, che solo in Italia vale 110 miliardi di euro (parlo solo di quello legale, per non parlare di quello illegale) non c’è davvero ragione perché non possano essere proficuamente utilizzati nel vostro business, che vi occupiate di banche, assicurazioni, turismo, arredamento o macchine industriali.
Non temete, ci sarà sempre poi spazio per intuito, fantasia e emozione. Se vogliamo cucinare un piatto complesso non possiamo esimerci da un “algoritmo” che definisca ingredienti e quantità. Se volessimo affidarci solo all’intuito, cosa mai potremo cucinare? Abbiamo sicuramente bisogno di una ricetta, di pese e misurini. Ciò non toglie che la scelta del tempo esatto di cottura, della dose che traduce esattamente il “qb”, degli ingredienti segreti e quant’altro, resta allo chef.
Se vogliamo utilizzare i dati per assisterci nel processo decisionale è necessario semplificare. Occorre trovare quel giusto equilibrio tra la rappresentazione completa delle principali variabili in gioco, e la necessità di disporre di un sistema che non sai più complesso della realtà stessa, altrimenti tanto vale.
In realtà nelle aziende si pecca al contrario, semplificando troppo. Report, dashboard, cruscotti restano sostanzialmente inutili perché non danno le risposte alle domande importanti in quanto principalmente dedicati alla rappresentazione dell’ovvio.
L’intelligenza artificiale, come detto più volte, non è molto intelligente. Può spiegare il quanto, il cosa e il come, non il perché. Sta a noi interpretare e decidere. Quando si utilizza uno strumento dobbiamo conoscerne i limiti e rispettarli.
Si tende spesso a pensare che il potere dei dati vada principalmente rivolto al futuro; ma c’è un valore enorme nell’utilizzarlo per capire cosa si è sbagliato e cosa si sarebbe potuto fare diversamente, per razionalizzare il processo e distillare le strategie più efficaci.
Individuate una decisione che dovete prendere in modo ricorrente per il vostro business; il livello delle scorte in magazzino, il numero di prodotti da sviluppare in un anno, l’avvicendamento dei turni diurni e notturni, il rapporto prezzo/utile, il preavviso con cui chiamare i clienti in fase di rinnovo … ce ne sono tante, per ora ne basta una. Fatevi aiutare da un esperto a trattare questo problema con un approccio “data science”, scegliendo la tecnica giusta da applicare. Per una volta potete provarci! Guardate cosa dice l’algoritmo (siamo a 10), spruzzateci sopra una dose di buon senso, e buttatevi. E’ la vostra prima giocata.
Per approfondire:
How AI conquered poker
What is an intuitive explanation of counterfactual regret minimization
PioSOLVER
E ora un po’ di musica
Abbiamo posato i soldi nel piatto e distribuito le carte
Poi ho visto che prendeva le carte dal fondo del mazzo
e ho steso quell’altro giocatore
Oh sì, l’ho proprio stesoBene, ora sono in prigione, e mi hanno dato un numero invece del mio nome
”Hai giocato la tua ultima partita”
mi ha detto il direttore mentre chiudeva a chiave la porta
Hai proprio giocato la tua ultima partitaSono un giocatore d'azzardo,
vado sempre in giro e ho giocato d'azzardo dappertutto
Perché ogni volta che incontro un mazzo di carte
non posso fare a meno di fare la mia puntata
Un pezzo folk antico come il mondo, censito nel 1909 e inciso per la prima volta nel 1924. Qui nella versione di Norah Jones e Billie Joe Armstrong, non troppo country, tra soft jazz e pop punk. Se vi va di leggere il testo completo, lo trovate qui: inizia tra belle ragazze e viaggi, finisce male. Algoritmo, algoritmo, algoritmo, algoritmo ….