Decodifica del Poker GTO: CFR+ e Strategia Ottimale

Introduzione al Poker GTO e Piosolver

Il panorama della strategia del poker ha subito una profonda trasformazione con l'avvento di strumenti computazionali capaci di approssimare il gioco Game Theory Optimal (GTO). Il poker GTO mira a raggiungere una strategia inattaccabile, una che assicuri che un giocatore non possa essere costantemente battuto nel lungo periodo, indipendentemente dall'approccio dell'avversario. Questo cambio di paradigma ha spostato l'analisi del poker dalla dipendenza esclusiva dall'intuizione e dall'esperienza verso un quadro matematicamente più rigoroso.

All'avanguardia di questa rivoluzione c'è il software come Piosolver, uno strumento ampiamente rispettato tra giocatori professionisti e amatori seri. La capacità di Piosolver di calcolare scenari complessi di poker e produrre strategie quasi ottimali ha reso l'analisi GTO sofisticata accessibile a un pubblico più ampio.

Tappe Fondamentali nell'Evoluzione del GTO:

* Al cuore della potenza analitica di Piosolver si trova l'algoritmo di Minimizzazione del Rimpianto Controfattuale Plus (CFR+) * Nel 2015, un'IA di poker utilizzando CFR+ ha effettivamente "risolto" il Poker Heads-up Limit Hold'em * Questa svolta è stata pubblicata sulla rivista Science * Ha segnato la prima volta che una variante completa e non astratta del poker giocata nei casinò è stata completamente risolta

Comprendere la Minimizzazione del Rimpianto Controfattuale (CFR)

Per comprendere l'importanza del CFR+, è essenziale prima capire il concetto fondamentale della Minimizzazione del Rimpianto Controfattuale (CFR). CFR è un algoritmo di auto-gioco iterativo che impara giocando ripetutamente contro se stesso. Inizia con una strategia casuale uniforme, dove ogni azione in ogni punto di decisione è ugualmente probabile, e migliora gradualmente attraverso migliaia o milioni di iterazioni.

Come Funziona CFR:

* La parte "controfattuale" di CFR si riferisce alla capacità dell'algoritmo di valutare il valore delle azioni dalla prospettiva "cosa sarebbe successo se avessi preso questa azione invece?" * Il "rimpianto" si riferisce al valore perso per non aver preso l'azione ottimale * Man mano che l'algoritmo gioca più mani contro se stesso, accumula rimpianti per diverse azioni * Aggiusta la sua strategia per minimizzare questi rimpianti nel tempo

Pensalo come imparare ad andare in bicicletta cadendo ripetutamente. Ogni volta che cadi, impari cosa non fare la prossima volta. CFR esegue questo processo su miliardi di mani di poker, affinando la sua strategia riducendo il suo "rimpianto" - la differenza tra ciò che ha fatto e ciò che sarebbe stato ottimale. Giocando ripetutamente contro se stesso e valutando le decisioni passate, l'algoritmo raffina progressivamente la sua strategia verso l'ottimalità.

L'Evoluzione verso CFR+: Miglioramenti Chiave

CFR+ si costruisce su questa base con diversi miglioramenti cruciali.

Miglioramenti Principali in CFR+:

1. **Introduzione del "regret-matching+"** * A differenza del regret-matching standard, CFR+ tiene traccia di un valore simile al rimpianto, noto come Q-value, per ogni azione * La differenza critica: CFR+ azzera attivamente qualsiasi rimpianto negativo accumulato * Questo cambiamento apparentemente piccolo ha effetti profondi sulle prestazioni * Questo meccanismo impedisce all'algoritmo di rimanere bloccato su strategie subottimali a causa di risultati negativi precoci * Permette che azioni precedentemente scarse vengano riconsiderate più rapidamente se il loro potenziale migliora più tardi nel processo di apprendimento

2. **Media Ponderata** * CFR+ assegna un peso linearmente crescente alle iterazioni più recenti * Dà alla strategia dell'iterazione t un peso di t * Questo approccio prioritizza le strategie apprese più tardi nel processo * Potenzialmente accelerando la convergenza verso una soluzione quasi ottimale * Contrasta con la media uniforme spesso utilizzata nel CFR tradizionale

3. **Metodologia di Aggiornamento** * CFR+ tipicamente esegue aggiornamenti alternati, concentrandosi su un giocatore alla volta in ogni iterazione * Questo differisce dall'aggiornare i rimpianti per entrambi i giocatori simultaneamente * CFR+ generalmente non impiega tecniche di campionamento utilizzate in alcune altre varianti di CFR

Questi miglioramenti "Plus" sono vitali per il successo pratico di CFR+ in giochi complessi come il poker. La caratteristica di regret-matching+ assicura che l'algoritmo non scarti prematuramente azioni potenzialmente benefiche, mentre la media ponderata assicura che la strategia finale rifletta la fase più raffinata dell'apprendimento. Un'altra differenza chiave è che la strategia finale utilizzata in CFR+ è la strategia corrente alla fine dell'addestramento, non la media di tutte le strategie passate, che può anche migliorare le prestazioni.

Il Processo di Iterazione CFR+

Il processo iterativo di CFR+ implica simulare innumerevoli istanze del gioco contro se stesso.

Come CFR+ Raffina la Strategia:

* In ogni iterazione, l'algoritmo identifica le azioni che avrebbero portato a risultati migliori negli scenari passati * Quindi aggiusta la sua strategia per favorire queste azioni nelle iterazioni successive, aumentando la loro probabilità di essere scelte * Questo raffinamento continuo è simile a un giocatore che rivede le sue decisioni dopo ogni mano e fa aggiustamenti nel tempo, ma su scala massiva e con precisione matematica * Questo spinge l'algoritmo verso un approccio ottimale

Iterando ripetutamente attraverso tutti i possibili punti di decisione e aggiornando le strategie basate sul rimpianto accumulato, è garantito che la strategia media impiegata dai giocatori convergerà verso un Equilibrio di Nash. Un Equilibrio di Nash rappresenta uno stato stabile nel gioco dove nessun giocatore può migliorare il proprio risultato atteso cambiando unilateralmente la propria strategia, assumendo che le strategie dei loro avversari rimangano le stesse.

> **Nota:** Sebbene raggiungere un vero Equilibrio di Nash potrebbe essere computazionalmente irrealizzabile per il No-Limit Hold'em su scala completa, CFR+ mira a trovare una strategia che sia molto difficile da sfruttare per un avversario, che è l'obiettivo pratico nel poker.

Il Traguardo Storico: Risolvere il Heads-Up Limit Texas Hold'em

Il culmine di questi progressi algoritmici è stato evidente nel traguardo storico di "risolvere" il Heads-Up Limit Texas Hold'em (HULHE).

La Svolta del HULHE:

* Gli articoli di ricerca di Tammelin et al. (2015) e Bowling et al. (2015) hanno annunciato questo risultato rivoluzionario * Realizzato utilizzando l'algoritmo CFR+ * Il termine "debolmente risolto" significa che l'attaccabilità della strategia calcolata è notevolmente bassa * Misurata a 0,986 milli-big-blinds per gioco * Questo livello di attaccabilità è così minimo che probabilmente richiederebbe una vita umana di gioco per provare statisticamente che la strategia non è una soluzione esatta * Il programma che ha compiuto questa impresa è stato chiamato Cepheus

Questo risultato ha segnato una pietra miliare importante nei campi dell'intelligenza artificiale e della teoria dei giochi, dimostrando l'immensa potenza di CFR+ nell'affrontare giochi straordinariamente complessi con informazione imperfetta. Prima di questo, nessun gioco non triviale a informazione imperfetta giocato competitivamente dagli umani era mai stato risolto. HULHE, sebbene più semplice del No-Limit Hold'em a causa della sua struttura di puntate fissa, possiede comunque un albero di gioco astronomicamente grande.

Come CFR+ ha Permesso la Svolta del HULHE

CFR+ ha permesso questa svolta gestendo efficacemente la complessità intrinseca del gioco e i requisiti di risorse esigenti.

Realizzazioni Tecniche di CFR+:

* Il gioco completo di HULHE contiene un numero enorme di stati possibili e punti di decisione * CFR+ è stato specificamente progettato per gestire questa scala massiva, che aveva precedentemente reso impraticabili altre varianti di CFR * Un aspetto cruciale del successo di CFR+ è stata l'implementazione di tecniche di compressione per memorizzare efficientemente la strategia di soluzione approssimata e i rimpianti accumulati * Questo ha ridotto significativamente le richieste di memoria * Ha permesso che il calcolo estensivo fosse distribuito attraverso una rete di computer utilizzando lo storage su disco

Inoltre, CFR+ esibisce una notevole efficienza computazionale, convergendo verso un Equilibrio di Nash molto più efficacemente delle implementazioni standard di CFR. L'evidenza empirica ha indicato che CFR+ richiedeva considerevolmente meno potenza di calcolo rispetto ai metodi di campionamento CFR all'avanguardia.

Il successo nel risolvere HULHE ha sottolineato che il progresso non era solo nella logica centrale di CFR ma anche nei significativi miglioramenti ingegneristici e algoritmici incorporati in CFR+ che lo hanno reso veramente scalabile. Senza questi miglioramenti nella gestione della memoria e nella velocità di convergenza, le risorse computazionali necessarie per risolvere HULHE sarebbero state praticamente irraggiungibili, anche con una potenza di calcolo sostanziale.

Implicazioni Più Ampie:

* Ha validato il quadro teorico dell'Equilibrio di Nash per le interazioni strategiche del mondo reale che coinvolgono informazioni nascoste * Ha dimostrato la capacità dell'IA di superare le prestazioni a livello umano in domini strategici complessi caratterizzati da incertezza e inganno * Ha formalmente provato la credenza di lunga data che il dealer nel poker possiede un vantaggio sostanziale in HULHE * Le metodologie sviluppate potrebbero potenzialmente essere adattate e applicate a diversi campi come la negoziazione, la sicurezza e l'allocazione delle risorse

Piosolver: Portare CFR+ ai Giocatori di Poker

Piosolver sfrutta la potenza di CFR+ (o le sue varianti ottimizzate come Pure CFR) per calcolare strategie ottimali per una vasta gamma di scenari di poker. Questo software mantiene l'intero albero di gioco nella sua memoria durante il processo di risoluzione. Opera simulando innumerevoli iterazioni del gioco, impiegando i principi di CFR+ per raffinare continuamente le strategie e convergere verso un Equilibrio di Nash per lo scenario specifico definito dall'utente.

Piosolver serve come strumento pratico che sfrutta le capacità computazionali di CFR+ per fornire intuizioni azionabili sulla strategia GTO del poker per situazioni particolari. Invece di richiedere che gli utenti possiedano una profonda conoscenza dell'algoritmo sottostante o accesso a risorse computazionali estese, Piosolver offre un'interfaccia user-friendly per definire scenari di poker e ottenere soluzioni in un tempo ragionevole.

Il Processo di Simulazione in Piosolver:

1. **Fase di Configurazione** * Gli utenti inseriscono variabili cruciali che definiscono lo scenario di poker: * Range preflop per i giocatori coinvolti * Carte comuni sul board * Dimensioni delle puntate disponibili * Dimensioni effettive degli stack

2. **Fase di Elaborazione** * Piosolver costruisce un albero decisionale che rappresenta tutte le possibili sequenze di azioni * L'algoritmo CFR+ attraversa iterativamente questo albero estensivo * Calcola il rimpianto associato a ogni possibile azione in ogni insieme di informazione * Continua questo processo iterativo fino a raggiungere un livello predeterminato di precisione * La precisione è spesso misurata dall'attaccabilità della strategia risultante

Sebbene gli utenti non debbano comprendere completamente le complessità di CFR+ per utilizzare Piosolver efficacemente, capire che il software si basa su questo algoritmo robusto e teoricamente solido fornisce una base solida di fiducia nei risultati generati. L'interfaccia utente di Piosolver astrae efficacemente i calcoli matematici complessi, permettendo ai giocatori di concentrarsi sull'interpretazione dell'output e sull'applicazione delle intuizioni al loro gioco.

Comprendere l'Output di Piosolver

Piosolver presenta le strategie calcolate in un formato facilmente interpretabile dai giocatori di poker, tipicamente come matrici di range.

Interpretare i Risultati del Solver:

* Le matrici di range rappresentano visivamente la frequenza con cui ogni possibile mano iniziale dovrebbe prendere diverse azioni * Mostra la frequenza ottimale per puntare, passare, rilanciare o foldare in varie situazioni * Analizzando queste frequenze, i giocatori possono ottenere una comprensione profonda di: * Il mix ottimale di value bet e bluff che dovrebbero impiegare * Come giocare diverse categorie di mani secondo i principi GTO * Questo output sottolinea l'importanza di costruire range ben bilanciati e imprevedibili

Piosolver traduce efficacemente l'output astratto dell'algoritmo CFR+ in una guida pratica per i giocatori di poker, dimostrando come sviluppare strategie bilanciate e inattaccabili per scenari specifici. Studiando l'output di Piosolver, i giocatori possono imparare la logica sottostante del GTO e applicare questi principi al proprio gioco, anche in situazioni dove non stanno eseguendo attivamente simulazioni.

CFR vs. CFR+: Comprendere le Differenze Chiave

Le differenze chiave tra CFR tradizionale e CFR+ evidenziano i progressi significativi che rendono CFR+ particolarmente adatto per applicazioni complesse come i solver di poker.

Tabella Comparativa: CFR vs. CFR+

| Caratteristica | CFR | CFR+ | Vantaggio di CFR+ | |----------------|-----|------|-------------------| | **Gestione del Rimpianto** | Traccia rimpianto cumulativo (può essere negativo) | Azzera rimpianto negativo (Q-values) | Evita di rimanere bloccato su azioni subottimali; permette riconsiderazione più rapida | | **Aggiornamento Strategia** | Basato su rimpianto positivo | Proporzionale a Q-values (non negativi) | Assicura che le azioni vengano scelte di nuovo dopo essersi dimostrate utili | | **Media** | Tipicamente media uniforme | Media ponderata (linearmente crescente) | Dà più peso alle iterazioni successive, potenzialmente accelerando la convergenza | | **Meccanismo di Aggiornamento** | Spesso aggiornamenti simultanei | Tipicamente aggiornamenti alternati | Può migliorare le prestazioni empiriche | | **Velocità di Convergenza** | Generalmente più lenta empiricamente | Generalmente più veloce empiricamente | Raggiunge una buona approssimazione dell'Equilibrio di Nash in meno iterazioni | | **Efficienza di Memoria** | Può accumulare rimpianto negativo significativo | Spesso più efficiente in memoria | Riduce l'entropia dei dati necessari |

CFR+ generalmente esibisce una convergenza empirica più rapida verso una soluzione quasi ottimale rispetto al CFR tradizionale. Questo significa che richiede meno iterazioni per raggiungere un livello simile di precisione. Il meccanismo di regret-matching+ permette a CFR+ di recuperare più rapidamente da sequenze sfavorevoli di risultati e di esplorare più efficacemente il vasto spazio strategico intrinseco al poker.

La media ponderata prioritizza le strategie più raffinate sviluppate più tardi nel processo di apprendimento, portando a una convergenza più rapida verso una buona approssimazione dell'Equilibrio di Nash. Questi cambiamenti apparentemente sottili nell'algoritmo hanno un impatto sostanziale, rendendo l'intero processo di trovare strategie quasi ottimali significativamente più efficiente e affidabile per applicazioni pratiche come i solver di poker.

> **Importante:** Se Piosolver dovesse basarsi unicamente su CFR tradizionale, i tempi di calcolo per molti scenari comuni di poker sarebbero probabilmente proibitivamente lunghi per l'uso pratico. La capacità di azzerare il rimpianto negativo impedisce all'algoritmo di scartare prematuramente azioni potenzialmente preziose, mentre la media ponderata assicura che la strategia finale sia fortemente influenzata dalle fasi più mature dell'apprendimento.

Malintesi Comuni su GTO e Solver

Nonostante la potenza di CFR+ e le intuizioni fornite dai solver come Piosolver, persistono diversi malintesi comuni sul poker GTO e il ruolo di questi strumenti.

Sfatare i Miti su GTO e Solver:

1. **Mito: Il poker è stato completamente risolto** * Realtà: Sebbene il Heads-Up Limit Hold'em sia considerato debolmente risolto, il No-Limit Hold'em e il poker multigiocatore presentano una complessità significativamente maggiore e rimangono irrisolti * I solver per queste varianti più complesse si basano su astrazioni e semplificazioni per rendere i calcoli fattibili

2. **Mito: GTO è sempre la migliore strategia** * Realtà: Sebbene GTO miri a un approccio inattaccabile, potrebbe non sempre produrre il maggior profitto contro avversari che deviano considerevolmente dal GTO * In tali casi, strategie sfruttative mirate a debolezze specifiche possono essere più redditizie * Spesso, l'approccio più efficace coinvolge un mix di gioco GTO e sfruttativo

3. **Mito: I solver forniscono risposte definitive per tutte le situazioni** * Realtà: Gli output del solver sono contingenti alle ipotesi e ai parametri definiti dall'utente * Diverse ipotesi possono portare a diverse strategie "ottimali" * La precisione degli output del solver può talvolta creare una falsa sensazione di precisione assoluta * Piccole differenze nel valore atteso potrebbero essere praticamente insignificanti

4. **Mito: Padroneggiare le soluzioni GTO del solver renderà un giocatore imbattibile** * Realtà: Sebbene GTO possa rendere un giocatore inattaccabile, ottenere guadagni significativi spesso richiede di identificare e sfruttare gli errori degli avversari * I solver non insegnano direttamente come sfruttare le tendenze degli avversari

5. **Mito: GTO è facile da imparare e applicare** * Realtà: Gli output del solver sono spesso intricati e richiedono considerevole studio e comprensione * Semplicemente memorizzare gli output del solver senza comprendere i principi sottostanti è spesso inefficace

6. **Mito: GTO dovrebbe essere seguito rigorosamente contro tutti gli avversari** * Realtà: Contro avversari che commettono errori frequenti e prevedibili, una strategia puramente sfruttativa focalizzata sulla capitalizzazione di quelle perdite specifiche è spesso più redditizia che seguire rigidamente le linee guida GTO

Comprendere questi malintesi è vitale per utilizzare i solver come Piosolver efficacemente e per sviluppare una strategia di poker completa. GTO fornisce una base teorica solida, ma la sua applicazione pratica richiede considerazione attenta e adattamento.

Bilanciare GTO e Gioco Sfruttativo

GTO serve come quadro teorico che mira a creare una strategia che non può essere sfruttata, assicurando un risultato di break-even o migliore nel lungo periodo contro qualsiasi avversario. In contrasto, le strategie sfruttative sono progettate per approfittare di tendenze e debolezze specifiche nello stile di gioco di un avversario.

Integrazione Strategica:

* I giocatori di poker più di successo spesso integrano elementi sia di GTO che di gioco sfruttativo * Usano GTO come linea di base fondamentale * Deviano strategicamente dal GTO quando identificano pattern sfruttabili nel comportamento degli avversari * I solver come Piosolver sono strumenti potenti per comprendere i principi GTO * Non offrono un percorso garantito verso la vittoria senza applicazione riflessiva

I giocatori devono sviluppare una comprensione del perché il solver raccomanda particolari azioni ed essere preparati ad aggiustare queste strategie in base agli avversari specifici che affrontano e al contesto unico di ogni gioco.

> **Intuizione Chiave:** I solver sono più preziosi come risorse educative che aiutano i giocatori a coltivare una comprensione più profonda dei principi di strategia del poker, piuttosto che come strumenti da seguire ciecamente durante il gioco dal vivo. L'intuizione umana e la capacità di leggere gli avversari rimangono aspetti cruciali del poker di successo che i solver non possono replicare completamente.

I Limiti di CFR+: Sfide nella Risoluzione di Varianti Complesse di Poker

Sebbene CFR+ si sia dimostrato strumentale nel risolvere il Heads-Up Limit Hold'em, risolvere varianti più complesse di poker come il No-Limit Hold'em e i giochi multigiocatore presenta sfide significative, anche per algoritmi avanzati.

Sfide Principali:

* La capacità di puntare qualsiasi importo nel No-Limit Hold'em aumenta drammaticamente la complessità dell'albero di gioco * Struttura di puntate fissa del Limit Hold'em vs spazio degli stati vastamente più grande nel No-Limit * Aggiungere più giocatori aumenta esponenzialmente la dimensione dell'albero di gioco * I pot multiway sono considerevolmente più intricati degli scenari heads-up * I solver per No-Limit e giochi multigiocatore si basano fortemente su tecniche di astrazione: * Riducono la complessità raggruppando mani simili * Restringono le dimensioni delle puntate per rendere il calcolo fattibile * Queste astrazioni introducono approssimazioni * Potrebbero non catturare completamente le sfumature del gioco

Pertanto, sebbene CFR+ rappresenti un progresso importante, la pura complessità del No-Limit Hold'em e del poker multigiocatore continua a porre sfide continue per la ricerca in teoria dei giochi e intelligenza artificiale. Raggiungere una vera "soluzione" per queste varianti nello stesso senso definitivo di HULHE rimane un obiettivo distante.

Assistenza in Tempo Reale (RTA) nel Poker: L'Applicazione Pratica di CFR+ e GTO

Gli algoritmi avanzati discussi in questo articolo formano la spina dorsale computazionale del moderno software di Assistenza in Tempo Reale (RTA) per il poker, portando i concetti teorici GTO nell'applicazione pratica durante il gioco reale. Gli strumenti RTA di poker sfruttano la potenza di CFR+ o algoritmi simili per fornire ai giocatori raccomandazioni azionabili basate su GTO in tempo reale mentre le mani si svolgono.

Come il Software RTA di Poker Utilizza CFR+ e i Principi GTO:

* Pre-calcola strategie ottimali per scenari comuni usando CFR+ o algoritmi simili * Adatta dinamicamente le soluzioni GTO a situazioni specifiche in gioco * Fornisce raccomandazioni in tempo reale, matematicamente solide per dimensioni delle puntate, azioni e frequenze * Bilancia efficienza computazionale con profondità strategica, adattando principi GTO complessi per uso pratico immediato * Offre ai giocatori un modo per implementare concetti teorici che sarebbero impossibili da calcolare manualmente durante il gioco

I miglioramenti di efficienza introdotti da CFR+ sono stati particolarmente trasformativi per gli strumenti RTA di poker, rendendo possibile generare strategie quasi ottimali con minor overhead computazionale. Questo permette al software RTA di funzionare efficacemente su hardware consumer e fornire assistenza tempestiva senza necessità di risorse di supercalcolo.

> **Intuizione dell'Industria:** Mentre i solver di poker si sono evoluti da strumenti di ricerca accademica ad applicazioni commerciali, il software RTA di poker rappresenta la prossima frontiera nel rendere la teoria dei giochi avanzata accessibile ai giocatori. Mentre il gioco GTO puro richiede un'esecuzione perfetta attraverso trilioni di scenari possibili, gli strumenti RTA aiutano a colmare il divario tra ottimalità teorica e implementazione pratica.

Per i giocatori che cercano di migliorare la loro comprensione dei principi GTO mentre li applicano nella pratica, il software RTA di poker di qualità offre sia valore educativo che assistenza strategica, servendo come prezioso strumento di allenamento per sviluppare una migliore intuizione per il gioco ottimale attraverso diverse situazioni.

Conclusione: L'Impatto di CFR+ sul Poker Moderno

In conclusione, CFR+ rappresenta uno dei progressi più significativi nell'IA del poker e nella teoria dei giochi dell'ultimo decennio. Migliorando drammaticamente l'efficienza degli algoritmi di ricerca dell'equilibrio, ha reso la strategia GTO accessibile ai giocatori seri di poker attraverso solver commerciali come Piosolver.

Punti Chiave:

* Nessun essere umano può implementare perfettamente le strategie GTO in tutte le possibili situazioni di poker * Il gioco è semplicemente troppo complesso per una completa padronanza umana * Studiare i risultati dei solver basati su algoritmi CFR+ fornisce preziose informazioni su un gioco bilanciato e non sfruttabile * Che tu sia un giocatore ricreativo che cerca di migliorare o un professionista alla ricerca di un vantaggio, comprendere CFR+ ti aiuta a utilizzare meglio i moderni strumenti di strategia del poker * Mentre il poker continua a evolversi e il divario tra il gioco ottimale e quello umano si restringe, algoritmi come CFR+ continueranno a plasmare il modo in cui il gioco viene studiato e giocato ai livelli più alti

Riferimenti

[1] Tammelin, O., Burch, N., Johanson, M., & Bowling, M. (2015). Risolvere il Texas Hold'em Heads-up Limit. In *Atti della 24ª Conferenza Internazionale Congiunta sull'Intelligenza Artificiale (IJCAI)*. [Link al PDF](http://poker.cs.ualberta.ca/publications/2015-ijcai-cfrplus.pdf)

[2] Bowling, M., Burch, N., Johanson, M., & Tammelin, O. (2015). Il Poker Heads-Up Limit Hold'em è Risolto. In *Science*, 347(6218), 145--149. Versione estesa con risultati: *Communications of the ACM*, Vol. 60 No. 11, Pagine 81-88. [Link all'Articolo ACM](https://cacm.acm.org/magazines/2017/11/222180-heads-up-limit-holdem-poker-is-solved/fulltext)