OpenAI slår Google, Meta og Grok i pokerturnering kun basert på AI
Ukeslang LLM-pokeroppgjør avslører hvordan roboter bløffer, satser – og noen ganger ødelegger for seg selv
- OpenAIs o3-modell vant en femdagers pokerturnering med ni AI-chatboter
- O3-modellen vant ved å spille det mest konsistente spillet
- De fleste toppspråkmodellene håndterte poker bra, men slet med bløffing, posisjon og grunnleggende matematikk
I et digitalt oppgjør uten like, tilbrakte ni av verdens mektigste store språkmodeller fem dager i en pokerkamp med høye innsatser. OpenAIs o3, Anthropics Claude Sonnet 4.5, X.ais Grok, Googles Gemini 2.5 Pro, Metas Llama 4, DeepSeek R1, Kimi K2 fra Moonshot AI, Magistral fra Mistral AI og Z.AIs GLM 4.6 spilte tusenvis av hender med no-limit Texas hold'em ved bord med 10 og 20 dollar, med 100 000 dollar i banken hver. Da OpenAIs o3-modell gikk 36 691 dollar rikere etter et ukelangt pokerspill, var det ingen troféer, bare skryterettigheter.
Den eksperimentelle PokerBattle.ai var utelukkende AI-drevet med den samme første meldingen gitt til hver spiller. Det var ren strategi, hvis strategi er det du kaller tusenvis av mikrobeslutninger tatt av maskiner som ikke egentlig forstår å vinne, tape eller hvor ydmykende det er å gå konkurs med 7-to.
For et teknisk stunt var det uvanlig avslørende. De beste AI-ene bløffet og satset ikke bare – de tilpasset seg, etterapet motstanderne sine og lærte i sanntid hvordan de skulle navigere i tvetydighet. Selv om de ikke spilte feilfri poker, var de imponerende nær ved å etterligne erfarne spilleres vurderinger.
OpenAIs o3 viste raskt at de hadde den stødigste hånden, og vant tre av de fem største pottene og holdt seg nær lærebokens pre-flop-teori. Anthropics Claude og X.coms Grok rundet av topp tre med betydelige fortjenester på henholdsvis $33 641 og $28 796.
I mellomtiden mistet Llama hele stabelen og kollapset tidlig. Resten av flokken havnet et sted midt imellom, med Googles Gemini som gikk med et beskjedent overskudd og Moonshots Kimi K2 med tap som sendte dem ned til 86 030 dollar.
Gambling AI
Poker har lenge vært en av de beste analogene for testing av generell AI. I motsetning til sjakk eller Go, som er avhengige av perfekt informasjon, krever poker at spillerne resonnerer under usikkerhet. Det er et speilbilde av virkelige beslutninger i alt fra forretningsforhandlinger til militærstrategi, og nå, tydeligvis, utvikling av chatboter.
En gjennomgående lærdom fra turneringen var at robotene ofte var for aggressive. De fleste foretrakk handlingsfokuserte strategier, selv i situasjoner der det ville vært klokere å gi seg. De prøvde å vinne store potter mer enn de prøvde å unngå å tape dem. Og de var forferdelige til å bløffe, ikke fordi de ikke prøvde, men fordi bløffene deres ofte stammet fra feiltolkede hender, ikke smart bedrag.
Registrer deg for siste nytt, anmeldelser, meninger, toppteknologiske tilbud og mer.
Likevel blir AI-verktøy smartere på måter som går langt utover overflatebasert intelligens. De gjentar ikke bare det de har lest; de foretar sannsynlighetsbaserte vurderinger under press og lærer å lese rommet. Det er også en påminnelse om at selv kraftige modeller fortsatt har feil. Å misforstå situasjoner, trekke usikre konklusjoner og glemme sin egen «posisjon» er ikke bare et pokerproblem.
Du sitter kanskje aldri overfor en språkmodell i et ekte pokerrom, men sjansen er stor for at du vil samhandle med en som prøver å ta viktige avgjørelser. Dette spillet var bare et glimt av hvordan det kunne se ut.

Skribent, forfatter og illustratør med en spesiell forkjærlighet for produkter og brukergrensesnitt fra Apple.
- Eric Hal SchwartzContributor
