2020: Aufstieg der Maschinen
von James Grosjean Zählen Sie mich zu den Netflix-Drohnen, die The Queen's Gambit (2020) liebten, aber ich war schon immer ein Schachbegeisterter. Während meiner Studienzeit habe ich wahrscheinlich tausend Schokoladencroissants gegessen, während ich beobachtet habe, wie der schrullige, großartige Murray Turnbull (auch bekannt als „The Chess Master“) gegen alle Ankömmlinge auf dem Stadtplatz antritt - […]

von James Grosjean Zählen Sie mich zu den Netflix-Drohnen, die The Queen's Gambit (2020) liebten, aber ich war schon immer ein Schachbegeisterter. Während meiner Studienzeit habe ich wahrscheinlich tausend Schokoladencroissants gegessen, während ich beobachtet habe, wie der schrullige, großartige Murray Turnbull (auch bekannt als „The Chess Master“) gegen alle Ankömmlinge auf dem Stadtplatz antritt - „2 USD, Rückerstattung, wenn Sie gewinnen oder ziehen.“ Es war mir eine Ehre, ein Foto des großen Karpov aufzunehmen, das vom Buntglas der Gedenkhalle eingerahmt wurde, als er auf dem Campus ein 40-Brett-Simul machte. Ich war Teil der Studentenpresse, als Kasparov seine damals umstrittene Aussage machte, dass ein Computer ein Grand Champion sein würde, bevor es eine Frau sein würde. Um die Debatte über Kasparovs mögliche Frauenfeindlichkeit für ein anderes Forum und einen anderen Tag aufzubewahren, nahm ich seine Aussage lediglich als eine Projektion, die auf empirischen Beobachtungen der Schachgemeinschaft beruhte. Die Beteiligung von Frauen war immer gering und nahm nicht wesentlich zu, während die Computer bereits stark waren und schnell stärker wurden. Die Maschinen werden eine neue Gleichheit einleiten - bei der alle Geschlechter wie Ameisen niedergeschlagen werden. Der Satz von Zermelo besagt, dass ein Spiel mit vollständigen Informationen (beide Spieler können alle Figuren auf dem Schachbrett sehen), das endlich ist (das Spiel wird nach einer bestimmten Anzahl von Zügen enden), eine Lösung hat und dass, wenn beide Seiten dies spielen optimale Lösung, dann hat jedes Spiel das gleiche Ergebnis. Schach ist so kompliziert, dass wir uns nicht sicher sind, was das Ergebnis sein würde, aber wir glauben, dass Weiß jedes Mal gewinnen würde. In diesem Fall gibt es keine schwarze Antwort, die das Ergebnis ändern könnte. Das Spiel von Connect Four fällt ebenfalls unter Zermelos Theorem, und die Analyse hat ergeben, dass in diesem Spiel die hinterhältige Schwester immer gewinnt, wenn sie zuerst geht und optimal spielt. Wenn Sie ein AP sind, der QGambit mag und während dieser endlosen Pandemie nach mehr Inhalten hungert, dann ist Ihre nächste Aufgabe, AlphaGo anzusehen, eine Dokumentation über den Aufstieg der Computer im alten Go-Spiel, die komplizierter ist als Schach. Kein Scherz, dieser Film ist ein Tränenfluss für Leute, die sich für dieses Gebiet interessieren und das intensive emotionale Drama für den Champion der Menschheit, Lee Sedol, schätzen - das Beste, was es jemals gab. Der Film fängt Sedols Bedrängnis, Mut, Brillanz und dann Demut ein, als er erkennt, dass dieses Match gegen die Maschine nicht nur ein Spiel ist, sondern die Entstehung einer neuen Weltordnung. Sedol war kein Programmierer und wusste nicht, gegen was er antreten würde, aber als Experte in seinem Handwerk spürte er auf dem Brett das unerbittliche, undurchdringliche Gewicht seines Gegners. Nachdem Sie AlphaGo genossen haben, empfehle ich (tatsächlich empfiehlt Google), dass Sie sich einige der Pokerspiele zwischen Dan Negreanu der alten Schule und dem modernen Computer-Klon Doug Polk ansehen. Der beste Spieler der Welt ist die Maschine, daher ahmt ein kluger Mensch wie Polk die Strategie der Maschine nach. Anpassen oder sterben. Ich hatte einmal einen kurzen Austausch mit Howard Lederer. Ich fragte ihn nach Bots auf den Pokerseiten. Er wies das Problem mit den Worten zurück: „Poker ist nicht wie Schach. Poker ist ein Spiel mit unvollständigen Informationen. Computer sind nicht gut darin. “ Ich konnte nicht sagen, ob er ein naiver Dummkopf oder ein Conman-Shill für Full Tilt Poker war. Auf jeden Fall wollte ich dieses Gespräch vor 15 Jahren nicht fortsetzen. Aber jetzt, im Jahr 2021, sind wir hier und es ist Zeit, dieses Gespräch fortzusetzen, indem wir diesen ersten Irrtum in Bezug auf die GTO-Computer (Game-Theory Optimal) und all die anderen überlappenden Irrtümer, die die Poker-Dinosaurier und selbsternannten Poker-Savants sind, widerlegen Ich klammere mich verzweifelt an: Irrtum Nr. 1: Computer sind nicht gut darin, unvollständige Informationen zu spielen. Das ist einfach unwissend. Es ist wahr, dass der Satz von Zermelo nicht für Spiele wie Poker gilt. Für Poker gibt es ANDERE Theoreme, die grundsätzlich besagen, dass es eine Lösung für das Spiel gibt, und eine Computerlösung beinhaltet im Allgemeinen „gemischte Strategien“, was bedeutet, dass die Strategie eine zufällige Komponente enthält (z. B. das Aufrufen einer Schere mit einer Wahrscheinlichkeit von 1/3) ). Computer sind ziemlich gut darin, besser als Menschen die Erwartung über probabilistische Ergebnisse zu berechnen, insbesondere wenn die Wahrscheinlichkeitsverteilungen genau bekannt sind, wie dies bei Kartenspielen der Fall ist. Zum Beispiel weiß der Computer genau, wie hoch die Wahrscheinlichkeit ist, einen Backdoor Flush zu zeichnen, und welche Pot Odds er benötigt, um das Jagen zu rechtfertigen. Obwohl Poker unvollständige Informationen enthält, ist Heads-up-No-Limit-Poker ein einfacheres Spiel als Go, obwohl Go vollständige Informationen enthält (allgemein bekannte Informationen). Irrtum Nr. 2: Die Überlegenheit des Computers beruht darauf, dass ich mich an jede Hand erinnern kann, die ich gespielt habe, und mich entsprechend anpassen kann. Während ein „ausbeuterischer Bot“ in der Tat Ihr bisheriges Spiel analysieren und sich auf wahrgenommene Schwächen einstellen würde, ist ein Standard-GTO-Bot (den wir früher als „Nash-Bot“ bezeichneten) das Poker-Äquivalent von BS beim Blackjack. Die GTO-Strategie ändert sich nicht, unabhängig davon, wie Sie in der Vergangenheit gespielt haben. Es braucht diese Informationen nicht und kümmert sich nicht darum. Irrtum Nr. 3: Die GTO-Lösung ist nur dann „korrekt“, wenn Sie gegen einen anderen GTO-Bot spielen, da dies bei der Entwicklung des Bots angenommen wurde - der Bot „lernte“, indem er gegen sich selbst spielte. Das ist falsch. "Der Bot hat gegen sich selbst gespielt, um Poker zu lernen" ist eine Fehlcharakterisierung des Entwicklungsprozesses. Die Medien mögen es, ihren Clickbait zu übertreiben, damit jedes Ergebnis beim Rechnen wie ein Generationsdurchbruch klingt und HAL und Skynet aufgerufen werden. Ein GTO-Bot weiß nichts über Poker. Das Ableiten der GTO-Strategie ist eine Berechnungsübung, die durch den enormen Speicher und die CPU-Geschwindigkeit, die in heutigen Computern verfügbar sind, und die Entwicklung eines effizienten Algorithmus für die Berechnung ermöglicht wird („Minimierung des Bedauerns“). Wir haben den Algorithmus nie als "maschinelles Lernen" oder "KI" beschrieben - wir haben ihn einfach "Bergsteigen" oder "Maximierung" oder "Optimierung" genannt. Bei jedem Schritt des iterativen Algorithmus hat der Computer die aktuelle Strategie für jeden Platz am Tisch in der Entwicklung, und diese aktuelle Strategie könnte im Volksmund als "sich selbst" beschrieben werden, wie in: "PokerSnowie spielt gegen sich selbst". Aber es ist wirklich nur eine Wiederholung auf dem Weg, den Hügel zu erklimmen, um auf dem Gipfel zu konvergieren - eine optimale Strategie für Poker. Dieses Optimum setzt keinen bestimmten Gegner voraus. Es gibt andere Möglichkeiten, wie wir die Lösung hätten berechnen können (wenn auch nicht so schnell), und sie wäre genauso gültig. Diese GTO-Strategie ist „The Book“ für Poker und würde unabhängig von ihrem Gegner niemals im Nachteil sein. Es gibt keine Strategie, die einen Vorteil daraus ziehen könnte. Irrtum Nr. 4: Der GTO-Bot geht davon aus, dass ich auf eine bestimmte Weise spielen werde, aber ich werde es austricksen, indem ich meinen Off-Suit 72 aus der Position spiele. Falsch. Der GTO-Bot geht nicht davon aus, wie Sie spielen. Es ist egal. Es ist unschlagbar gegen jede gegnerische Strategie. Stellen Sie sich vor, Sie haben einen bevorstehenden Kampf gegen Floyd Mayweather und Sie sagen: „Floyd erwartet, dass ich in einwandfreier körperlicher Verfassung auftauche. Er geht davon aus, dass ich in den nächsten sechs Monaten hart trainieren werde. Ich werde ihn austricksen - ich werde nur Netflix schauen und für die nächsten sechs Monate Donuts essen. “ Floyd hat keine Ahnung, wie viel Sie trainieren werden. Er weiß, dass kein Gegner einen Vorteil gegen ihn bekommen kann, wenn er selbst in perfekter Form auftaucht. Ist es sinnvoll zu sagen: „Der Bot geht davon aus, dass ich gut spielen werde. Ich werde den Bot austricksen, indem ich schlechtes Poker spiele! “ Ja, du hast es ihnen wirklich gezeigt! Irrtum Nr. 5: Ich habe eine Schwäche gefunden - wenn ich so und so aus dieser und jener Position heraus habe, sollte der Bot X tun, aber er tut Y. Falsch. Der Bot hat keine Schwäche. Sie betrachten eine bestimmte Handhaltung und ein bestimmtes Ergebnis, aber basierend auf der Wahrscheinlichkeit, in diesem Szenario zu sein, und allen möglichen Händen, die Sie aus Sicht des Bots halten könnten, ist das Spiel korrekt und Sie können Ich finde dort kein Loch. Es ist sehr gefährlich, ein Stück isoliert zu betrachten. Der Bot macht Bewegungen, um seine Reichweite auszugleichen, so dass Sie in anderen Situationen nicht meißeln können oder wenn andere Karten auf den Fluss kamen. Wenn Sie es nicht sehen, liegt der Fehler in Ihrem eigenen Poker-Denken, nicht im des Bots. Irrtum Nr. 6: Wenn ich es eine Weile spiele, werde ich herausfinden, wie es spielt, und eine Schwäche finden. Falsch. Es gibt keine Schwäche. Tatsächlich könnten wir die Strategie des Bots veröffentlichen, und es würde keinen Unterschied machen. Wenn ich Ihnen sage, dass ich mit einer Wahrscheinlichkeit von jeweils 1/3 Schere, Stein und Papier spielen werde, gibt Ihnen die Tatsache, dass Sie meine Strategie kennen, keine Möglichkeit, einen Vorteil zu erzielen. Es gibt keine Achillesferse. Irrtum Nr. 7: Die in Casinos eingeführten Heads-Up-Limit-Bots waren sehr gut zu schlagen, daher sind es wahrscheinlich auch GTO-Bots. Dies ist kein aussagekräftiger Vergleich. Einige der Casino-Bots wurden angewiesen, ihr A-Spiel nicht zu spielen, weil es gegen durchschnittliche Menschen zu stark war. Wenn das Casino den Bot so einstellt, dass er sein B-Spiel spielt, um beispielsweise einen Vorsprung von 5% gegenüber den meisten Spielern zu erzielen, hätte ein wirklich guter Mensch Geld gegen diesen GTSO-Bot verdienen können (spieltheoretischer suboptimaler Bot). Aber das ist ein anderes Thema. Es ist mir egal, wer du bist: Wenn du Heads-up gegen PokerSnowie spielst, wirst du verlieren. Irrtum Nr. 8: GTO-Bots können schwache Spieler schlagen, aber die Bots haben Probleme gegen Top-Gegner wie Phil Ivey oder Dan Negreanu. Falsch. Das Schöne an einem GTO-Bot ist, dass es keine Rolle spielt, wer der Gegner ist. Bestenfalls könnte jemand sogar mit dem Bot spielen. Ein Ring von GTO-Bots wäre wie ein Waschbecken, bei dem das Geld im Uhrzeigersinn den Knopf jagt und aufgrund des Rechen die Tischmitte abfließt. Ein praktisches Problem, das echte Profis hatten, war die Entscheidung, wann ihre Fähigkeiten ausreichten, um zu den nächsthöheren verfügbaren Einsätzen aufzusteigen, bei denen die Spieler vermutlich stärker waren. Aber jetzt kann sich ein Spieler, der die GTO-Strategie nachahmt, an jeden Tisch der Welt setzen, an jeden Einsatz und muss sich keine Sorgen mehr machen, der Fisch zu sein. Bestenfalls wäre das Spiel gleichmäßig (außerhalb des Rakes), und in der Praxis bietet eine GTO-Strategie einen beträchtlichen Vorteil gegenüber allen, denen Sie in freier Wildbahn begegnen. Irrtum Nr. 9: Dan Negreanu ist ein langjähriger Pokerprofi mit N Armbändern, also wird er Computernissen wie Doug Polk vernichten, die die Nuancen von echtem Poker nicht verstehen. Wenn ein Typ wie Polk nur „die Charts“ auswendig lernt und die GTO-Strategie nachahmt, muss er nichts verstehen. Er muss nicht wissen, was das Wort "Nuance" bedeutet. Die Poker-Erfahrung von Profis wie Negreanu ermöglichte es ihnen, das beste Spiel in komplizierten Szenarien herauszufinden. Diese Erfahrung ist veraltet, da die Computer gerade berechnet haben, was die richtigen Spiele sind. Vielleicht konnte er 1950 aufgrund der Erfahrung eines Spielers feststellen, dass es besser war, 14 gegen T zu treffen als zu stehen. Nachdem die vier Reiter die BS-Tabelle berechnet hatten, wurde diese Blackjack-Erfahrung irrelevant. Das Buch macht Erfahrung unnötig. Jetzt ist Doug Polk kein GTO-Bot. Er ist ein Top-Profi, der GTO-Strategien einsetzt. Negreanus einziger Versuch, Polk zu schlagen, ist, wenn Polks Emulation von GTO nicht genau ist und wenn die Löcher groß genug sind, damit Negreanu sie finden und ausnutzen kann. Das bezweifle ich. Ein weiterer Longshot wäre, wenn sie live spielen und wenn Polk physische Tells hat, die Informationen über seine Hole Cards preisgeben, und wenn Negreanu ihn so lesen kann. Oder wenn Polk Neigungsprobleme hat und von GTO abweicht, wenn er einen schlechten Kartenlauf hat. Unwahrscheinlich. Oder vielleicht ist das Spiel kurz genug, dass Negreanu in einer kleinen Stichprobe Glück hat. Nachdem Lee Sedol gegen AlphaGo gespielt hatte, erhöhte er sein Spiel und begann, alle zu vernichten (nicht, dass er es noch nicht getan hatte), zog sich dann aber aus dem Spiel zurück! Er räumte ein, dass er besiegt worden war (was für ein Konzept!) Und dass kein Mensch jemals wieder den besten Spieler der Welt, AlphaGo, herausfordern würde. Wir werden sehen, ob Negreanu dieselbe Offenbarung haben wird. Ein kürzlich veröffentlichter Tweet lässt mich wundern, denn Negreanu schien ein Bot-Spiel in Frage zu stellen und darauf hinzuweisen, dass es eine dünne Linie zwischen Genie und Donkishness gibt. Ich denke, er hofft immer noch, dass es einen Fehler in der GTO-Strategie gibt. Das gibt es nicht. Zuletzt habe ich gehört, dass Negreanu den Wettbewerb eingeholt hat, und es gibt Hinweise darauf, dass ein Grund dafür ist, dass Negreanu zu seiner Ehre mit PokerSnowie übt und sich anpasst! Wenn Negreanu die GTO-Strategie schnell erlernen kann, könnte er gleiche Wettbewerbsbedingungen schaffen, was eine enorme Leistung wäre. Der einzige Weg, wie ein Dinosaurier überleben kann, ist die Entwicklung. Wir werden im Jahr 2021 sehen. [Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]
ปอยเปต คาสิโน ออนไลน์ dgคาสิโน ปอยเปต คาสิโน ออนไลน์ คาสิโนsa คาสิโน sa

Leave a Reply

Your email address will not be published. Required fields are marked *