FBのAIプロリバスが現役ポーカー世界王者に勝利!

FBのAIプロリバスが現役ポーカー世界王者に勝利!

FBとカーネギーメロン大学が開発したAIロボットが、ポーカーゲーム「テキサスホールデム」でポーカー世界王者に勝利したニュースがネットで話題になっています。

ポーカーはこれまで、AIの活用が難しい領域とみなされて来ました。

特にテキサスホールデムはハッリ(ブラフ)があるので、AIが予測できない感情の起伏があります。

そこを克服したとなると…

オンラインカジノで僕の横から指示を出してもらいたい!

FBのAIプロリバスが現役ポーカー世界王者に勝利!

AIから指示を受ける人間

テキサスホールデムとは?

テキサスホールデムとはどんなゲームなのか、まずはご説明します。

キサスホールデムのルール

テキサスホールデムは、フロップポーカーと呼ばれるポーカーの種類の1つとなり、ゲームの参加者全員が使用できる共通のカードが並べられるのが特徴的なゲームです。

ゲームに参加しているプレイヤー全員に2枚のホールカードが配られ、ボードの上に5枚のコミュニティカードが表向きで開かれます。

プレイヤー全員に配られたホールカードは、配られたプレイヤーのみが使用できるカードとなり、ボードの上に開かれるコミュニティカードは、ゲームに参加しているプレイヤー全員が共通で使用することができるカードとなります。

1ゲームは4回のラウンドに分かれており、各ラウンドでプレイヤーは勝負を行っていきます。

全てのラウンドでゲームを降りることも可能ですが、降りてしまった場合はそれまで賭けていた金額は全て失われてしまいます。

ラウンドが全て終了したとき、ゲームを降りずに最後まで残ったプレイヤーは、手持ちの2枚のホールカードをオープンして他のプレイヤーとハンドの強さを比較します。

そこで一番強いポーカーハンドを持っているプレイヤーがゲームでの勝者となり、全ラウンドでプレイヤーが賭けていた全てのチップを得ることができます。

テキサスホールデムは、1つのテーブルに2人~10人と多人数でテーブルを囲い楽しむゲームとなります。

感情をコントロールするAI

チェスや囲碁はルールが明確なボードゲームです。

なので、

AIくんにとっても過去の定石を分析したり、今までのゲームを分析したりすることにより、よりよい戦術を選ぶのは最近では当たり前となっています。

ところがです…

ポーカーでは相手の手が分からず、はったり(ブラフ)のような戦術を用いて感情を操る必要があるためです。

特に、テキサスホールデムはプレイヤーは自分の二枚のホールドカードと5枚のコミュニティーガードのコンビネーションで相手が自分より強いか弱いか判断します。

この時に相手の二枚の見えないカードをめぐり憶測とブラフが勝負のカギになります。

AIが勝てるとサンエス誌に発表

カーネギーメロン大学教授のサンドホルム教授(Tuomas Sandholm)とフェイスブックのAIサイエンティストであり、サンドホルム教授の教え子であるノーム・ブラウン(Noam Brow)は、ポーカー専用のAIボット プロリバス「Pluribus」を開発し、その成果を7月11日、学術誌Scienceに掲載しました。

自己学習ロボットの登場

驚くことに!

プロリバスは複数人で対戦するテキサスホールデムを、自己学習メソッドを使いマスターしました。

自己学習とは、人間がデータのインプットを行わないAIのトレーニング方法。

2人の研究者によると「プロリバスはランダムにプレイを行うことで、どのような手が良い結果をもたらすかを、ゼロから時間をかけて学んでいった」と論文で述べています。

この手法はかつて、グーグル傘下のDeepMindが「AlphaGo」に囲碁を学ばせたメソッドと同様なもののようです。

この分野では近年、コンピューティングパワーの向上やデータセットの整備により、より洗練されたAIテクニックが生まれて来ました。

IT業界の大手は、AI分野のブレークスルーを、ヘルスケアやサイエンス、エネルギー分野の革新につなげようと考えいるようですが…

AIメガネでポーカーゲーム!?

小さなメガネの中にプロリバスがプログラムされていて、その指示通りに賭けてポーカートーナメントに勝ってしまう、なんて事も起きる可能性がありますよね。

ポーカーの世界チャンピオン

クリス・ファーガソン

プロリバスは今回、ポーカーの世界チャンピオンのクリス・ファーガソン(Chris Ferguson)や、ワールド・ポーカーツアーで最多優勝記録を保持する米国のプロポーカー選手のダレン・エリアス(Darren Elias)らを打ち破りました。

カーネギーメロン大学は2017年に開発したポーカー用AIボット・リブラトゥス「Libratus」でも、ポーカーのプロ選手に勝利しています。

AIは今のところ人間に負けなしです。

今回のプロリバスはリブラトゥスよりどのように進化したかと言うと:

  • 試合中にオンライン検索により数手先を読む機能
  • 自己学習アルゴリズムを追加

オンライン検索で先読みして、その結果を自己学習のアルゴリズムに追加するとは…

もう完全に人間の領域を超えてます。

150ドルのシステムで可動

さらにです!

このプロリバスはリブラトゥスよりも小さなコンピューティング容量で運用可能で、今回はわずか150ドルのクラウドのシステムで動きます。

このまま進むとAI分野では効率化が劇的に進み、今まで膨大な費用と時間がかかっていたAIのトレーニングが必要なくなる日もすぐそこのようです。

ここで気になるのはプロリバスのようなAIボットの普及により、プロのポーカー選手の生活が脅かされてしまのでは?

一歩進めて言えば、

市販化されてしまえばオンラインカジノだけに留まらずカジノ全体の運営会社が潰れてします危機に直面するかもです!

オープンソース化は今はしない…

「フェイスブックは、このAIをオープンソース化するつもりはない。ポーカーは商業的にプレイされているゲームであり、オープンソース化はコミュニティにネガティブな影響を与える危険があるからだ」とフェイスブックの広報担当のAri Entinはフォーブスの取材に述べた。

まとめ

自己学習するAIは遅かれ早かれ登場するとは思っていましたが…まさか、150ドルのシステムで動くとは。

そこまで安く出来るとなれば、この自己学習AIのビジネスチャンスは無限大に広がり、その反対に人間の仕事はどんどん縮小傾向に向かう感じでしょうか。

今後、この安価で自己学習するAIの使われ方がすごく気になります。

仮想通貨のリブラといい、このプロリバスといい、フェイスブックは時代をリードしている感があります。

フェイスブックの株でも買っておいた方がよさそうですね。