1: 2015/01/11(日) 22:21:30.88 ID:???.net
掲載日:2015年1月9日

 プレーヤー2人に限定したポーカーの「テキサス・ホールデム(Texas hold'em)」で、理論上絶対に負けないコンピュータープログラムを開発したとする研究論文が、8日の米科学誌サイエンス(Science)に掲載された。

 論文の主執筆者、カナダ・アルバータ大学(University of Alberta)のマイケル・ボーリング(Michael Bowling)氏はAFPの取材に、研究チームは2003年より「現在の超一流プレーヤーに負けない、またどんな戦略にも負けない、完璧なプレーヤーを作り出すこと」を目標に掲げてきたと語る。

 研究チームは2008年、ポラリス(Polaris)と呼ばれる最初のポーカー実行プログラムを完成させた。ポラリスは、2人のプレーヤー勝負のホールデムで人間の一流プレイヤーに勝つことができた。「この時点で、コンピューターはこの形式のポーカーでは全ての人間より強いプレーヤーとしての地位を確立した」とボーリング氏は言う。

 ポラリスがポーカーで人間に勝てることが判明した後、「論理上の次なるステップは(このゲームを)解くことができるかの検討だった」と同氏は続けた。4800個の中央演算処理装置(CPU)群がゲームを解決するための計算を開始した。
「本質的にゲームを解決するという目標に到達するのに2か月あまりの計算を要した」と同氏は話す。

 結果は、世界中でプレーされている最も人気の高い形式のポーカーがこれで「本質的に弱解決する」というものだった。
これは、人間が一生分プレーしても、統計的有意性を持って打ち負かすのは不可能であることを意味する。

 ボーリング氏は、電子メール取材に対し「ゲームを解決する完全な戦略の算出を目指したが、われわれの戦略はゲームを本質的に解決するものにとどまった。これはつまり、戦略がほぼ完璧であるため(人間が一生涯にプレーできるゲーム数に近い)6000万回プレーした後でも、負ける可能性が運によるものか否かさえも区別できないほど非常に小さいことを意味する」と説明した。

■コンピューター対人間

 ゲームで人間を打ち負かしたコンピューターとしては、ポーカーの他にも1994年にボードゲーム「チェッカー」の世界選手権で初めて人間を破ったプログラム「チヌーク(Chinook)」や、1997年に当時のチェス世界チャンピオン、ガルリ・カスパロフ(Garry Kasparov)氏に勝った「ディープ・ブルー(Deep Blue)」などがある。米コンピューター大手IBMが開発した高性能コンピューター「ワトソン(Watson)」は2011年、米国のクイズ番組「ジョパディ!(Jeopardy !)」で優勝した。
だがポーカーのテキサス・ホールデムは、特に難題であることが判明していた。プレーヤーが2人だけでも、どのカードがすでに相手の手札に入っているかなどの未知の情報が大量にあるからだ。

続きはソースで

(c)AFP/Kerry SHERIDAN

<画像>
テーブルを囲んで行われる「テキサス・ホールデム」。仏領コルシカ島で(2007年2月撮影、資料写真)。(c)AFP/STEPHAN AGOSTINI
http://afpbb.ismcdn.jp/mwimgs/0/2/1024x/img_022ebfab1a6d719e34bf0d62b5827fb6184463.jpg

<参照>
Science - Heads-up limit hold’em poker is solved
http://www.sciencemag.org/content/347/6218/145

<記事掲載元>
http://www.afpbb.com/articles/-/3036040

引用元: 【IT/ゲーム理論】無敵のポーカー・プログラム完成、カナダ研究

スポンサーリンク
2: 2015/01/11(日) 22:28:26.82 ID:yASJmtdk.net
論理と心理の狭間が割り切れるという説明

3: 2015/01/11(日) 22:34:32.48 ID:G4ulDx5h.net
で、そのプログラムどうして対戦したら 両方負けることがないと?
引き分けってポーカーにあるの?

4: 2015/01/11(日) 22:37:01.51 ID:G4ulDx5h.net
ちょっ これやたら重要なやつじゃん
「不完全情報ゲーム」の2者対戦における最適解なの?

ゲーム解決への挑戦は、現代社会に進歩をもたらす助けになるかもしれない。ボーリング氏によると、空港検問所の
保安体制の強化、沿岸警備パトロールの向上、医療上の決定の改善などに役立つ可能性があるという。

マジだとすると、このアルゴを理解できれば相当有利になれるのか?

5: 2015/01/11(日) 22:46:30.30 ID:yASJmtdk.net
>>4
戦略そのものの統計を元にしたアルゴリズムは統計に沿わないものには無力である。
神のアルゴリズムであっても、次に配られる手配を支配できないかぎり運に支配される。
勝とうとするアルゴリズムは負ける戦略をしない。

負けない戦略と勝つ戦略で戦うとき、勝つ戦略で負けない戦略を倒すのはムリゲー。

17: 2015/01/11(日) 23:27:40.76 ID:MKMZyUCU.net
>>4
不完全情報ゲームの解法の統一理論じゃないでしょ。

6: 2015/01/11(日) 22:46:41.80 ID:27r6j11G.net
絶対勝てない麻雀ゲームならあったな。

8: 2015/01/11(日) 23:00:39.90 ID:eiIA2/DY.net
このコンピュータ―プログラムどうしなら
前者と後者のどちらが勝の?

29: 2015/01/12(月) 07:42:50.94 ID:xZxtkdSi.net
>>8
回数を重ねるほど五分の成績になる。

9: 2015/01/11(日) 23:00:58.00 ID:fzDTGtyc.net
つーか何をもって無敵というんだ?
ポーカーなんて一回勝負なら役がそろわなくて負けることもあるだろ
何千万回もやれば必ず勝ち越すとかそういうこと?

12: 2015/01/11(日) 23:11:45.12 ID:h4ZixQ9G.net
>>9
統計的に見て勝ち越す、だから収支とは別問題。

20: 2015/01/11(日) 23:56:39.22 ID:yzigMGRV.net
>>9
精神と時の部屋に入って自分自身と何万年分の修行を積んできた、俺Tueee!!!!

ってことをコンピュータがやったってことでしょ。

そのタイプの俺とは千年前にやったことがあるから最善手が分かってるぞ!
てな感じ

10: 2015/01/11(日) 23:02:01.98 ID:XL2RE+fa.net
捨てられたカードから、確率的に相手の手札の強さが分かるってことかね
カジノって瞬間記憶みたいな人がカード全部覚えるのはイカサマ扱いなんだろ。

11: 2015/01/11(日) 23:08:25.41 ID:yASJmtdk.net
>>10
>捨てられたカードから
捨てたカードで敵の戦略を縛るのも戦略である。

14: 2015/01/11(日) 23:23:52.40 ID:p6bwAKvC.net
最も期待値の高い選択を選び続けることで、負けることがない。
相手が間違った選択をすることで、勝てる。

同じプログラムでお互い最適な選択をすれば5分の勝負。
人間でもプロは、完全ではないけど、期待値の高い選択をし続けている。

15: 2015/01/11(日) 23:25:16.02 ID:G4ulDx5h.net
>「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という
後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、
自分自身と対戦することで最適戦略を学習。2カ月にわたって、
秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。

16: 2015/01/11(日) 23:26:26.02 ID:G4ulDx5h.net

21: 2015/01/12(月) 00:22:59.67 ID:+RfcajcF.net
将棋のCPUトーナメントみたいにポーカーでもそういうのやればいいのに
それで殿堂入り出来るくらい優勝したら実力認められる

つってもこれリミット・ホールデムの話だからな
今メジャーになってるノーリミット・ホールデムはまだ解けてない
リミットとノーリミットの違いは賭け額が決まってるか決まってないかの違い
大ざっぱに説明すると
リミットは賭けられる額が決まってるがノーリミットは自由、いきなり全額賭けても問題ない
逆に言うとリミットは最初から全額賭けるみたいなことは不可能
リミットとノーリミットは人間レベルでも戦略が違ってるので
ノーリミット解けるのはまだまだ先、そこまでいかないと使いものにはならんだろリミットとかマイナーだし
個人的にはオマハ解けるぐらいになったら大変素晴らしいと思うがそれは当分先だな…w

22: 2015/01/12(月) 02:23:13.32 ID:UMXntrkM.net
人間には「ルール変更」と云う大技があるわな。

23: 2015/01/12(月) 03:48:13.16 ID:dFxMhv3r.net
>>1
言っとくけど、カードカウンティングは、カジノでやったら、ルール違反

48: 2015/01/12(月) 16:05:00.12 ID:DVXsspTn.net
>>23
カードカウンティング禁止なんて、表面上のルールじゃん。
してるしてないは証明できないし。
全くしないで勝負してたら、ポーカーがおもしろくなくなる。
店はシャッフルを早くするとかで対応するのみ。
勝ってるからと追い出したら店に傷がつく。

49: 2015/01/12(月) 16:09:07.19 ID:DVXsspTn.net
>>23
そもそも、ポーカーのカードカウンティングを禁止してるかね?
ブラックジャックならまだしも。
ポーカーでカードカウンティングを止めたら糞おもしろくないぞ。

24: 2015/01/12(月) 03:55:33.65 ID:Ko58y1hJ.net
>>1(人間が一生涯にプレーできるゲーム数に近い)6000万回プレーした後

80年生きるとして、1ゲーム42秒。そこまで積み重ねないといけないなんてただの地獄です

28: 2015/01/12(月) 07:26:32.38 ID:qfA73ZkY.net
>>24
おまえ、アホだなw

25: 2015/01/12(月) 04:03:10.79 ID:n/r7WGzP.net
ポーカーの面白いのは、プレーヤー同士の駆け引きなのに・・・

26: 2015/01/12(月) 04:13:30.78 ID:By256xVa.net
これ対人で常時勝利してないだろ。プログラムvsプログラムじゃ勝負とはいえない

27: 2015/01/12(月) 05:48:36.81 ID:xNk+unqJ.net
ほぅ無敵なのか
戦わなければ負けないから駄目だな

30: 2015/01/12(月) 07:44:48.82 ID:xZxtkdSi.net
麻雀でこういうの研究されてるのかな?

37: 2015/01/12(月) 09:29:22.24 ID:+RfcajcF.net
>>30
麻雀は選択肢多すぎて難しいんじゃないか?
将棋でさえ解けてないのにそれと比べものにならないくらい組み合わせが多いし
振り込まないプログラムを作るのはまだ楽かもしれんけど常時勝てるようにするのはかなり難しそう

31: 2015/01/12(月) 07:56:12.21 ID:8YA12k1C.net
競争原理を超えてより共存の方向へ舵がきれるとよいね

33: 2015/01/12(月) 08:12:24.52 ID:XthjqguV.net
無限のゲームで統計戦略が必勝なのは当然
短期戦では運で勝敗が決まるからゲームになる
言わんでもわかることだろ

36: 2015/01/12(月) 08:44:02.37 ID:wG0KNXlT.net
囲碁ではモンテカルロ法が当たり前の昨今、完全情報も不完全情報もねーって

38: 2015/01/12(月) 10:41:04.89 ID:JzbKTtng.net
将棋とこれや麻雀とでは、全然考え方が違うぞ。
これは統計戦略で、かつ、例えばブラックジャックのカードカウンティング等も
併用した明らかな合理性による計算を使ってる可能性が高い。
それが主たるロジックなら簡単だよ、少なくとも将棋よりはね。

ただし、PC上でやるならともかく、BJのカードカウンティングと違って
さすがに複雑だし、現場でやるのは難しいだろうけど。

39: 2015/01/12(月) 11:03:33.13 ID:wG0KNXlT.net
>>38
モンテカルロ法も知らないって、馬鹿なの?

40: 2015/01/12(月) 11:06:01.88 ID:JzbKTtng.net
>>39
> モンテカルロ法も知らないって、馬鹿なの?
知ってるよ、馬鹿w
お前はブラックジャックすら知らんようだがw

43: 2015/01/12(月) 12:24:32.27 ID:wG0KNXlT.net
>>40
「これは統計戦略で」って言うあたり、囲碁とかでのモンテカルロ法のこと何も知らないことは、
ばればれなんだけど?

46: 2015/01/12(月) 15:22:09.32 ID:JzbKTtng.net
>>43
> 「これは統計戦略で」って言うあたり、囲碁とかでの
馬鹿すぎるw お前小学生かw
これが統計戦略であることと、最近の囲碁プログラムが
モンテカルロ法を使ってることとは何の関係もないんだがw

なんで囲碁がモンテカルロ法をやっていたら、
これが統計戦略やその応用でやってることにならないんだ、お前池沼か?

54: 2015/01/12(月) 17:16:15.36 ID:wG0KNXlT.net
>>46
>これが統計戦略であることと、最近の囲碁プログラムが
>モンテカルロ法を使ってることとは何の関係もないんだがw

UCTとか統計戦略そのままなのに、そこまで無知を曝け出さなくても、、、

44: 2015/01/12(月) 12:35:34.81 ID:Pz5ExZH/.net
負けそうになったら電源ブチーで。

32: 2015/01/12(月) 08:06:59.65 ID:+OunYY73.net
医者「この手術は一種の賭けです。コンピューターに選択させましょう」
アメフト監督「これはギャンブルプレイだ。コンピューターにまかせる」
会社役員「会社経営なんて宝くじみたいなもの。コンピューターに聞くのが一番」
2ch民「人生ゲームがすべて教えてくれた」