【麻雀】データ研究者の悩み
データ研究者も、ガチになってくると、「条件を決めて数字だけ出しておしまい」みたいな世界じゃなくなる。
数値に表れてこない条件はあるかとか、ありとあらゆる可能性を考えて、最終的な数値にすべてをかけて戦ってる人たちだ。
北HAZさんの牌譜解析結果、nisiさんのシミュレータのはじき出した結果、過去の私のシミュレータ(凸理論)結果から導き出される判断が一致し、今回やった私の天鳳牌譜解析結果(から導出された結果)がおかしいという状況なう。ダマクソ待ちの見積もりが変なのかな・・・。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
今回私が求めた牌譜解析と北HAZさんの牌譜解析結果、どっちを信用するかとなったら北HAZさんなのだろうと思う。しかし、そうなると、今回集めたダマ関係の集め方の条件に瑕疵があるということになる。しかし、北HAZさんの方にケチを付けようと思えば、十分付けられる。うーむー。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
そもそも、ここで取り扱う話は、シミュレータ作って解決するつもりだったからなあ。牌譜解析結果からどうこう言うつもりはなかった分、やっかいだなあ。「どっちの結論を採用するか」はさておき、そのロジックと逆の結論に対するフォローができないと主張にならん。いや、別に主張にはなるのか。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
私の牌譜解析に瑕疵があるとは「最終形だけが牌譜解析の対象となっていて、最終形ではない形が牌譜解析から除かれている」というもの。つまり、途中でベタオリしたデータが除外されているが、それは集計されたデータはリーチとかを食らって危険牌を引いた場合が除外されている可能性が高い。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
その結果、「私のダマ(擬似ダマと言うべきか)の牌譜解析結果はダマ有利に見積もられている」ということになる。「最終形ではない手牌も入れて牌譜解析すれば、ダマの有利さがもっと減らされるはず。」というのが、私の牌譜解析に対する批判になる。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
次に、nisiシミュレーションや私のシミュレーションに対する批判は何か、というと、「天鳳をパラメータに使ってない」という批判が真っ先に考えられる。無論、その批判は「意味のない批判」として批判に値しないが、その点は確認しておくべきである。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
もっとも、東風荘と天鳳の違いを考えると、それがあまりに重大な瑕疵になるとも思えない。となると、nisiシミュレーションの信用性を崩すことは難しそうである。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
最後に、北HAZさんの牌譜解析結果に対して批判するなら、「リーチが選択的になされている」ということになるのかな・・・。ただ、あるときは「この結果は『リーチが選択的になされている』」と批判し、あるときは「そうではない」と批判しないのは、あまりに都合がよすぎる気がする。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
こういう場合、私の希望を押し通すなら、両論併記したいのだが、今回の本ではそれはできないだろうな・・・。まあ、私一人が悩んでいてもしょうがないので、福地先生に相談することにしよう。
— みーにんぐれっす♪ (@Return_Nothing) 2015, 2月 25
どの世界もね、形式だけじゃなく、その中でベストの選択をしようとしてると、しんどくなる。
麻雀のデータ研究は、経済的な見返りがあるわけでもないし、注目度が高いわけでもない。
日本に数人しかいない研究者の方々の多くが、限られた期間に出すべき結果を出したら、そこでこんな「趣味」は切り上げようって思ってるのが実際だからなぁ。
麻雀のデータ研究ってもんが、この先もあるかといったら、そんな保証は全然なくて、むしろ、今だけ!って熱意によって支えられているという現状。
これは未来につながるものなのか、今を残すためのものなのか?
| 固定リンク
コメント
みーにんさんは統計やデータを扱うような仕事をされているんでしょうか?
投稿: | 2015年2月26日 (木) 09時43分
>ななしさん
全然関係ないす。
投稿: 福地 | 2015年2月26日 (木) 09時55分
天鳳クラスターがメイン読者層なんだから、さぼっていないで天鳳のパラメータを使いなさい。現状分かっているのはリーチに対して少し堅くなるだけというものだから、期待値的には数十点とか糞みたいな差しかないけと思うけどね。でも、データ出所が東風荘、というのを見ると違和感ありまくりなんだよね
少なくとも、各種指標の比較と、結果に与える影響がこんなに小さい、といったことを説明するページはほしいね
投稿: | 2015年2月26日 (木) 10時06分
あと、読者の99%はシミュレーションとか言われてもチンプンカンプンな人たちだと思われるので、図表つきで分かりやすく説明した方がいいんじゃないかな。
投稿: | 2015年2月26日 (木) 10時20分
読者の5割が天鳳民だとしても
天鳳ルールで解析した結果で麻雀はこれが正しいってのは違和感がある
本に載せれないデータなどは福地先生のブログかみーにんブログあたりに解説出してくれたらそれでいい
今回のツイートも見てなかったらそのままデータを信じてしまうとこだし
データをどう出したのかっていうのは近代麻雀のおまけみたいに本に書いて欲しい
数十点の差でもその差がなぜ起こるのかどういうデータなのかってのがわかればそれを基準にどうするかってのを決めることができる
おまけの時みたいに変にわかりやすくするよりも
専門書みたいに難しくても細かいデータがのってたほうがいい
竹書房でそれを作るのが難しいのなら第2段は洋泉社からだしてほしい
内容を読み取ることができない人ほど本を買ってくれるのはわかるがデジタル信者としては詳しいほどありがたり
投稿: | 2015年2月26日 (木) 11時12分
そんな売れなさそうな本はどの出版社からも出せませんw
投稿: | 2015年2月26日 (木) 11時34分
某プロとの喧嘩は一応終息した感じですかね?
投稿: | 2015年2月26日 (木) 11時48分
やっぱり麻雀はいいね。ゲームだから比較的単純だし、エッジがどこかも見えやすい
投稿: | 2015年2月26日 (木) 11時50分
とつげき東北も出だしの頃は叩かれた。みーにんも今が出だし。
よって河野プロと対局お願いします(*^^*)
投稿: | 2015年2月26日 (木) 13時38分
「リーチかダマか」「面前続行か副露テンパイ取るか」っていうのは最終形や最終形付近じゃなくて、それ以前の手組みの段階でそれっぽい挙動になるのが自然だよね。そうして得られた最終形は「予めどちらを選択するか概ね決まっている」となりやすい。それが一見バイアス無くデータ収集しているのにバイアスとなってしまうことに自ずと気づいていらっしゃると。
もっと言えば局面や点棒状況や配牌だけで「やや狭い役有りテンパイorオリ志向」か「面前ブクブクmax志向」かって決まる場合もある。
たとえそういう懸念があったとしても、研究者が「そのような危険性をしっかり把握している」だけで全然違うと思うよ。利用者側としても、貴重なデータ入りの麻雀本を本当の意味で有効に使うというのはそういうことだと思うよ。
そして福地さんと組む場合は注意が必要だろうね。即効性やキャッチー・ワンフレーズ打法といった、とにかく「読者にとっての分かりやすさ」を追求する立場に居るわけだから。
投稿: | 2015年2月27日 (金) 08時37分