データ予想の闇、落し穴。見極めるための知識。

競馬専門紙 馬券のコツ
この記事は約5分で読めます。

こんにちは。競馬有料予想界のクリーン化を目指すジャンヌです。

予想法の一つにデータ予想があります。

どこからどこまでをデータ予想と言うかは決まってないですが、そのレースの過去10年程度の実績から傾向を出す方法がメジャーですね。

まとめ

  • 私はデータ予想家はだいたい信じてない
  • ただし、稀に本物がいるのでしっかり見極めたい
  • データ予想家の取捨は、「なぜ?」を追いかけているかどうか。

詳細

突然ですがいきなり問題を出すので考えてください。データ予想のセンスを試す問題ですので実際考えてみてください。

・東京駅で40代男性の太郎くんがサイコロを10回振りました。結果は1-1-5-4-5-6-2-1-4-1
・大阪駅で20代男性の賢一くんがサイコロを10回振りました。結果は2-1-2-5-2-1-6-1-4-2

さて問題です。
40代の晋三くんが大阪駅で一回サイコロを振りますので、何が出るかを予想してください。
(当然ですがサイコロも振り方も通常です。)

正解は、1ですね!

40代実績では10回中4回1が出てます。大阪駅実績でも10回中3回1が出てます。
よって40代の晋三くんが大阪駅で振った場合は 1 になる可能性が極めて高いでしょう。
また、3は死に番なので消しですね!

どうですか?これがデータ予想なんです。

「これがデータ予想なんです」と言われると

え???

と思いませんか?
直感的にイケてないデータ予想のことをご理解頂けたと思います。
平気でこんな事をデータ予想と言ってるのが多いですから。
競馬情報サイトのコラムなら問題なく理解できます。読み物だし、あ~そうなんだと思って読むと楽しい。

ただ、これを予想家の予想だと言われちゃうとね・・・

本当の正解は、
正解はありません
です。

40代が大阪駅でサイコロを振っても、1が出る確率は6分の1ですよね。これはサイコロを振る行為が独立試行といって、過去の出目と今回の出目に因果関係、相関関係がないからです。

つまり、過去の実績は役に立たない。
役に立たないと表現するとネガティブなバイアスが掛かるのでちゃんと言うと、プラスに作用することもないし、マイナスに作用することもない。影響はゼロです。

別の例で言うと、宝くじのナンバーズの出目を一生懸命当ててる人がいますが、あれと同じくらい意味のない行為です。(楽しみでされてる方を否定する意図はありません。あくまでも合理性の話で。)

これと同じレベルのデータ予想を提供してるサイトが多すぎて腹も立ってくるんですけどね。
データの提供は全く問題ないです。過去の記録、事実です。

問題は因果関係も何もないデータを元に将来を予言し、予想と呼ぶことです。

例えば枠順。

このレースに強い枠順は8枠です。
だから8枠を軸にしました。これって予想ですかね?

脚質、馬齢、前走などなど、データと呼べるものはたくさんありますが、要は組み合わせに過ぎないのでシンプルに考察します。

宝塚記念、10年分の枠別データ

上記は春のグランプリ宝塚記念、10年分の枠順データです。
8枠から10年中6年で優勝馬が出ており、ダントツです。
なので8枠の馬を軸にすることをオススメします。3枠は割引が必要ですね。

…..?

ホントですかね?8面のサイコロ振ってたまたま8が連続で出ただけじゃないっすか??
むしろ今年は違う数字が出るんじゃないですか?
どっちですか?

答えは『有効なデータかも知れないし無効なデータかも知れない』『自分で考える』ってことです。

考えた結果が重要なのではなく、考えるプロセスと自分なりの仮説が大切なんです。
数字に疑問をもってもう一段階深堀りする。
これをやって初めてデータ予想と言えるのではないでしょうか。

結論を先に書いちゃうと、阪神2200メートルは枠の有利不利が比較的少ないコースです。
コース形態をちゃんと見ればわかります。少なくとも予想家を名乗っているのであればそこは見なければいけない。偶然の偏りの可能性が極めて高いです。

逆に、枠順が大きな影響を与えるコースもあります。
ジャパンカップ・ダービーが行われる東京2400、有馬記念の行われる中山2500などは、かなり内枠有利になります。
なので、それらのコースでは枠の実績が重要なファクターになります。
さらにもう一段階掘り下げるのであれば、オッズとの関係も見ないといけない。
つまり東京2400内枠有利なんて誰でも知っている事実ですからオッズに反映されちゃってて、期待値的な狙い目はむしろ外かも知れない。

ここまで掘り下げてデータ予想と初めて言えると思いますね。

気になったんで宝塚記念実際に見ておきましょう。

19年 8枠リスグラシュー
18年 2枠ミッキーロケット(8枠キセキ2番人気で凡走)
17年 8枠サトノクラウン(8枠キタサンブラックが断トツ1番人気凡走)
16年 8枠マリアライト
15年 8枠ラブリーデイ(8枠ゴールドシップが断トツ1番人気凡走 )
14年 8枠ゴールドシップ
13年 8枠ゴールドシップ
12年 6枠オルフェーヴル
11年 1枠アーネストリー
10年 8枠ナカヤマフェスタ

ホントの細かい分析はラップとか見たいところですが、優勝馬の名前を上げただけでもある仮説が出てきますね。
8枠が有利なんじゃなくて、強い馬が8枠に入っただけなんじゃないか。
若干違和感があるのはナカヤマフェスタくらいですが、ナカヤマフェスタはタフな馬場の鬼でしたからね。不当に人気が低かったとも言えますね。
リスグラシューが2枠に入っていても、ゴールドシップが2枠に入っていても、勝ってたんじゃないですかね。
そうなるとエセデータ予想家は『宝塚記念は2枠だ!』と言い出すのでしょう。

これがデータ予想の落とし穴です。データには『有用なデータ』と『単なるノイズや偶然の偏り』の2種類がある。どちらか見分ける必要があるということですね。
深堀りの程度はありますが、ちょっと見たら分かる範囲くらいは見る癖をつけることです。

『なぜ???』

常に自分が納得できる理由を探すことが予想力を上げるにはとても大切なことです。

最後に

データ予想で大切なのは、数字で終わっちゃうことなく
『なぜその数字になるのか』
『根拠や相関はあるのか』

と疑問を持って掘り下げ、自分なりに納得することです。

それをやってない予想家はエセ予想家
他の人の予想を参考にする場合は、本当のデータ予想家か、エセ予想家か、見極めることが大切です。

コメント

タイトルとURLをコピーしました