競艇AI予想と回収率を公開しました

2020年7月25日人工知能, 機械学習, 競艇

こんな人にオススメ!

・競艇と機械学習に興味がある人
・AI(人工知能)で競艇予想を見たい(したい)人
・AI予想の的中率や回収率を詳細に知りたい人

はじめに

艇ラボを開設しました

世の中様々な人工知能(AI )が誕生しています。機械学習(AIの重要な要素)を勉強し始めた時から、絶対こいつを使って競艇予想してやる、そして不労所得でがっぽりだ! と思っていましたが、気がつけばインターネットには公営ギャンブルAIの先駆者で溢れています。

先を越されたなと思いながらも、ようやく機械学習による競艇予想を試してみましたが、競艇予想ってめちゃくちゃ難しい。そして思うんです。

回収率100%を超えたってホントかよ!!

だからその詳細を公開することにしました!

的中率と回収率、そして機械学習モデルにおける評価値などなど。まだ準備段階ですが、まとめ次第適宜公開していきます。

本サイトはそんな透明性の高い、こんな前提でこう検証したらこうなりました、といった形式で、プロの人たちに馬鹿にされないようビクビクしながらも情報を赤裸々に公開することを目指します笑!

ポイント!

・競艇AIの回収率、的中率、機械学習モデル性能を全て公開します

AI予想は儲かるのか?

儲かる可能性が高い!

結論から言うと、儲かると思います。しかし、現状本サイトの平均回収率は単勝で98%・二連単で85%程度です。

平均的には下回っているのになぜ可能であると言うのかというと、もう少し掘り下げた日別や競艇場別では回収率100%を越えるものがあるからです。

赤丸の箇所は、単勝or二連単で2ヶ月間の集計で回収率100%超え

さらに、現在の回収率シミュレートでは単勝1.1倍等の低配当も全て買った結果です。そのオッズでは9回当たっても1回外せばとんとんとなるので、全然美味くありません。

つまり、そんな全部を買わないで、買い方さえ工夫すれば回収率100%を超えることは可能である!、という事なんです。

ポイント!

・競艇AIは儲かる見込みが高い!
・本サイトの現状は単勝で98%・二連単で85%程度

AI(人工知能)について

AI(人工知能)という言葉はとても広い意味を持っており、未だ明確な定義はありません。

東大の松尾教授は

人工的につくられた人間のような知能、ないしはそれをつくる技術

と言っていますし、京大の長尾教授は

人間の頭脳活動を極限までシミュレートするシステム

と言っています。

曖昧な言葉なのでとりあえず言っときゃ話題性もあるしなんかすごいっしょ感ありますよね。自分もサイトのタイトルに使っているので人のこと言えませんが…。

競艇AI予想とは

競艇の機械学習モデル概念図
競艇の機械学習予測モデル概念図

ここで使う競艇AIという言葉は、機械学習アルゴリズムを使って過去の競艇データを学習した予測モデル(もしくはそれらを組み合わせたモデル)を指します。

何か万能に判断できるAIが競艇を予想するのではなく、過去の競艇データを使ってある目的に応じて学習し、得られた過去データの特徴を使って未知のデータから結果を予測します。

学習と予測について

AI予想の具体的な中身は、どう学習させるのか、と深く関係します。

単に「二連単予想」をするとしても、そのアプローチ(どう学習させるか)はいくつかあります。

  • 1-2〜6-5までの30通りでどれが来るかを学習させる。その場合、1レースの予想結果はどれかひとつ
  • 二連単(2-1)が来るか来ないかを学習させる。の場合、二連単の組み合わせ30通りのモデルができ、それらを組み合わせて予想。
  • 一着と二着が何号艇かをそれぞれ学習し、組み合わせて二連単を予想。

本サイトのモデル条件や精度等についてはまた別で紹介します。

学習データ

学習させるデータについて、当たり前ですが過去のレース情報を使います。

データは目的に応じて使い分けるというのではなく、機械学習アルゴリズムが目的に応じた学習を行いそのデータの中から特徴を発見するので、競艇の様々な何かを予測させるのに、基本的には同じデータを使います。

ただ、本番のレースを予想するのに同じ種類のデータを使うわけですから、当然、そのデータは本番予想時に得られるデータでなければなりません。

なので、学習時に締切後オッズや本番進入コース等が入っていたのでは、当然本番前にその情報は入手できないわけですから、全うな予測には成り得ません。

(ただ、オッズや進入コースも機械学習で予測しちゃってそれを入力にする方法はあります※スタッキングというアンサンブル学習の手法です)

全うな予測にならないというのは、モデルを作った時の性能と実際に運用した時の性能にかなりのギャップが出てしまう、という意味です。

学習時は確定オッズを学習して、運用時はオッズ確定30分前の情報を使う、みたいな場合もギャップが生まれるはずです。

学習データを作る際は、そういった運用時と同じ条件で得られるデータを使うように気をつけなければなりません。

本サイトのAIの特徴

まず、現状は的中率ベースの予測です。単勝ベースで一号艇を全て買った場合の比較もプロットしていますが、的中率は平均5%増しってところでしょう。

ただこれらの予測値は全て当日の朝に算出しており、

当日のデータは全て使っていません!

天気、気温、風速、オッズ、展示などです。

それでもある部分においては回収率を100%上回っているわけですから、何とかなる気がしています。

シミュレート値は、当然学習している期間より未来のデータで予測しているので、これは当日に出力しているAIの結果(例えばココ)とイコールです。

勿論、展示や気温など本番情報を含めた方が精度の高い予想ができるはずです。

今後の課題ではありますが、そんな締切時間前になって別々に何回も買うわけにはいかないので(勿論時間が許せばそうしたいが)、やはり朝に予想して一括でどん!って買って儲かるのが、目指したいところではあります。

ポイント!

・競艇AIとは、機械学習モデルである
・本サイトのAIは、的中率ベースのモデルである
・本サイトのAI予測は、当日に得られるデータは使用していない

今後について

要は、現段階でAI性能ってこんなもんですよ、回収率をばか高く公開しているのはホントですか?、って事を示す上での一種の指標となるサイトを目指していきたいと思います。

勿論回収率を高めていくように、的中率ベースではなく色々試しながら精度向上をはかります。三連単もまだ組み込めていないので組み込みます。

合わせて、今公開している各レース毎の統計値なども分かりやすいように整理し(多分現状だと自分にしか分からない…)、公開していければなあと考えています。

ぐだぐだと色々述べてきましたが、本サイトをどうぞよろしくお願いいたします。m(_ _)m

2020年7月25日人工知能, 機械学習, 競艇