りあるふぁいとぷろぐらまー

IT系の技術ネタと格闘技(ブラジリアン柔術)ネタを徒然なるままに綴る予定。

DeepLearningも競馬もど素人だけど、TensorFlowで高松宮記念を予想してみる(結果、惨敗)

1年以上ぶりのブログ更新です

最近、金欠気味です(笑)

手っ取り早く稼ぐにはギャンブルでしょう。ということで、競馬に手を出します(競馬ど素人ですが)。

ただ予想するのも芸がないので、 以前TensorFlowで作った競馬予想の学習器を使って予想してみます。

その時の記事はこちら rfp.hatenablog.com

こいつを使って、2018/03/25(日)の高松宮記念の着順予想をしてみます。 (このエントリを書いているときは2018/03/24です。どうなるのでしょう?)

結論から

ダイアナヘイロー、ダンスディレクターあたりが有力らしい

2018/03/24(土)時点で

ダイアナヘイローは12番人気 ダンスディレクターは4番人気 です。

不安しかありません。

どうやったの?

前回のブログに書いてますが、補足も含めて、ちょっと詳しく書きます。

1. データ収集

http://race.netkeiba.com/ から高松宮記念に出走する競走馬(全18頭)のデータをスクレイピングで取得しました

db.netkeiba.com

収集したのは過去のレース記録です。

f:id:RealFightProgrammer:20180324223623p:plain

2. 特徴量抽出?

スクレイピングで取得した出走馬の過去レースデータで使用する特徴量は次の15個にしました これらの特徴量を使って、順位を予想してみます。

  • 日付
  • 開催
  • 天気
  • R
  • レース名
  • 頭数
  • 枠番
  • 馬番
  • オッズ
  • 人気
  • 騎手
  • 斤量
  • 距離
  • 馬場
  • 馬体重

3. モデル式

シンプルな重回帰分析を使用します

本当はいろんなモデル式を試してみたいですが、それは追々。

https://www.tensorflow.org/api_docs/python/tf/matmul

結果

1着:ダイアナヘイロー(12番人気) 2着:ダンスディレクター(4番人気) 3着:レーヌミノル(7番人気)

(人気は2018/03/24(土)時点)

予想してみたが、、、

当たる気が全くしない。

  • レースデータが少ない
  • 特徴量15個は少ない?
  • 血統や騎手との相性などの関係性?の考慮ができてない

etc

難しい。

とりあえず、明日ウインズ新宿(場外馬券場)に行くだけ行ってみようかな。

[2018/03/25 追記]

結果はファインニードルが勝利

ダイアナヘイローは18着(最下位) ダンスディレクター(4着) レーヌミノル(7着)

素人がしゃしゃりでました。すいません。 しかし、懲りてはないので、機会があればリベンジしたいと思います。