# プロ野球のお話〜来年こそ巨人は優勝出来るのか〜 ###### tags: `雑記` ### 前書き 【この記事は[ミクシィ19新卒 Advent Calendar 2018](https://adventar.org/calendars/3576)の9日目です】 前回の記事はこちらです! http://kohei-mkt.hatenablog.jp/entry/2018/12/08/000014 他の人がエンジニアらしい記事は書いてくれてると思うので私は自分の好きな事を書こうと思います。 私は野球が好きで特に巨人ファンです。丁度先月末に広島の丸選手がFAという制度で巨人に移籍が決定しました。折角なのでこれを受けての来年のプロ野球の予想、考察が出来れば思います。 ### 勝率予測 野球は試合終了時に相手より多く点を取ったチームが勝つスポーツです。よってチームの総得点数と総失点数が非常に意味を持ちピタゴラス勝率と呼ばれる以下の式で勝率を予測する事が出来ます。 $$ ピタゴラス勝率P=\frac{得点^2}{得点^2+失点^2}$$ この式から直感的に読み取れることとして - 得点が増えると勝率は上がる - 失点が増えると勝率は下がる - 得点=失点の時勝率は50% 方針としては間違っていなそうです。 この「2乗」の指数に関してはスポーツやリーグ等環境によって異なる為以下の公式から求めるのがいい様です。(数学的にこの公式が用いられる理由はよくわかりませんでした...) $$指数=(\frac{得点+失点}{試合数})^{0.2856}$$ ### 得点と各種指標の相関 前項で得点、失点が求められれば勝率が予測出来そうな事が分かりました。 具体的にチームの得点を予測する為に選手個人の能力、その合計である指標について考えてみます。 得点に最も相関が高い指標としては以下の指標があります。 - RC(単純に言えば$\frac{出塁能力×進塁能力}{出塁機会}$、公式は以下の通り) - A = 安打 + 四球 + 死球 - 盗塁死 - 併殺打 - B = 塁打 + 0.26 ×(四球 + 死球) + 0.53 ×(犠飛 + 犠打) + 0.64 × 盗塁 - 0.03 × 三振 - C = 打数 + 四球 + 死球 + 犠飛 + 犠打 $${RC=\left({\frac {(A+2.4C)\;(B+3C)}{9C}}\right)-0.9C}$$ - GPA(出塁率*1.8+長打率) - OPS(出塁率+長打率) 過去10年分のNPBのデータからそれぞれの指標について平均得点の相関を調べてみたところ以下の結果になりました。(参考:[NPB(日本プロ野球機構)](http://npb.jp/)の公式データ) - RC ![](https://i.imgur.com/2ITm8ep.png =400x320) - GPA ![](https://i.imgur.com/Sv981e4.png =400x320) - OPS ![](https://i.imgur.com/vA1eNqm.png =400x320) 個人的な感想としては打撃指標と走塁指標から理論的に求められたRCの相関係数が一番高いのはともかく、単純な指標でありながらOPSの相関係数がRCとほぼ変わらない値を出している事に驚きました。(何ならOPSを改良して出塁率を重視したGPAより値が良いという結果) この結果からOPSから得点を算出することは妥当だと言えるんじゃないでしょうか。 ### 仮定に仮定を重ねた来シーズン予想 ここから仮定していいのか分からない所を全部仮定しますという一言で片付けます、統計にほとんど触れた事がないので詳しい方にはすみません。 冒頭で触れた丸選手、丸選手以外の広島の選手、巨人の選手について全員来年も同じ成績を残す、丸選手が今シーズンと同じ打席数だけ出場すると仮定すると来年の巨人、広島のOPSは以下の様な結果になります。 ![](https://i.imgur.com/fXgEmuL.png =140x180) 一人の選手の差でOPSの値が逆転する程丸選手の突出度が分かりますね。 このOPSの値から前項の近似式で広島、巨人の得点を求めると以下の結果になります。 $$広島の平均得点 = \frac{12.855× 0.7493(OPS) -5.067}{143(試合数)} = 4.56$$$$巨人の平均得点 = \frac{12.855× 0.7605(OPS) -5.067}{143(試合数)} = 4.71 $$ 失点については全選手が今年と同じ成績を残すと仮定して今シーズンの 広島の平均失点:4.10 巨人の平均失点:3.76の値を用いて前項の勝率の計算式に代入してみます。 (本来は丸選手に巨人が打たれていた分失点が減るとは思いますがここでは考慮しません) $$R_c = (4.56(得点)+4.10(失点))^{0.2856} = 1.852,広島の勝率 = \frac{4.56(得点)^{R_c}}{4.56(得点)^{R_c}+4.10(失点)^{R_c}}  =0.549 $$ $$R_g = (4.71(得点)+3.76(失点))^{0.2856} = 1.840, 巨人の勝率 = \frac{4.71(得点)^{R_g}}{4.71(得点)^{R_g}+3.76(失点)^{R_g}}  = 0.601$$ と言うわけで来年こそ読売巨人軍の優勝が見られそうです。 今回は一番影響を与えるであろう丸選手について考察しましたが、更に(個人的には小林選手を正捕手にして欲しいですが)炭谷選手や中島選手、岩隈選手、ビヤヌエバ選手の補強もあるので更に得点、失点の向上は見込めるでしょう。 計算したくないのでしませんが恐らく今年の巨人はピタゴラス勝率以上に勝率は低かったと思いますがそこは復帰した原監督なら指標通りの勝率を出してくれると期待します。 本当は出場した選手と試合結果の点数を学習してスタメンと先発投手から試合結果を予測する..みたいな事がやりたかったのですが途中で挫折してしまったのでデータを転用して取り繕ったのはご愛嬌。 以上願望のだだ漏れの記事をここまで読んで頂きありがとうございました。