下手の横好き(馬と獅子が好きです)

主に西武ライオンズ、競馬のことを主に書いています。

勝率にはOPSやWHIPがダイレクトに大きく関係する? 過去の成績を基に数字で遊んでみました。でも西武のWHIPは高いですね。。。もっと下げないとね。今年も昨年のような尋常じゃないOPSを2年連続で残すというのも、そう簡単ではないですから。

選手のみなさんは、
2月1日のキャンプ開始に向けて
今年への思いを込めて、
自主トレに励まれていますね。


ドラ1の松本航も張り切っています。

西武ドラ1松本航 連日ブルペン
1/20(日) 11:51配信(西日本スポ)

 ドラフト1位の松本航(日体大)が2日連続でブルペン入りした。捕手が立った状態で直球を約20球。「まだしっくりはきていない。(マウンドの)傾斜に慣れるようにしている。体の動きを確認したかった。
疲れは少しあります」。19日は同4位の粟津(東日本国際大)と一緒の投球練習となり、「どんな球を投げるのかなと思って、ちょっと見ていました」と気になる様子だった。


ーーーーーーーーーーーーーーーーー
早くマウンドにも慣れたいでしょうし、
即戦力として頑張るぞ!という意気込みで
やる気十分に張り切るのは良いです。
ただ、まだ大学卒業式も控えているように
新入社員の研修のようなもんです。
まだまだ先は長く、
そんな今から「疲れ」というのはどうでしょう。
張り切りすぎて
故障や体調を崩したりするのは避けたいですね。


さて、今日は話題を変えて、
昨年の成績データを使って
数字で遊んでみたいと思います。

過去4年(2015~2018年)における
セ、パ12球団の成績です。


そこで、勝率得点失点得失点について
相関関係を見てみましょう。

得点が多ければ、勝率は高くなる
失点が多ければ、勝率が低くなる
得失点差が多ければ、勝率が高くなる
当たり前のような話ですが、
上図に示すとおり、
データでもその傾向が裏付けられています。


上図を見ると、得点と勝率、失点と勝率、
得失点差と勝率の関係があることは伺えますが、
その関係性の程度は様々です。


失点と勝率の関係を見ると、
プロットのバラツキが見られており、
相関係数(R^2)が低いですね。
逆に得失点差と勝率の関係は、
直線近似のラインに乗ってバラツキが少なく、
相関係数も高いですね。
まあ試合は、
得失点差がプラスなら勝つし、
得失点差がマイナスなら負けるわけで、
得失点差と勝率の関係は強くて当然ですね。


この関係性を見ると、勝率6割を得るには、
得失点差は約130点が必要となることが伺えます。


ちなみに、勝率を目的変数、
その説明変数に得点失点を選び、
目的変数(勝率)と説明変数(得点、失点)の関係
を見てみましょう。

すなわち、今回の4ヶ年のデータを基に
説明変数の得点失点を使って
目的変数の勝率を推定する相関式
重回帰解析により算定してみます。
得られた推定式については、
上記のように
勝率=0.116×得点-0.096×失点-0.421
という式が得られました。
多少のバラツキはありますが、
相関係数もR^2で0.856と高いように
上記相関式もあながち間違っていない
というところでしょうか。


ちなみに、上図は、
得点や失点のデータを
上記相関式へ代入して算出した勝率
実際の勝率の関係を示したものです。
勝率の計算値と実測値の相関を見ると、
バラツキはありますが、
概ね同程度の関係になっており、
得られた勝率の計算値は、
勝率の実測値と比べて
あながち間違っていないことが伺えます。


------------------
さて、得点について、
打撃に関する項目との関係性を、
※打率、出塁率、長打率、OPS、
 得点圏打率、得点圏打点率、IsoP
失点について、
与四球数&被安打数の指標
となるWHIPとの関係性を見てみましょう。


得点失点については、
数字の感覚を掴みやすいように
試合数143で割って
1試合平均で整理しました。


まず単純に項目同士の1対1の単相関を見てみます。


当然ながら、打率が高ければ、
出塁率が高ければ、長打率が高ければ、
OPSが高ければ、得点圏打率が高ければ、
得点圏打点率が高ければ、IsoPが高ければ
得点も高くなりやすいです。
与四球数&被安打数の指標
となるWHIPが高ければ
失点も高くなりやすいです。
当たり前の傾向ですが、
上図においてもその傾向は見られています。


ただし、得点については、
OPSとの関係性が他より強い傾向にありますね。
得点とOPSの関係を見ると、
1試合平均得点で4点以上にするならば、
OPSもチーム平均で0.70以上が欲しい
ということが伺えます。


また失点とWHIPの関係も
相関係数が高いので、
関係性は強いと判断できます。
1試合平均得点で3点以下にするならば、
OPSもチーム平均で1.16以下が欲しい
厳しい条件であることが伺えます。


すなわち、
OPSのデータから得点
WHIPのデータから失点
ある程度、推測できると考えられます。


参考までに、得点(目的変数)について、
OPS等の項目を説明変数として、
先ほどのように重回帰解析により、
相関式を推定してみましょう。


説明変数には、
上記のようなOPS等の項目から選びますが、
OPSは出塁率と長打率の総和になり、
相関係数も出塁率と長打率がOPSより低いので、
出塁率と長打率はOPSで代用します。
また、得点圏打点率は、
得点圏での打点÷得点圏での打数なので、
その打点が得点に直結することから、
説明変数に取り入れると、
自己相関のような関係になってしまう
から外します。
ちなみに、得点圏打率も外しました。


ところで、少し脱線しますが、
得点圏打点率という数字はあまり使いませんが、
野球データノート (2018年)さんが
HPで整理してくれています。

得点圏における打点から
得点圏時の打席数を割ったものであり、
得点圏のチャンスで点が入る率の参考になります。
例えば、
1~2番打者に出塁率の高さを求めるなら
クリーンアップには
得点圏打率や得点圏打点率の高さを
求めたい面
はあります。


では、話を戻しましょう。
目的変数・得点に関して、
説明変数打率OPSIsoPを選び、
相関式を推定してみました。

上図を踏まえると、
上記の推定式から算定した得点と
実際の得点を見比べても、
概ね同程度であることが伺えます。


いずれにしても、上記の検討結果から、
OPSが得点にWHIPが失点に
大きく関わっていることが伺えます。


そこで、勝率について、
OPSWHIPを説明変数として
関係性
を重回帰解析で見てみましょう。

相関係数がR^2で0.84と比較的高い
相関式(勝率=1.494×OPS-0.500×WHIP+0.123)
が得られます。


上図を踏まえると、
上記式から算定した勝率と
実際の勝率を見比べても、
概ね同程度であることが伺えます。


その上記の式を用いて、
少し例示をしてみましょう。


今回、対象とした過去4年間において、
リーグ優勝した球団(リーグ1位)の勝率を見ると、
平均勝率は0.617最大勝率は0.657になっています。
例えば、もしその勝率を確保するために
OPSWHIPがどの程度、必要になるか?
上記の勝率を推定する相関式を踏まえて
見てみると、
下図のようなOPSWHIPの関係が見られます。
すなわち、
下図の緑線が
平均勝率0.617=1.494×OPS-0.500×WHIP+0.123

下図の青線が
最大勝率0.657=1.494×OPS-0.500×WHIP+0.123

という関係式のグラフになります。


例えば、WHIPが1.25のとき
平均勝率0.617を得るには、
OPSは0.75以上が必要という推定になります。
WHIPが1.30のとき、
最大勝率0.657を得るには、
OPSが0.80以上が必要という推定になります。


もちろん、
こういうデータに基づく推定式から得られる
計算値が実績値と全く同じになること
はあり得ません。
計算値=実測値とピタピタと合う予測モデルは
逆に怪しいです。
しかし、このようなデータに基づく予測は、
ある程度の傾向を把握する
有効なかつ重要なツールにはなります。
それだけに、
データは面白いし、使える材料として、
積極的に有効に活用したいものですね。


ちなみに、予測モデルというものは
複雑なモデルほど
細かい現象を表現できますが、
逆に基盤になるデータの充足度が求められます。
(データが乏しい中ではその複雑さは無駄になります)
一方、簡単なモデルは
得られる結果は粗々しいですが、
データが乏しいのならなおさら、
より簡単なモデルの方が
大まかに把握するのに都合がいいです。



ところで、昨年の西武については、
WHIPが1.425と悪く、
その反面、OPSは0.805と
極めて良すぎました
でした。
計算値の勝率では0.613です。
(まあ実際の勝率は0.624ですが)
ただし、リーグ優勝、連覇を目指すなら、
もし今年もWHIPが昨年と同様に高ければ、
今年も尋常じゃ無いOPSが必要となります。
2年連続で平均OPSが0.8以上というのは
現実的にそう簡単ではないですね。
せめて、WHIPは1.35以下に改善したいです。