下手の横好き(馬と獅子が好きです)

主に西武ライオンズ、競馬のことを主に書いています。

獅子威し打線の2019年の成績は?尋常じゃない、半端ない、昨年の爆発的な活躍を今年も再現できるだろうか? そこで、勝手に遊びで簡易に概略的な推測をしていみました。ただ、あくまで粗々な下手の横好きの遊びなのであしからず。

ライオンズの強み
今年も『獅子威し打線』です。


ちなみに、過去の結果と併せて
打率、出塁率、OPSを見ると、、、

昨年の結果はすごかったことが伺えます。


ところで、その獅子威し打線の成績
今年、どうなるのでしょうか?
今年も概ね脅威になることが推測されますが、
当然、相手も研究してくるでしょうし、
獅子威し打線が弱い天敵もぶつけてくるでしょう。
例えば、獅子が苦手にしている岸は、楽天も
対戦を避けていた面もありましたが、
昨年、中盤からカモにしていた則本を当てず
岸を連チャンで当ててきました。
もちろん、
今年はガンガンにぶつけててくるでしょう。


獅子威し打線の重要な課題は、
苦手な天敵が各球団に存在して
その数が多いことにあります。


そのあたりの課題は、
命取りになるおそれもありますけど、
「何度も同じ相手にやられる」というのは
絶対にクリアしなければならぬ問題
でもあります。


まあ、今日はその課題は
とりあえず置いておいて
過去の成績データを踏まえながら
今年2019年の成績がどうなるか?
打率、出塁率、OPSに関して
勝手に推測してみました。


ところで、下図は、
前年(2017年)と2018年の成績の関係について、
昨年の打席数のパ・リーグ上位50人
を対象にして整理したものです。

まあ成績については、
前年と比べて急激に数値を上げることもあれば、
前年とは様変わりして不振に陥ることもあるので
上図を見てもわかるように
当然、バラつきが大きいです。
ただし、前年の成績が全く無関係とは言い難く
上図においても、
粗いですが、何となくの関係性は見られています。


そこで、今年2019年成績について、
粗々の超概略的な検討ですが、
あまり難しく踏み込まず
簡易に推測することを念頭に
その関係性に着目し、
過去3年(16~18年)の成績データに基づき
重回帰分析により、簡単に推測してみました。


ただし、実際には『年齢』も左右してきます。
若手であれば、
前年の勢いを持ってさらなる成長もありますが、
ベテランになると、衰えもありますから、
前年通りの成績が反映しないこと
もあり得ます。


下図は、
前述の昨年の打席数のパ・リーグ上位50人を対象に
過去4年(2015~2018年)のデータでグラフ化した
年齢別の成績です(横軸が年齢)。

これを見ると、
25~30歳の選手がピークであることが伺えます。
特に出塁率は27歳くらいがピークになってます。
ただし、ピーク年は対象データ次第で変わると思います。
でも、当然ながら高齢になれば下降線を辿り、
グラフ上に相関式の曲線を記載していますが、
特に、成績の高い値のエリアになればなるほど
その高齢に伴う下降線が顕著になっています。
例えば、打率3割以上、出塁率4割以上
30歳を超えるとプロットが激減しています。


このような背景から、
今回の推定においては、
過去の成績年齢も加えて検討します。
すなわち、
今回は、重回帰分析で簡易に検討しており、
目的変数「2019年の成績」に関して、
説明変数を「1~3年前成績」「年齢」
として検討し、
次のような形の
概略的な推定式(相関式)を算定しました。


(2019年の成績)
 =a×(3年前成績)+b×(2年前成績)+
  c×(1年前成績)+d×(年齢)+e
という形で、a~eの係数を算定します。


ところで、この推定式を算定するにあたり、
使用したデータについては、
パ・リーグの各球団における
昨年の打席数上位10名(外国人含む)

成績年齢を対象にしました。
ただし、プロ入り1年目(外国人含む)は除き、
その場合、11位以下も繰り上げて入れました。
しかし、過去1年だけの成績を対象にするなら
60名(10名×6球団)が標本数になりますが、
その中で
2年前までの成績を有するのは56名、
3年前までの成績を有するのは47名と
標本数は減っております。


さて、それらの結果は次のとおりです。

ただし、源田あたりは過去2年の結果しかないので、
(3年前の)
そのような3年目の選手用の式も推定します。


上表については、
打率、出塁率、OPSに関して、
2種類の式を示しております。


というのも、上段の紫色式については、
各々の説明変数を対象
単純に重回帰解析した式になります。
(この式を式①とします)


まず見ていただきたいのは、
左欄に記載している
重相関Rを補正した補正重決定係数R^2の低さ
ですね。
前述の「前年(2017年)と2018年の成績の関係」
でも見られたように、バラつきが大きいので
相関係数も低くなっております。


一応、式のすべての係数が0でありそうな確率、
説明変数と目的変数が全くかかわりが無い確率

を示す「有意F」は5%(0.05)以下でかなり低い確率
にはなっています。


それだけ粗々(雑)な検討になりますが、
とりあえず
「有意F」は低い値を示しているので、
このまま突き進みます。
まあ「数字の遊び」になっており
そのまま算定しますが、ご了承ください。


ただし、数値予測というものは
計算値が実績値と全く同じになること
はあり得ません。
計算値=実測値とピタピタと合う予測モデル
逆に作意的で怪しいです。
しかし、データに基づく予測は、
ある程度の傾向を把握する
有効なかつ重要なツールにはなります

ちなみに、予測手法については、
複雑なモデルほど
細かい現象を表現できます
が、
逆に基盤になるデータの充足度が求められます。
使用データが雑になれば
そのモデルの複雑さは無駄になります。
一方、簡単なモデルは
得られる結果は粗々しいですが、
大まかに把握するのに都合がいいです。
データが乏しい、粗々なら、
不確実性が大きいのなら
得られる精度が粗くなる
ので、
より簡単な概略的なモデルの方が使いやすいです。


話を戻しますと、
上表の上段は単純に算定したものですが、
各説明変数(1~3年前の成績&年齢)において
P値が高くなっている変数が見られています。
 ※P値とは、
  その説明変数の係数が0でありそうな確率、
  その説明変数と目的変数が関わりの薄さ

  の目安を示す値であり、一般的には
  P値が大きい変数から削除していき、
  全ての変数のP値が5%(0.05)以下
  になったところで変数の係数を確定させます。  


例えば、
プロ入り4年目以上の選手に関する推定式では、 
上段の①式におけるP値を見ると、
説明変数(2年前の成績)のP値が5%以上です。
このため、説明変数から
(2年前の成績)を除いて見直しました。
すなわち、下段の式は、
上段の式からP値のを除いて見直したもの

になります(これを式②とします)。


一応、今年の成績推定には、
参考として上段の式①でも算定しましたが、
下段の式②を最終的なものとします。
 ※結果的に打率と出塁率は
  あまり変わりがありませんでした。
  それでも補正重決定係数R^2は
  ほんの極々僅かに微増しましたが。。。
  ただし、プロ入り3年目用の式では
  もともとから説明変数の数が少なく
  さらに減って単相関になったりしたので
  R^2が減少しています。
   
そこで、検証として、
上記の推定式(②式)を基に2018年成績を算定し、
実際の2018年成績と見比べてみましょう。


その結果が次図になります。
ちなみに、次図は
昨年の打席数のパ・リーグ上位50人
を対象にして整理したものです。
(ただしプロ入り3年目以上を対象)

まあバラつきはありますが、
何となくの傾向は見られております。
一応、今年の成績推定には、
前述の②式で算出した値に対して、
上図の検証結果から得られた
単相関式(上図の赤線)の補正をかけます。


すなわち、上図の単相関の結果
 打 率:実測値=0.978×推測値
 出塁率:実測値=0.991×推測値
 OPS:実測値=0.993×推測値
を勘案して、②式で得られた値に
0.978倍、0.991倍、0.993倍の補正をします。


ただし、上記の補正においては、
打率、出塁率、OPSともに
相関式が実測値が推測値より低くなています。
しかし、昨年の獅子威し打線は、
一昨年までと比べて尋常ではない働き
をしました。


そこで、前述した検証結果のグラフは、
パ・リーグ全体を示す結果でしたが、
(打席数上位50人ですけど)
その中から西武をピックアップした結果
を見てみましょう。
次図がその結果になります。

この西武だけの検証図における
単相関の結果
を見ると
 打 率:実測値=0.999×推測値
 出塁率:実測値=1.035×推測値
 OPS:実測値=1.040×推測値

と出塁率、OPSに関しては、僅かですが
実測値>推測値の傾向になっていました。
すなわち、この相関式からは、
昨年の獅子威し打線の出塁率やOPSは、
一昨年までの成績を勘案する以上に
爆発的に半端ない成績をおさめたこと
が裏付けられていると考えられます。


それだけに、獅子威し打線
その尋常でない、半端ない働きを
今年も再現できるのか?

今年の肝心の課題になるわけですが。。。。
すなわち、
活躍が尋常じゃなければないなほど、
奇跡的な高レベルになればなるほど、
もう一度、再現するというというのは
難しくなってきますから。。。


一応、今年の成績推定においては
上記②式で得られた値に対し、
西武だけの検証図における単相関の結果
も反映した補正値も算定しておきます。


以上のことを踏まえて、
得られた結果が次のとおりです。

西武だけの検証図における単相関の結果
による補正結果の方が高いわけですが、
その値でも昨年の成績を下回る者が多いです。
昨年以上になっているのは、
昨年が低すぎたメヒアや金子侑、
また若い森や源田でしょうか。


ただ、秋山あたりは打率が3割を切って
秋山にしては、低めに出ています。
これは何が響いているのか?というと
年齢の説明変数が左右しています。


まあ、秋山の場合、
自分に厳しいストイックさを有し
自分を追い込んで鍛えていますから、
そう簡単に年齢的な衰えは少ない
と、個々の観点では思いますが、
リーグ全体(打席数上位50)を
対象にした傾向を鑑みれば、
前述の年齢別成績を見てもわかるように
30歳を過ぎると厳しさが増す
ということが伺えます。


実際にストイックな栗山でさえ、
まあ未だに勝負強さは健在で
頼もしい存在です
が、
30歳を過ぎての下降線は否めていません。

秋山も今年31歳になります。
それ故、秋山もメジャーを目指すなら、
来年がギリギリということもありますが。。。
まあ来年の話は考えたくないですけどね。。。