セイバーメトリクスの根本問題(2)データ形式の選択

 セイバーメトリクスの予測性を大きく制限してきたのがデータ形式の問題だ。すなわち、一次データとして感覚されたものをいかなる基準で記述するか、という問題である。つまり、物の見方の問題である。これは全ての諸科学の問題でもある。感覚与件の分類法こそが諸科学の性格を規定しているからだ。

伝統的セイバーメトリクス = 公式記録の科学

 次の画像を見てほしい。これらの現象をそれぞれ何と呼ぶべきか。つまり、それぞれ何の概念に分類して記録すべきか。

  1. 単打,単打(打点1),単打 ⇒ 打者の進塁数と走者の帰還数だけを基準にした形式
  2. 右安,二安(打点1),三安 ⇒ 打者の進塁数と走者の帰還数と打球方向を基準にした形式
  3. ライナー,フライ,ゴロ ⇒ 打ち上げ角度を基準にした形式

 1は公式記録の形式、2はスポーツ新聞風の形式、3はいわゆるBatted-Ballの形式である。つい最近まで野球統計はすべて公式記録の形式(1)を利用していた。つまり、打率、長打率をはじめOPS、BABIPなどは、打者の進塁および走者の帰塁以外はすべて捨象している。つまるところ、打球角度や打球方向はそれ自体では得点と無関係だからだ。

 この方法で、例えば「各選手の打率は毎年50%の確率で0.045以上変動する(打率は当てにならない)」のような知見が得られてきた。つまり、伝統的なセイバーメトリクスは公式記録と公式記録の間の関係を記述する科学だと言える。

公式記録に頼った手法の限界

 しかし、この3つの打球をすべて同じ「単打」として分類してよいのだろうか。予測性の向上のためにはあまりに粗雑な方法ではないだろうか。というのも、もともと野球の公式記録は選手の能力を調べるための記録ではなく、得点への形式的な貢献度を記録したものに過ぎないからだ。それは偶然の介入が大きく、予測の基準としての技術や体力との間に飛躍がある。実際、公式記録に関する知見は選手の成績がいかに不安定かを示すばかりで予測性が弱い。それどころか、新人選手など試合での実績がない選手の話になると全く見当がつかなくなってしまう。

 予測性だけでなく、再現性にも問題がある。例えば、「打率よりも長打率の方が得点との相関が強い」は統計上の有名な知見だが、では、どうすれば長打率が上がるのか、という話になるとやはり何も言えなくなってしまう。せいぜい「過去三年間の長打率の加重平均が高かった選手を連れてこい」といったぐらいのことしか言えない。何か現象を積極的に引き起こすためには、その物理的な条件を究明しないといけない。しかし、伝統的な野球統計は公式記録と公式記録との関係を記述するだけで、その記録が成り立っている原理には全く関心がない。

データ形式の見直し

 上記の打球の内容を見直してみよう。

 一番目の打球は外角に目を付けたときの規範的打ち方である。後足つま先に体重を移してホームベース寄りに踏み出し、スイングと同時に後足に体重が戻っているのに注目してほしい。言い換えれば、上体が突っ込んでない。おかげでヘッドの加速に障害がなく、頭部が安定しているのでミート率(打球速度/スイング速度)も高い。このような打球が多い打者は打率を期待できる、と直観的には言える。ちなみにこの打者は2014年のア・リーグ首位打者のアルトゥーベである。


 二番目の打球はいわゆるテキサスヒットである。インハイに差し込まれているのを無理やり打ちに行っているから上体が早く開いてヘッドの走りが妨げられてしまう。もっとも、この高さをレベル気味に打って詰まるとヒットになりやすいのは技術的によく知られている。とはいえ、速球への対応に問題があるなら打率も長打率も期待できないかもしれない。

 いや、こんな細々としたことは概念として記録できない、と言うかもしれない。しかし、例えば「ヘッドスピード××m/s、ミート率××、打球初速××m/s」のような形式で記述できる可能性はある。お好みなら技術的ないし体力的に重要と思われる指標を何でも足してよい。いずれにせよ、もっと選手の内属的性質に直接由来するものを記録し、それと公式記録との関係を調べたほうがよい。そうした数値なら偶然による介入が少なく、より小さい標本から真実の値が推定でき、シーズンごとのぶれも少なく予測性が高まることが期待できる。また、選手の練習方針の決定にも多大な寄与ができるだろう。

より専門化していくセイバーメトリクス

 このような問題意識はすでに00年代中盤頃からセイバーメトリクス界隈では共有されてきており、PITCHf/xやBatted-Ball-Statsなどの研究が活発に行われてる。できれば選手の技術や体力の測定を定期的に行いたいところだが、選手の拘束には高い費用がかかるので遠い夢かもしれない。いずれにせよ、野球統計は組織的なデータ採取を要求する専門分野となっていき、古き良きネット時代のように公式記録をEXCELのマクロで収集するだけのお手軽な統計分析はアマチュアリズムの遊戯として時代遅れとなっていくだろう。

inserted by FC2 system