セイバーメトリクスの根本問題(1)確率命題は意思決定の役に立つか

 セイバーメトリクスは統計的に得られた知見を期待値や確率の形式で記述する。いわく「無視一二塁でのヒッティングの得点期待値はヒッティングより0.2点高い」とか「カウント3-0でのスイングの得点期待値は見送りより0.07点低い」など。これらの例は粗雑な一般論にすぎないが、打者の成績などの諸々の条件を追加すれば、個別の状況に対応して各選択肢を包括的に評価できる。この得点価値という形式への還元によってすべての要素を比較可能としたのがセイバーの最大の成果と言ってよい。

期待値論に必ず伴う合成の誤謬の問題

 しかし、期待値が高い選択肢をひたすら素朴に追求していけばよいのだろうか。その選択肢が全体に占める割合を増加させたとき期待値はどう変化するだろうか。こういう話になると統計は何も言えなくなってしまう。その新しいバランスにおけるデータがないからだ。これがいわゆる合成の誤謬の問題であり、要素還元主義的な方法には必ず付随してくる。

 たしかに、バントを減らしたところでヒッティングの期待値が変化するとは思えない。しかし、フォークはPitch Valueが高い、と言われても握力との関係もあるからそうそう連投できない。また、外角は内角より安全、というのも統計的に明らかだが、では投手全員で外角への投球をこれまでより増やしたらどうなるか、と聞かれるとこれまた科学的には何も言えない。さしあたり部分の比率が部分の性質に影響しないことを前提にして話を進めることはできるが、もちろんこれは自明ではない。むしろ、競技者の直観からすれば、コースの偏りによって前後のミートポイントが一定になるリスクは必ず考慮される。そのリスクを事前に得点価値で評価することができるだろうか。

 また、理論上は、レギュラー選手の総合予測指標の合計を最大にすれば勝率も最大となるが、その場合は当然に出場野手は固定される。しかし、これまた統計上、特定の選手に打席を集中させるリスクが指摘できる。一般的に打者の成績向上には投手との対戦回数が重要だということが分かっている。しかし、対戦回数の効果は右図のように逓減する。出場選手が過度に硬直したチームは対戦経験のメリットを享受できず、次世代選手の層が薄くなっていくことが予想される。しかし、このリスクを将来の勝率に還元して評価することはできない。セイバーメトリクスは出場しなかった選手の能力に関しては何も言えないからだ。

 つまるところ、経験的期待値は、少なくとも試行頻度が試行集団の性質に影響しない項目においてしか未来に適用できないようだ。つまり、多くの場合、期待値は過去の行動の合理性を説明できるだけで、新たに積極的な提言をするには大きな飛躍を抱えている。統計から実践的推論をするには必ずこの観点から検討を行って飛躍を埋める必要がある。ただし、それが科学的な方法でできるかどうかは明確ではない。

統計的推論の個別的有効性の問題

 合成の誤謬は長期的意思決定にまつわる問題だが、個別的意志決定についてはいかなる問題があるだろうか。個別のケースにおいてそれぞれの選択肢を期待値によって評価して意志決定に寄与することができるだろうか。

 しかし、個別的な確率言及にはそもそも客観的な意味がないことを確認しなければならない。例えば、「この打席で安打の出る確率は30%」と言っても、「この打席」は一回しかないのだから、命題の真偽を検証するための事実がはじめから存在しえない。確率はあくまで母集団の中での頻度としてしか検証可能性を持たない。そこで、「この打席」を何らかの母集団の中に包摂して結果の確率分布を示すことになる。これが帰納的推論だ。しかし、これはこれで母集団の選択が問題となってきてしまう。

 無死一塁でA投手が打席に入りバントを企画しているとする。その成功率は何パーセントか。過去三年間のプロ選手全体を参照すれば成功率は89%だ。しかし、A投手は投手だからもっとバントが下手かもしれない。過去三年間の投手全体を参照すれば成功率は68%だ。しかし、他の投手がいくらバントが下手でもA投手の犠打成功率とは何も関係がない。では、A投手の過去三年間の成績の加重平均を参照するのはどうか。しかし、同一人物とはいえ過去と現在とでは状況が異なるのではないか。例えば、A投手が「今日の相手投手の球はバントしづらい」と言い出したらどうか。その場合はどの標本を参照すればよいのか。さらに、内野手の守備力や走者の足の速さによって犠打成功の見込みは大きく変わる。こうやって条件を増やしていくと、正しい参照グループは「いま、ここ」の場面ひとつだけになってしまう。

 このパラドクスは、個別の結果について一意的な確率を追求すると参照グループが消滅して帰納的推論が成り立たなくなることを示している。統計的確率は母集団の性質を推定するだけであって、それがいかなるものあっても要素の性質との間には因果的な飛躍があるからだ。事象は母集団によって起きるのではなくその場の物理的条件によっておこる。個別のケースは、母集団の捨象した様々な要因で成立している。

 つまるところ、個別の意志決定において一意的に期待値を出すことはできないようだ。個別的確率は主観的な様相にすぎない。それは当事ケースを何らかの標本と飛躍的に関連付けることによってはじめて成立する。この飛躍こそが帰納的推論の本質であって、この点において統計も直観も変わりない。この二つの違いは何か。統計は抽象的概念を参照し、直観は具体的経験を参照する。概念は経験に由来する。概念は個人的経験に限定されない普遍性を持つが、経験から抽象したもの以外は全て見落としてしまう。例えば、上の例における「今日の相手投手の球はバントしづらい」という判断をどうやって概念に固定するのか。直観はこのような暗黙の要素を収集して経験と照合する。

 統計的推論と直観的判断のどちらが正しいのか。個別のケースについては科学的に検証のしようがない。一つのケースで二つの選択肢を取ることはできないからだ。長期的な結果についてスコアを比較することはできるが、その場合も、直観的判断はそれぞれ異なる人物の基準で行われていることを考慮しなくてはならない。

経験的確率論の歴史|心理主義vs客観主義

 このような問題は、確率の概念の発見者・パスカル(17世紀)がすでに指摘している。統計的推論は、大前提として試行概念と結果概念との経験的関係を記述する(例:「日本人プロ選手の犠打企画数における成功数の割合は89%」)。パスカルいわく、概念によって記述される前提からは、明確な推論はできるが正確な判断はできない。上に例示したように、標本と個別のケースの間には無限の飛躍があるからだ。抽象的原理に頼っているだけでは、個別に事象を成立させている多様な原因を見落としてしまう。正確性と明確性は両立しない。
 その後、確率概念は、実在との関係が不明確なまま科学の基礎として定着していく。しかし、18世紀中頃になると経験主義が基調となり、確率概念の認識論的基礎が問われるようになる。ヒュームは言う。確率は思考の習慣の産物に過ぎず実証性を持たない。それはいかなる印象としても感覚に与えられず、むしろ、感覚と感覚の間の経験的な連接関係から形成された「起こりやすさ」の信念にすぎない。その現象の背後に普遍的な確率の実在があるかどうかは有限の立場からは実証できない。しかし、確率の実在性は重要な論点ではない。確率という信念の積極的な意味は、それを通じて動物が外界に適応しているということにほかならない。子供は怒られる頻度の高い行動を止める。自転車を練習する人は倒れる頻度の高い乗り方を止める。ここに確率論におけるプラグマティズム(実効主義)が成立する。(これと同様に、古典確率論のラプラスも確率を信念的なものだとしている。)

 しかし、このような心理主義的確率論は科学にとって明らかな困難を抱えている。確率命題を主観的信念に還元してしまうと科学としての意味の共有が不可能になってしまうからだ。そこで、20世紀には、確率命題を客観的事実に還元する立場が登場する。ミーゼス(1919)は、いわゆる頻度主義として、確率を繰り返し試行における頻度の極限値と定義する1。この場合、社会現象など有限回の事象についての確率命題は無意味となる。総じて、客観確率の立場は、有限回の事象に関する確率言及もしくは帰納的推論を認めないという結論にならざるをえない。

 確率が主観と客観のどちらに属するか、という問いは無意味な形而上学にすぎない。どちらの立場からも現象を合理的に説明できる。そこで、現代科学は規約主義の立場を取る。もはや確率はその本質を問われず、もっぱら過去の現象間の関係を記述する形式となり、さまざまな理論分布を前提にして未来に投影される。これにより、ヒュームののように確率概念を主観的な認知装置としてとらえることも許容され、いわゆるベイズ主義が展開し人工知能などの分野で広く応用されている。

統計は直観的認識を記述できるか

 確率命題の意味は概念を媒介として共有されなくてはいけない、というのは科学の中だけのドグマにすぎないのではなかろうか。人間は概念(言葉)に変換できない無象の観念を経験として蓄積してる。それは科学と違って他人に伝達できないが、科学の認識できない因果連関を反映している。これが蓋然性の様相であり、本来の認識論的確率ではないのか。例えば、「自転車に乗っているときはこんな感じで力を入れると倒れない」といった感覚を、言葉で伝達できない認識として多くの人が体得しているのではないだろうか。野球も含めプロフェッショナルな認識とは概してそういうものだ。

 一般論としては、平均的な打者が一二塁でバントをすると得点期待値が0.2点下がる。しかし、プロの直観として、その打席の条件で一割も打つ自信がないなら、バントするのは正しいのかもしれない。統計的なデータもそういう判断の積み重ねで成り立っていることを忘れてはならない。

 科学がより正確になるためには、プロが直観的にだけ認識している曖昧なものを概念化していかなくてはならない。そうして、技術的に追求すべきものが明確となり、日常の訓練に重大な指針を与えるだろう。そのためには、収集データをより物理的な形式に変換していかなくてはならない。(この点については別の記事で述べる)。

1  ミーゼスの確率論はあくまでラプラスの等可能性の概念に対する批判から出発したものだが、心理主義批判として扱って問題ない。ラプラスは決定論者として確率の客観的意味を否定しており、その確率論はある種の心理主義へと帰着せざるを得ない。

inserted by FC2 system