2019年9月13日星期五

賽馬統計的「真」與「假」

科學家曾表示數學可以解釋萬物,只要你的問題設計得好,數學就會給你正確的答案。我當然沒有資格討論統計學是數學的分支,還是獨立的數學科學。但我覺得前面一句套用在統計上也可以。

經統計分析出來的數值永遠是真的,但分析出來的結論就有可以是假的,是真是假視乎你設計的問題。就好似如下2個折線圖一樣,使用相同的數據,卻展示出不同效果。圖表可以誤導人,數據分析也是可以讓人墮入陷阱。

賽馬統計的「真」與「假」

賽馬統計的「真」與「假」



如果有人說「馬季跑了28場,其中有26場的頭馬都是有試閘的」,得出結論「季初有試閘的馬匹成績非常捧」。你能認同嗎?

事實上馬匹試閘只是日常操練的一環,更是練馬師出擊部署的一小環,何況安排馬匹參加試閘是有不同的原因。

你可能會列出統計數據,馬季跑了28場,在已經上陣的三百多匹賽駒中,賽前有試大閘的勝出率是約10%,而沒有試大閘的勝出率是約2.7%,這不是明顯「季初有試閘的馬匹成績更好嗎」?但統計數據又顯示賽前有試大閘的上名率是26%,而沒有試大閘的上名率是23.6%,沒有勝出率差別那麼大,而是非常地接近,所以關鍵還是要留意馬匹和騎師在試大閘時展示的姿態。

賽馬統計是很有趣,但要小心陷阱,只有對賽馬有更加深的認識,才能設計出好的問題,發現好的趨勢。

最後祝中秋快樂!

沒有留言: