文:MenClub 魏文青  
POSTED ON April 22, 2022 6:30 pm

記得細個讀書時,數學老師用咗成堂時間黎介紹平均數 (mean)、眾數 (mode) 及中位數 (Median)嘅差別,當時我心諗「咪又係表達緊個中間值,使咩分到咁清呀?」但日前一名研究日本文化嘅Twitter用家,就完美地展現咗錯誤運用統計學概念會發生咩事。

Twitter上嘅「浜尻六彁 ???????? はまじり ろっか (@qlocka)」於上週貼出一張「按年齡分佈日本人擁有睪丸數目」嘅統計圖,圖中分別列出不同年齡層嘅日本人,以及日本人口整體擁有嘅睪丸數目平均值及中位數。當中顯示由0-59歲嘅日本人平均擁有大約「1.02粒睪丸」,然後數值於60歲開始下降,到100歲以上人均「只有」0.24粒睪丸。如果睇中位數就更加神奇,直到59歲「睪丸中位數」都係2,但一到60歲就跌到0,甚至全國中位數都係0,搞到全日本人好似冇睪丸咁。

圖片:浜尻六彁 ???????? はまじり ろっか (@qlocka)

實際上,「浜尻六彁 ???????? はまじり ろっか (@qlocka)」就係想用呢張「荒謬」嘅圖,展示運用錯誤統計方法去演繹數據嘅後果。實際上日本絕大部份男性都係擁有兩粒睪丸嘅正常人,但由於「人口平均數」係會將女性計埋入去,而59歲以下年齡層係男性稍多,所以「每人平均」就會有「一粒多啲」;而到60歲後,由於女性普遍較為長壽,所以女性佔比會增多,「每人平均睪丸數就會下跌」。同樣道理,「中位數」係指將所數據順序排好後,排於正中間位置嘅數值,所以於男性較多嘅59歲以下組別,排中間嘅會係一名男性,睪丸中位數就係2;60歲後女性佔多數,排中間嘅係女性,睪丸中位數就會係0。

呢張圖之所以成為日本Twitter熱話,除咗因為「日本人睪丸中位數係0」夠搶眼之後,亦因為佢提醒咗大家對於任何圖表、統計都要帶著批判性眼光看待。數據或者唔會呃人,但運用數據嘅人可能會。