2015-02-20 13:58 来源:Vansky
很多加拿大人有个疑问﹐Tim Hortons咖啡店主办卷杯边抽奖活动﹐喝大杯咖啡的人有没有较大中奖机会。
有一天﹐电脑软件开发员英格利希(Ken English)与几个同事在上班时谈到这个问题。
英格利希说﹕“我们只是谈论抽奖背后的阴谋论﹐我认为﹐唯一的办法是收集一些数据。”
于是﹐英格利希建立网站Roll Up the Stats﹐分析网民提供的数据﹐根据咖啡大小、地区及其他因素﹐分析奖品分布情况。
英格利希尽量收集最多数据﹐迄今已收到大约4,000份资料。
咖啡连锁店有在网站公布奖项资料﹐但英格利希需要更多具体资料﹐Tim Hortons却没有提供。
加拿大广播公司(CBC)科技专栏作家米塞纳(Dan Misener)说﹕“这实在是古怪的数据科学方式﹐要想收集更多抽奖信息。”
英格利希分析手上的数据﹐已破解一个迷思﹐大杯中奖机会不见得更大。它也显示﹐奖品较多赠饮咖啡﹐较少赠送甜圈饼。
米塞纳﹐这次调查也显示群众报告的数据比较复杂。“不论是咖啡数据﹐或是举报选举诈欺﹐这类平台发挥真正作用﹐首先要有足够的人知道它的存在﹐有足够的人数提供有意义的数据。”
还有一个限制﹐就是无法核实人们提供的数据。其他限制包括﹕人们不愿报告中奖?样本规模有限﹐例如﹐Tim Hortons说﹐它的卷杯边抽奖活动有3.06亿个纸杯﹐4,000份数据只是极小的数目。