偏差样本

偏差样本(Biased Sample)、不具代表性的样本(Unrepresentative Sample),系指根据缺乏代表性的样本推论出一般性的结论。相似地,偏差统计(biased statistics)则指根据不恰当的统计方法推论出一般性的结论。

常见样本缺乏代表性的原因,一是样本数太小,二是样本并非随机抽出,往往因某些因素导致偏差。

示例

例1

美国人很有钱,可见美洲人很有钱。

然而,美国是美洲最富有的国家,不能代表美洲其他国家的情形,也不能代表整个美洲的情形。

例2

那位学者出书声称父母教养方式和子女人格特质的相关性为零,所以父母的养育对子女无用。

一、这是一家之言,未必是学界共识,引用单一权威未达成共识的做法也涉及误用诉诸权威的谬误;二、父母教养对子女人格特质无影响不代表父母教养对子女全无影响。

例3

我读的那本书,及那本书作者的著作告诉我,地理因素、文化差异或工作伦理不是造成一个国家经济繁荣、成为发达国家的主因,及早建立起民主且注重法治社会制度,以及一些历史的偶然,才是一个国家经济繁荣、成为发达国家的主因。

特定书籍或作者的言论,未必是学界共识,即使内容写得再有理也一样。

例4

他是重点大学热门科系毕业的,结果还是长期失业、每天宅在家浪费时间打电玩,可见念好大学没有用。

然而有可能是这个人运气不好,或者自身性格真的有问题,或这人有其他的想法,因此就算念到好学校还是一样没有更好的就业前景,所以不能把他的状况类推到所有念重点大学热门科系的人身上。

例5

1936年美国总统选举前,《文学文摘》邮寄1,000万份问卷予其读者,回收230万份。他们预测共和党候选人阿尔夫·兰登会在531张选举人票中获得370张选票并胜过民主党候选人富兰克林·德拉诺·罗斯福

该次总统大选,阿尔夫·兰登实际上只获得8张选举人票,而富兰克林·德拉诺·罗斯福则在大选中大胜。一个说法认为,《文学文摘》的读者相较于全美人口具有较高共和党人比例,故此他们更倾向于投票给阿尔夫·兰登。《文学文摘》的民调样本有明显的偏差。

例6

某甲严词批判某乙的作为,还把事情闹得很大,而就我个人的经验来看,某乙是个好人,可见某甲只是无来由地厌恶某乙,或者妒忌某乙而已。某甲应该要放下自己的怒火,接纳某乙,甚至应该向某乙道歉。

然而有可能其实是某乙一直都在搞小动作,把某甲逼到抓狂,或者有其他的理由,所以才会发生这样的事情的。因此不能因为跟一个人一两次的交流经验,而对一个人的性格下评断,尤其不应该下负面的评断。

例7

新闻常常在报性侵诬告、性骚扰诬告,可见性侵和性骚扰案一堆都是诬告,是女生跟男生上床后,企图对男生仙人跳而搞出来的。

然而性侵犯性骚扰极度常见,研究也显示性侵犯和性骚扰的诬告率不高于其他犯罪,因此有可能是因为性侵犯和性骚扰被告上法院的案子非常多,所以诬告的总量也多,以致产生了性侵和性骚扰案件一堆诬告的错觉,甚至媒体的选择性报导也可能有影响,因此不能因为常常看见有性侵和性骚扰诬告的消息,就认定性侵和性骚扰的案子更有可能是诬告的。

偏差样本的形式

常见偏差样本谬误的形式如下:

  • 轻率概化:只根据少数样本就做出一般性的结论。
  • 采樱桃谬误:轻率概化的一种,系指根据少数样本被刻意挑选的样本做出一般性的结论。
  • 轶事证据:只根据传闻、个案就做出一般性的结论。这些传闻往往细节详细、诩诩如生,或是被人一传再传,如新闻或巷议街谈。

相关条目

外部链接