幸存者偏差谬误是统计学中的一种谬误(幸存者偏差说明了统计学的什么原理)

什么是幸存者偏差 统计学

幸存者偏差最早来源于英军对战斗机改进作的统计。根据对飞回来的受损灰机的统计发现其主要受损部位集中在机翼。所以结论是应当减少肌肤的装甲,加强机翼的装甲。这个结论显然是可笑的。造成这种偏差的原因是极负重担的,灰机大多数都坠毁了,统计结论产生了偏差,这个偏差被命名为幸存者偏差。在现实生活中该偏差比比皆是。

举个最简单的例子,老有人说读书有什么用?我的小学同学 xxx 他从小成绩一塌糊涂,初中都没念完就退学了。现在生意做得可大了,我本科毕业还不是租着房吃着泡面,朝九晚五。实际情况是一个班会读书的那帮孩子,日后也有生意做得不错的,也有租房吃泡面的,也有在家啃老的,平均生活水准高于不读书的。但是不读书的孩子中有一些已经吸毒吸成鬼了,赌博欠一屁股债躲起来了,再加商加入黑社会被砍死了,这些人你看不到,你只能看到那些幸存者,生意做得可大了。欢迎关注评论点赞转发,谢谢。

概率思维三大定律?

假设有一个叫琳达的单身女性,伯克森悖论和幸存者偏差,31岁,数据幸存者偏差导致的错误,直率而聪明。作为哲学系学生的她非常关注性别歧视和社会公正,7种常见的统计学悖论,并且参加过反核战游行。

根据以上的介绍,测量误差不可避免的原因,下面的叙述哪一个更有可能?

1)琳达是个银行出纳员。

2)琳达是个热衷于女权运动的银行出纳员。

我们的直觉往往会选择2),幸存者偏差是什么学科,因为根据介绍文字中「琳达关注性别歧视」,幸存者偏差四川,似乎她更有可能同时是一名热衷女权运动的女性。

但学过概率,归因偏差的经典例子,你就会知道,统计学中著名的悖论,A和B同时成立的可能性小于等于A成立的可能性,幸存者偏差说明了统计学的什么原理,所以,基本比率谬误,琳达同时是银行出纳员和女权运动者的概率要低于她是只是一名普通银行出纳员的概率。

这个案例来自丹尼尔·卡尼曼的《思考,举例说明常见的归因偏差,快与慢》,心理学幸存者偏差,作者在斯坦福大学做测试的时候,什么叫幸存者偏差的逻辑,有90%的本科生在这个问题上答错,幸存者偏差是什么意思,大家在思考的过程中更多是运用直觉而不是用概率思维。

直觉是在人类进化过程中的产物,判断两个样本是否有差异,为了应对突如其来的危险而诞生的条件反射式的思考方式,westernblot结果统计分析,但面对复杂问题的时候,方差不齐是不是实验数据废了,直觉往往会给出错误的结论。这时候,显著性差异代表什么,如果想要更准确地理解这个充满随机性的复杂世界,幸存者偏差是什么理论,我们就需要用到概率思维。

幸存者偏差

小数定律

墨菲定律

▌幸存者偏差

幸存者偏差是一种常见的逻辑谬误,相关系数的强弱标准三种,指的是由于日常生活中更容易看到成功、看不到失败,假设检验显著性水平a的含义,人们会大大高估成功的希望。励志经常是999个失败案例堆砌出一个成功案例,重复性与标准偏差的关系,而这个成功案例不断被宣扬和放大,幸存者偏差相反的理论,让很多人产生了一种只要按照别人的方法就能再成就一个李嘉诚或比尔盖茨。

但问题是,我们看到的那些数据都是被筛选和过滤后的,它反映的不是真实的世界。媒体不会给失败者发言的机会,读者也不会花几十块去买一个失败者写的书。

一个人成功了,不管是外界还是他自己,都很容易将成功归于个人性格,比如敢于冒险、注重细节、擅于沟通等,但如果你真的去研究那些落魄的失败者,你会发现他们也拥有这些品质:敢于冒险、注重细节、擅于沟通等。

因此,名人的成功传记只能当童话故事来读,成功了人人可以写名人传记,但从来没有一个人因为看名人传记而成功。

我们在做统计分析时,往往只关注那些成功的例子,从而得出以偏概全的错误结论。

有一段时间我很想通过体育锻炼来塑形,在选择何种运动的时候我第一时间想到的是游泳,因为根据我看奥运会的经验,游泳运动员的身材都不错。

但当我选择游泳的时候我发现一个很严重的事实——我的体质和性格都不适合游泳。我下水后耳朵进水得了中耳炎,以后每次下水都犯,而且我在游泳的时候被呛水两次导致后来我一下水就肌肉紧张、脚抽筋,最终这项运动被我放弃了。

在选择游泳这个运动时,我的思维模式就是一种典型的幸存者偏差认知谬误,很多人可能也跟我一样,因为游泳运动员的身材非常好而误认为游泳能帮助改善身材,但实际上是「倒果为因」,不是因为游泳而身材好,而是因为身材好更有利于游泳,最终好的运动员看上去身材也都很好。

这就好像姚明因为身高优势能成为好的篮球运动员,而一个像我这样的矮个子,却永远不能通过打篮球长得像姚明那么高。

如果我们只是盯着成功人士的成功经验,就陷入到了「倒果为因」的错误逻辑,失败了黑的也不是黑的,成功了白的也可以是黑的,所以,想要看到事物的本质,正确的方式是用「证伪思维」去「研究失败」。

1940年,在英国和德国的空战中,英国损失了不少轰炸机和飞行员。因此当时英国军部的一大课题就是:在轰炸机的哪个部位装上更厚的装甲,可以提高飞机的防御能力。

当时的英国军方研究了那些从欧洲大陆空战中飞回来的轰炸机。经过统计,飞机上被打到的弹孔主要集中在机身中央,两侧的机翼和尾翼部分。因此研究人员提议,在上述三个弹孔最密集的部分加上装甲。

这一建议被美国军队统计研究部的统计学家Abraham Wald否决。Wald连续写了8篇研究报告,指出这些百孔千疮的轰炸机是从战场上成功飞回来的「幸存者」,因此它们机身上的弹孔对于飞机来说算不上致命。要想救那些轰炸机飞行员的性命,更正确的方法应该是去研究那些被打中并坠毁的轰炸机。只有研究那些没有成功返航的「倒霉蛋」,才能找到这些飞机最脆弱的地方并用装甲加强。

纳西姆·塔勒布在《黑天鹅》中说:「我们可以通过负面例子而不是正面证据接近真相!」所以,这个故事中研究幸存者就是错误的思维方法,研究那些被击中的飞机才能做出真正有效的防御。

一个企业家如果要采取措施规避经营风险,不是去学习那些已经成长起来的大企业,更是要研究那些被风险击垮的成长型企业,从而建立应对方案。

想要学习成功的方式,除了掌握必须的方法,同时也要知道死在半道上的前辈们都犯了什么致命的错误。成功可能各有各的原因,但失败,一定是触碰了事物不可违背的红线。

在投资界,查理·芒格是个特别喜欢逆向思考的人,彼得·考夫曼在《穷查理宝典》中这样描述:「在芒格漫长的一生中,持续不断地收集并研究关于各种各样的人物、各行各业的企业以及政府管制、学术研究等各领域中的著名失败案例,并把那些失败的原因排列成做出决策前的检查清单,这使他在决策上几乎从不犯重大错误。」

所以,成功的方法值得借鉴,但失败的原因更值得重视。

▌小数定律

小数定律是一种概率上的思维谬误,与「大数定律」相对应。

「大数定律」是指,统计的数据样本越大,最后得出的数据越接近真实结果。而「小数定律」恰恰相反,它是指在数据足够少的情况下,人们总是会不由自主地以自己的视角或已知的少数例子作为衡量标准,并由此来推测和得出错误的结论。

最近世界杯德国惨败,让很多人再次对「世界杯魔咒」深信不疑。甚至有网友贴出了「世界杯魔咒」确实存在的证据:

西班牙,2010年南非冠军;2014年巴西首轮淘汰。

意大利,2006年德国冠军;2010年南非首轮淘汰。

巴西,2002年韩国-日本冠军;2006年在德国与法国的四分之一决赛中淘汰。

法国1998年法国冠军;2002年韩国/日本首轮淘汰。

德国,1990年意大利冠军;1994年在美国对阵保加利亚的四分之一决赛中被淘汰。

阿根廷,1978年阿根廷冠军;1982年西班牙第二阶段淘汰。

这些数据看起来非常整齐,好像真的有规律一样,但其实「世界杯魔咒」根本不存在:

在过往的世界杯比赛中,曾有两个国家蝉联冠军:

1934年的世界杯德国得了冠军,1938年再次拿到冠军;

1958年、1962年的世界杯冠军都是巴西。

也就是说,各媒体和公知、大V宣传的「世界杯魔咒」是一个早已被「破解」的「伪魔咒」。

这就是一个典型的「小数定律」谬误,在统计数据足够小的情况下,即便数据整齐、规律,但也无法直接证明任何结论,更不要说这些信息其实是被媒体「有选择性」地展示的。

但很多人在决策的时候更容易运用「小数定律」。

比如,你和一个广东的供应商合作,由对方为你代工生产一批产品,结果对方交来的货物质量很差,远低于你的预期,你感觉被坑了,之后找你的一个朋友抱怨,碰巧那位朋友也曾经遇到过提供劣质产品的广东供应商,之后你上网搜索发现还有很多人和你有过类似的经历,这个时候你可能就会得出一个结论——广东的供应商提供的产品质量都很差。

但这种结论是错误的,因为样本数太小,广东的供应商可能有几万家,你和你的朋友碰巧遇到了2个能力不佳的或者不诚信的,这完全就是随机事件。破解方法就是去查权威数据,比如失信企业库,你很可能会发现失信率最高的根本不是广东。

概率论最基础的思想是,有些事情是无缘无故发生的。这个思想对我们的世界观具有颠覆性的意义。我们日常所遇到的事情无非两类。一类是确定现象,一类是随机的不确定现象。比如标准大气压下,水加热到100℃会沸腾,是确定会发生的现象,而你第二胎会生男孩还是女孩就是完全随机的现象。

有的时候,由于我们搜集的数据有限,会让随机现象看上去「很不随机」,甚至非常整齐,感觉好像真的有规律一样。

1940年的伦敦大轰炸之后,报纸公布了标记着所有受到德军V2导弹轰炸地点的伦敦地图。人们发现,轰炸点的分布很不均匀,有些地区反复遭到轰炸,有些地区却毫发无损。

难道德军在轰炸伦敦的时候故意放过了某些地区吗?

如果真是这样,对英国军方来说,这将是一个非常恐怖的事情,因为这意味着德国V2导弹的精度比预想的要高得多,以至于德军可以精确地选择轰炸目标。而伦敦居民则相信,那些没有遭到轰炸的地区是德国间谍居住的地方,甚至有些人开始搬家。

然而,事后证明德军V2导弹是个精度相当差的实验性武器,与其说是导弹不如说是大炮,德军只能大概地把它打向伦敦,而根本无法精确控制落点。

理解「小数定律」,我们会对生活中发生的很多看似有规律的小样本数据更为客观的看待,不仅是识别媒体和网络信息的真伪,更能让我们理性地去做决策。

比如如何对待「经验」。

我们有时候很依赖商业大咖或者行业的某些前辈,甚至对他们的一些「经验之谈」言听计从,全盘复制。但这也是「小数定律」谬误。一个人在一件事情上的成功经验,甚至多个人在同一件事情上的成功经验都不能被称为真理。

比如,这两年二胎政策出来了,在你考虑是否要生二胎的时候,身边传来了很多声音,有的告诉你一定要生,因为有了二胎后家庭更幸福、热闹了;也有人告诉你千万别生,一个孩子更容易管教,两个孩子容易抱团捣蛋。你该听谁的?

他们的意见有用吗?恐怕完全没用,因为样本数太小(一个人只能提供一个样本)。

如果要做出正确决策,你可能需要看下大数据,比如一些网站统计的生二胎的幸福指数,这个样本数可能是几万或者几十万,可信度无疑会更高。而且同时你也要综合评估自己的状态,平均数未必适合你。

不仅身边人的个别建议不可靠,成功人士的「静态经验」也不可靠,它们无法应对动态的环境。

拼多多创始人是靠倒卖域名起家的,但现在你如果也想通过倒卖域名赚第一桶金显然不现实了,因为互联网已经全面移动化了,大家都在玩APP。

晋江模式「央视 明星 砸钱」做火了很多运动品牌,但现在这种模式也不好使了,尤其是对于服务年轻群体的品牌来说恐怕广告费都收不回本,因为年轻人不是不看央视5套了,而是压根不看电视了!消费者的广告接收场景发生了根本变化。

所以,在创业这件事上要想理性决策,正确的姿势是:看大规模统计 紧跟时代趋势。

▌ 墨菲定律

我们很多人都有「侥幸心理」,总认为坏事发生在别人身上的概率更高,发生在自己身上的概率较低。如果采访一下在星巴克丢笔记本电脑的人,他们的说法惊人的一致:「我没有想到会这么巧,我只离开了3分钟。」

纳西姆·塔勒布说:「傻瓜认为自己是特殊的,别人都是普遍的;聪明人认为自己是普遍的,别人都是特殊的。」

「泰坦尼克号」撞到了冰山,1500人葬身海底。之所以会死这么多人,除了碰到冰山运气实在不好,还有一个重要原因:船上没有足够的救生艇。当时的人们认为,泰坦尼克号是永不沉没的豪华巨轮,所有设备都是全新的,没有机会用到救生艇。

所以有时候,即使我们做对了99%的事情,只要有1%的事情做错,事情也会被彻底搞砸。

为了防止这件搞砸的事情给我们带来毁灭性打击,我们日常要「未雨绸缪」,建立备份。

比如重要的文件及时上传云端,在办公室留家里的备用钥匙,如果你的笔记本电脑很贵重,那还是随身带着的比较好。

特斯拉的仪表盘显示汽车电量为零的时候,实际上还有10%的电量,这部分电量用户不能使用,是为了保证在极端情况下——你的汽车没电了,又好多天不充电,你的电池不会过度放电,影响安全和性能。

公司的核心部门一定要设置储备干部,以防止人员流失带来的业务风险和管理混乱;公共场所一定要设置安全通道;创业、投资一定要给自己留有「后手」,不能真的「孤注一掷」。

霍夫曼有个非常著名的ABZ理论,他认为,你在任何时候都要有三个计划:

A计划,是你目前能够长期从事,并且值得持续投入的工作;

B计划是在A计划之外,你应该给自己创造的新职业机会。万一A计划有问题,有应对的方案;

Z计划是用来应对最糟糕状况的备用计划,假如有一天你倒霉透顶,你的A计划和B计划都失败了或失效了,你应该有一个能够保证自己生存的计划。

, 我以为这是五天的量,没想到这是一夜的量,漫漫长夜,见证了医院里发生的一切,也看到了朋友圈里的种种,其实我有好多话想说,只是没有力气了,每一种看法,可能都是幸存者偏差,今晚我是那个幸运者,发热待诊的孩童可能是不幸的,感恩与批判,其实都是站在自己的角度出发的,什么是客观的事实呢?,这些急诊的医生、 ?

幸存者偏差谬误是统计学中的一种谬误(幸存者偏差说明了统计学的什么原理)

发表评论

登录后才能评论