神坑2018高考全国II卷语文作文:幸存者偏差
与其说神坑
倒不如说这是一个悲伤的故事
今年全国II卷语文材料作文是这样的:
“二战”期间,为了加强对战机的防护,英美军方调查了作战后幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里。然而统计学家沃德力排众议,指出更应该注意弹痕少的部位,因为这些部位受到重创的战机,很难有机会返航,而这部分数据被忽略了,事实证明,沃德是正确的。
这段文字说的到底是什么?
你看懂了吗?
幸存者偏差(Survivorship bias)
另译为“生存者偏差”或“存活者偏差”,驳斥的是一种常见的逻辑谬误(“谬误”而不是“偏差”),这个被驳斥的逻辑谬误指的是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。
这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。
作为一个学术名词,确实很难理解
那么我在这例举一些生活中的例子
我们当老师的,就擅长用浅显的例子讲明白复杂的道理。
例子:一名记者来到火车站台上,随机询问:“请问你买到火车票了吗?”
一位大妈微微一愣,回答:“买到了”
记者又转向一位精瘦精瘦的年轻人,问:“请问你买到火车票了吗?” 年轻人回答:“买到了”
随后记者又问了5个人,大家都回答:“买到了”
最后记者对着镜头说:“今年虽然火车票难买,但是通过采访我们发现,大家都买到了火车票,现在正满怀希望地赶回家乡,过个团圆年!”
比如,某年某杂志为美国大选作电话调查,经过统计觉得A稳胜,最后却是B选票大幅占优。
原因是当年电话是奢侈品,电话调查的受访者注定都是富人,也就无法代表全体民众。
再比如,大家看到电视上报纸上媒体上到处都是创业成功者在宣传爱拼才会赢,也是幸存者偏差,因为输了的人没有机会发言。
而日常生活中,最常见的就是我有一个朋友,我有一个亲戚,“我认识一个人”等开头的故事。
比如有人说我有个朋友高中没毕业做小买卖年薪百万,那个谁大学毕业才一个月5000,得出结论:读书无用。问题是,高中没毕业挣得少的人已经被他忽略了。
1)“幸存者偏差”无非是一种选择偏倚2)警惕“幸存者偏差”和警惕对“幸存者偏差”的滥用都有意义
假定对于一个很大的总体,我们有一个样本。我们试图通过手头的样本来找出总体的一个性质。具 体来说,我们想知道的性质是:一个我们关心的变量y,被一堆潜在的解释变量X中的哪些解释了。 那么,最直观的做法是对样本的y和X取值做些统计分析,以对样本进行统计分析的结果来作为总体 性质的猜测(或者说估计)。至于用什么方法,取决于面临的具体问题,或者说,我们对于希望找 出的性质已经有了哪些知识,在这就不展开了。 但是这么干是有缺陷的。在做统计分析之前,应该问这么一个问题:样本是怎么来的。
理想的情况是:样本是从总体中等概率随机抽取的。但是现实并不一定就是这样。总体中每个个体 进入样本的概率很可能是不同的。它可以跟y和X或者别的什么玩意相关。
换句话说:
换句话说,仅仅找到样本选择规则并且知道它有偏倚,可以做出的正确决策是拒绝用样本进行简单统计分析的结论,而并不足以分析出正确的结论。做出正确结论的方法当然有。前面说的询问老飞行员以获取更多信息算一个。
但是单纯对SSR取反或者做些什么别的文章,可以分析出正确的结论吗?
恐怕不行。
网上常有人声称自己仅仅是知道了自己面临的问题中有什么样的“幸存者偏差”,并且通过“幸存者偏差”本身就分析出了(事后)正确的结论。对于这样的说法,需要动动脑子,看看能否把它和瞎蒙区别开来。
毕竟瞎蒙也是有蒙中的概率的。但是瞎蒙离最大限度利用已有的信息作出决策常常有很大的距离。如果一个人拿“幸存者偏差”为自己瞎蒙蒙中的结论背书,那么他事实上是在滥用这个概念。
哈哈,打那么多字,说那么多理论
无非就是想纠正一下大家的
一种习惯性逻辑错误
“大姚老师已经累倒在电脑前”
最 后
他们都说:"爱笑的女孩运气不会太差”
是的,因为运气差的,特么根本笑不出来。
这就是幸存者偏差。
人来人往,城市慷慨夜光
如同少年,不惧岁月长
相逢太短,等不及茶凉
若是常驻,大姚陪你走完这一场
做最温暖的教育
○
新东方合肥学校优能1对1部
○
学科/家庭教育/政策/活动
请留下你指尖的温度
让太阳拥抱你
记得这是一个有温度的公众号