聆听杂志 > 私人笔记 > 统计数字之你我他[某些东西看上去总是很美好]
日期: 2010年6月3日分类: 私人笔记标签:

统计数字会说谎

  聆听杂志最近在读《统计数字会撒谎》,作者是山姆大叔达莱尔·哈夫,该书引发的“编造虚假信息”话题受到美国社会持续普遍的关注和美国权威媒体的激烈争论,被翻译成多国文字,在世界的影响力持久不衰,被誉为美国商业人士、研修人员的重要入门必修书之一。书里面大胆地揭露了至今仍然被销售员、广告撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,同时还配有别具一格的风趣插图以及众多幽默的案例。神秘的统计学在这里被哈夫像讲故事一样一一道来,莞尔一笑中让你知晓深奥的统计学基本原理,掌握揭露“虚假数据”的最有力武器……

  桑普拉斯曾说过,统计分析让一切假象原形毕露。但遗憾的是,统计未必能够揭示真实,有时候还可能成为假象的帮凶。当我们面对生活中形形色色的统计数据的时候,还要多保持一些理智和清醒,并要有所保留地看待问题。因为“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。”

  聆听杂志自身所学专业是统计学,引述下统计学概念,统计学曾是应用数学的一大分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测。

  六月毕业的季节,聆听杂志就以"OOXX大学2009届毕业生收入高于社会平均水平的结论是怎么得到的?"以这个命题举例说明吧,文字写得比较混乱,请抱歉。

  调查者向被调查者发出的调查函是根据学校同学录的地址来发出的,但是总有一部分问卷不能发出或没有收回,发不出去是因为有人地址电话不详联系不上,这些人会是那些功成名就、事业有成的政府部门官员、企业高层管理者、私企老板吗?当然不可能。这些成功人士可能唯恐别人不知道他们的成就,有同学聚会就广散名片,就怕别人不知道他们有多风光。那些联络不上,不愿让别人知道的一般都是自觉混得不好的,不想跟别人联系,换了电话地址不愿示人,他们可能打拼多年仍然只是公司的普通工作人员、政府机关部门的基层科员、生意失败的自由职业者、默默无闻的作家、艺术家等,他们唯恐别人知道他的境况,连同学聚会都不好意思去,难道去看那些春风得意意气风发的成功人士在他们面前炫耀吗?他们接到调查表会填上他们都羞于说出口的工资收入吗?人家一个月的工资差不多是他们一年的收入。他们可能只会把调查表偷偷丢到垃圾篓中,或者红着脸填一个比他们实际工资收入高很多的数字。这样的数据能代表整体水平吗?

  而调查者进行这次调查的目的是什么?应该不会是仅仅为了满足好奇心吧?可能是为了替OOXX大学做宣传,为他们以后的招生工作打广告,他们会把那些收到的不合要求的调查数据(过低的会拉下平均数的数据)筛选掉,把统计结果往校方需要的方向靠拢,这样他们就得到了他们想要的数据,这就是统计骗术。

  “平均工资水平”有多少可信性?某城市白领月薪1500?标准太低数据存疑、平均工资越高越令人恐惧……类似于这样的质疑越来越多。统计这种神秘的语言,在一个用事实说话的社会里是如此的吸引人,但有时它却被利用并成为恶意夸大和迷惑他人的工具。《统计数字会撒谎》揭露了大量至今仍被销售员、专家、记者或者广告撰稿人频频使用的“行骗工具”:有偏的样本、精心挑选的平均数、滥用一维图形、遗漏某些重要的数据、混淆因果关系等。

  看完视频后,让我们换个角度来思考统计在企业中的意义。视频中老太太可能连手机都不会用,但是她正在经历另一种数字化生存:她本人被数字化了。这家赌场实时地知道每一位顾客的赌博记录,他们根据这位顾客的年龄,收入和住址等个人信息以及赌博习惯,可以计算该顾客的“疼痛点”:一晚上最多输多少钱下次还能再来玩。赌场一旦发现某位顾客今天输的钱接近疼痛点,免费牛排之类的节目就出场了。

  其实我们每个人都正在被数字化。网上书店会根据你以往买书的记录向你推荐你可能感兴趣的书,这个算法的准确性可以超过任何专家或朋友。每个人的各种个人信息,经常在哪个商店购物,常买哪个牌子的衣服,甚至每一次消费的记录,收到的每一张超速罚单,都正在被商业公司收集利用。根据这些信息,使用统计回归算法,商家可以知道你的很多事情。租车公司可能会拒绝为信用历史差的人服务,因为数据分析显示信用分数差的人更容易出车祸。商家甚至知道连你自己都不知道的事情,这就是统计的意义。

  统计学本身并没有利弊之分,关键是看谁在使用统计数据。想不被数字玩就先学会玩数字。

声明: 本站遵循 署名-非商业性使用-相同方式共享 3.0 共享协议. 转载请注明转自 聆听杂志 !
本文的评论功能被关闭了.