畅享博客 > 搞搞震 > 管理酷评 > 社会统计的陷阱——你能发现多少?
2005-5-21 21:42:00

社会统计的陷阱——你能发现多少?

  统计学可以成为研究社会、经济现象的最有力的工具,同时也可以成为歪曲事实,颠倒黑白的最方便的作弊手段。特别地,在伟光正的人民国,统计更是被政府部门肆意歪曲,以误导民众。

  对于熟悉统计而又缺乏监督和规范的调查统计人员来说,在整个统计过程完全符合规定的情况下,仅仅依靠取样和问题设计,就可以“制造”出任意想要的结论。要做到这一点并不难,要害是:如果伟光正人民国的那些记者——仅仅接受过文科的训练,而没有统计学的基础,那么他们在传播那些似是而非的调查统计结论时根本就无法判断真伪,只能人云亦云。现在许多无良商家就是依靠统计肆意“制造”出他们想要的结论——那些协助传播的记者们,即使不怀疑他们的道德——他们凭什么来分辨?

  下面是一些统计的例子,各位可以判断一下,哪些统计是可靠的,哪些是不可靠的:

  1、某保健品对某团委组织的试用中,发现,服用该保健品的团员们罹患脑血管病的概率比社会随机抽样人群罹患脑血管的概率要低40多倍。因此,认为该保健品对降低脑血管病有“显效”。

  2、某地政府统计了该地的森林覆盖率,发现2001年度的覆盖率比1998年的覆盖率增加了3倍。

  3、某市民政局报告了2001年度结婚人数为12.1万对,离婚人数为3万对,并据此得出结论:离婚率为25%。

  4、某市统计生产总值时,考虑到黑市存在,就把黑市的贸易额也纳入到该市生产总值里面,这样就使地处内地的该市显得比许多沿海城市都要“富”。

  5、在前不久计算中国城市竞争力排行榜时,某市排在了香港之后的第二位,比北京、上海排名更靠前。该市统计数据的人口基数是依据户口人数统计的,大约为170万人,但实际上该市长期居住人口为700万。

  6、某调查机构准备调查中国城市家庭的平均人数,事先按照随机抽样原则在不同小区、不同街道、不同号码选取了数千个家庭。安排调查员每天上班后就根据这些事先确定的随机抽取的家庭逐一进行调查记录,如果选定的家庭没有人,那么就访问隔壁,直到访问到家里有人的家庭为止。

  7、某新药要做动物实验,从笼子里随机抓取一组豚鼠注射一单位剂量,同样方法抓取第二组豚鼠注射两单位剂量,……,直到能确定某组有一半豚鼠致死,得出“致半死剂量.50”。

  上面除5以外都是虚拟的统计事例,各位可以分析判断统计的漏洞在哪里?

解答

  1、用青年人的使用样本与人群普遍样本比较,不具有可比性。但现在很多保健品玩的就是这一招。还有一种是把筛选样本,在患者中选取病情良好的服用保健品,然后与病情严重的样本比较。

  2、这种伎俩往往是偷换了比较前后的“森林覆盖率”的定义,例如,在1998年度的森林覆盖率统计不含小树林或灌木,但在2001年度加上了小树林和灌木。类似的花招比如对网民数据的统计,一些网站就通过这个花招了欺骗投资者。中国的失业率统计数字就是玩弄了定义的游戏,与国外的失业率根本不具有可比性。

  3、离婚率是应该基于全部婚姻数来比较,而不是基于当年结婚数来比较。例如,对同性恋中爱滋病患的报道时,就经常用临床数字来代替实际统计报道。

  4、当某个城市把黑市的数据加进去,与其他城市没有加黑市的数据进行比较是不合理的,它使二者不具有可比性。现在国家级的经济统计部门就经常玩弄类似游戏来使中国的某些经济指标“看起来”不错。

  5、这是真实的案例,这个可耻的城市就是深圳。深圳的几乎所有官方统计数字都没有把固定居住但没有深圳户口的人统计在内,这样就使深圳显得很“富有”,而事实上,深圳大量的产业工人和服务业从业人员工资水平是相当低的。

  6、虽然事先确定了随机抽样原则,但在实际中,大量双职工家庭在统计员采样的时候并不在家,这就使最终的统计结果偏大,因为能在那个时间接受调查的往往是大家庭。现在很多调查公司在这个环节上没能对统计员的工作进行有效的监控,事实上使调查统计数据偏颇。

  7、随机抓取过程本身是有偏向性的,那些灵敏的、更健康的豚鼠在开始往往不容易抓到,而随机抓到的往往是体质和反应更弱的豚鼠,这就使分组不均匀,并最终影响统计结果。

  统计作假很容易,特别是有官部门发表的那些所谓的对青年人、老百姓的社会舆情调查,根本上就是垃圾。只要在问题取舍上有所偏向,几乎可以在调查采访前获得任何想得到的结论。例如,采访对北京奥运会的支持率,可以通过如下任何方式来取得“积极”的结论:

  1、缩小取样范围,在党员干部中采样,然后说是对老百姓的随机采访,多见于CCTV的手法。

  2、事先动员,然后填答问卷或者表态。这是几乎所有机关单位的惯常手法。

  3、选择数据,把不符合事先约定答案的调查删除掉。我以前在CCTV就遭遇到这样的“编辑”。

  4、设置不均匀的选择项,例如:“您对北京奥运的态度是:A、热烈拥护;B、十分拥护;C、基本拥护;D、完全反对”。然后统计出来的结果肯定是“拥护”的占人群的90%。

一个现实的案例 

原始材料见:
http://bbs.cyol.com/index2.php?forumname=%C7%E0%C4%EA%BB%B0%CC%E2&forumid=47&job=view&topicid=74602
这就是个典型的案例。


  心理问题,或者心理不健康的人群比例根本就在于以怎么样的标准来定义“心理健康”。特别是对学生的测查数据,引导语不当、施测情景控制不严都可能导致数据的可疑。拿中小学生的心理说事是几年来教育记者的“长销选题”,就这则帖子内容来看,有如下几个方面疑点:

  1、“采用5种国际上公认的权威量表对该市中学生进行各种心理测试”到底是哪几套量表?有否进行中国常模的修订?在国外“权威”,但在中国使用有两个先天的障碍会影响量表的信度和效度,A、施测问题的文化背景;B、翻译的准确性。

  2、“有人对北京地区3所中学823名学生进行问卷调查”有人到底是谁,什么机构来进行调查的?“有人”是任何记者都可以杜撰的虚无的调查。以前我95年读研的时候,就有研究生在屋子里给报社炮制文章,随手就虚构了“一项调查”,后来好几家报纸引用,以讹传讹。

  3、823名学生样本是如何抽样的?得出27%的抑郁者数据是极端不负责任的,特别对中小学生来说,由于情绪、认知还处于成长过程中,是不应该轻率地用“心理不健康”的标签,换言之,很多“抑郁者”不过好似暂时的沮丧、低沉,根本就不是抑郁。同时,中小学生完全可能不理解题目的准确含义而随手填答。

  4、类似调查统计结果的出处到底源自何处?没有获得公信力的期刊发表的论文作为依据,报纸随便发表来历不明的统计数字来作为文章的“证据”,这是很恶劣的缺乏职业操守的表现。特别地,这样的文章会给教育者以及家长以极大的误导,其性质不亚于虚假广告。

  (2002-05-06)


推荐到鲜果:

评论

所以,经济学里没有我所追求的真实

发布者 admin
2005-5-23 16:40:00


您正在以 匿名用户 的身份发表评论  快速登录
(不得超过 50 个汉字)
       看不清,换一个
提示消息
(输入完内容可以直接按Ctrl+Enter提交)