每个善于观察细节的人都知道,如果你没有相关的知识背景,那么有些统计数据可以非常狡猾地骗过你。看一看下面这些步骤,学习一下如何防范自己被统计数据误导,如何将数据为自己所用,同时把它作为自己的优势。
01 了解专业术语。在讨论到统计数据的时候,“平均数”这个词已经被滥用了。表面上看,这个名词的表意很明显:平均值就是大致居中的一个值。但是,实际上有好几种平均值,如果你没有正确地理解它们,就会被误导。 “算术平均值”是把所有数据加在一起,再除以总体的样本量来计算出的。换句话说,如果你有3、3、5、4、7这几个数值,算术平均值就是把它们都加在一起(22),然后除以5(因为一共有5个数值)。 在这个例子里,算术平均值是4.4。 “中位数”是一组数值从低到高排列,恰好处在中间位置的那个数值。还用之前那组数值举例(3、3、5、4、7),中位数就是4,因为有2个数值比它小,2个数值比它大。 “众数”就是一组数值中最常见的那个值。在我们的例子里,众数是3,因为它出现了两次。
02 利用算术平均值撒谎。算术平均值看起来貌似是以上几种计算方式里最简单的一种,但是实际上不是这样的。因为一组数据里过高或过低的数值能对算术平均值产生很大的影响。要想利用算术平均值撒谎,你就可以在数据里加上一些极端的数值,然后再用公式计算。 例如,假如你要统计一个社区内50户家庭的收入。大多数家庭的收入是每年40000-60000美金,但是有一家每年收入是5百万美元。当你计算算术平均值时,得到的数值就会比真实的平均水平高出很多,因为5百万美元这个数值比其他数值大太多了。 相似地,如果你的数据里有9个人有1000美元银行存款,第十个人只有1美元存款,那么算术平均值就是900.10美元,几乎比最常见的水平低了10%。 在比较可信的数据调查中,在计算算术平均值之前往往会去掉最高和最低的数值。但是,并不是每一条新闻中的调查都这么可信。除非你能直观地看到所有统计数据,或者看到了关于已经去掉极值的书面保证,那最好不要对这些数据照单全收。
03 利用中位数撒谎。中位数实际上是最不容易用来骗人的,因为和其他数据相比,它不太容易过高或过低。它肯定会处于中间的位置,但是,你可以利用中位数来隐藏那些很大或很小的数值。例如,你的数据是1、1、2、3、4、5、3000,那么中位数就是3。 如果你的总体样本数量是偶数,那么你就计算中间两个数值的平均值来作为中位数。这样也不会受到极值的影响。 在用中位数描述某件事随时间变化的程度时,你要小心。如果一个公司前9年每年涨价3%,但是在今年涨了20%,那么中位数仍然是3%。
04 利用众数撒谎。有时候,众数几乎无法用来撒谎——例如,每人买球类比赛门票的张数这种数据能够用众数精确地表现出来。但是,同样地,众数也能被用来隐藏某些数值,尤其是在比较小的数据组里。 例如,如果你的数据里的数值都在1-100之间,但是1出现了3次,那么1就会成为众数,虽然平均值(这种情况下比较敏感)会接近50。 任何一项大规模的调查都可以通过过分强调众数来被操控。如果你向100个人调查针对某个产品的满意度,在1-10之间打分,大多数人都打了10分,那么即使打10分的人数比打其他分的人数只多了1个,10也是众数。
05 利用具体数字撒谎。如果你的数据比较抽象,不是具体的名数(例如,顾客满意度),那么要想撒谎实在是太容易了。如果你要求人们在1-3之间打分,那么打3分的人的满意度并不一定是打1分人的3倍。这个技巧一般用在算术平均值上,但是也能用于中位数,甚至众数。
如果有疑问,检查出来。如果你不能得到统计背后样本大小、范围和抽样方法的全面、完整信息,不要相信它。
一旦你知道怎么做,那么利用统计数据来撒谎就变得非常容易,但是这实际上不太道德。你要小心地运用你所学到的知识,不要利用它来伤害、欺骗、离间别人。