
统计学本身是个好东西,但很多时候被的和尚念错了经,也有些时候是被一些别有用心的人故意利用了,更有甚者,被一些不良学术人士用来牟利或其他,某些高层人物也是利用数据的操弄者。
其实判断这些错误并不难,就是加强自己的统计学知识,并多问几个为什么。具体来说,以下这些误导是经常发生的:
样本太小,不具备代表性。样本偏差,样本被误导不具备广泛性。在这样的前提下,即便是整个流程合乎统计学的规范得出来的数据往往天差地别。
清楚平均数和中位数的差别是非常重要的。平均数值在高斯分布中具备有效性,在很多符合幂律分布的数据中,往往造成很大差别。比如你住在深圳南山区的某街道,你的平均年收入可能超过100万。但不幸的是,二马两个人就把你的年收入提高了90万。因此你看到媒体上大肆吹嘘的平均数,你笑了,你觉得你被平均了。
有很多数据具有相关性,但不是因果性的。比如股价的涨跌与季节节气有关系(江恩理论),也与月圆月缺有关联(螺旋历法)。比如每天早上鸡叫之后天明,但鸡叫绝对不是天明的原因。实际上这样的数据多如牛毛。
……
在现实生活中,最缺少的就是统计学的教育。如果没有统计学的思维,基本上就是一个思维文盲。
