如果你是个纯粹的理论派,相信简化和忽略无关紧要的参数是解决问题的终极手段,你坚贞的确信,牛顿正是因为忽略了大气浮力,风向和物体形状,把苹果体验成一个没有大小的质点,最后才写出了f=ma。那么,请你看看如下两张图。

               

                                         图 一

               

                                        图 二

    从这两个张图,你看出了什么?如果我告诉你,对于第二张图,如果去掉那个该死的毛刺点,它们是同一张图,你会想到什么?

    我们姑且把第一张图称为第一类随机事件,其所有采样点的幅度都集中在一个合理而温和范围内。而对于第二张图的第二类随机事件,其可能出现的毛刺有着远大于常规采样点的幅度。

    对于第一类随机事件的处理非常简单,我们很容易想到对其建立高斯统计模型,根据大数定律,随着样本规模的增大,观测到的平均值越来越稳定,其分布会越来越窄。这也是一切统计理论的工作原理,大数定律使得不确定性在平均化之下消失了。

             

                                        大数定律

 

    那么,我们是否可以使用同样的方法来处理第二张图的随机事件呢?我们应该注意到,那意外而讨厌的毛刺点(因为其观测值远远大于其它所有点)会极大的将高斯曲线拖离均值的位置。这样的毛刺点还具有另外一个特征,就是它们出现的可能性远小于其他常规的点,有可能你永远也观测不到这样一个点,但是一旦它出现,高斯统计曲线那强大而完美的均衡力量将会失效。这第二类随机事件,正是由美国学者纳西姆·塔勒布提出来的极端斯坦模型(相应的第一类随机事件被称为平坦斯坦)。

    按塔勒布语,在极端斯坦模型下,剧烈偏离均值的个体的存在,而且偏离程度大得惊人,使得均值这个概念在这个领域没有太多的意义,高斯曲线不再适用。

    读到这里,你也许要忍不住打哈欠了,第二类模型有什么用?研究它听起来简直像吃饱了饭以后的脑残行为。但也许令你感到意外的是,这第二类随机事件对于我们日常生活的影响,远比第一类要广泛。

    第一类随机事件的适用场合:诸如身高,体重,缺少放大作用的工作收入(比如理发师,小商贩,大部分的白领员工),车祸概率,人的智商等。

    第二类随机事件的适用场合:财富和收入。一个世界首富的财富,甚至可以抵得上一个小国家的全体国民总产值;作家写书的发行量,畅销书哈利波特的销售量为四亿五千万多册,而普通的图书发行量达到3-5万册,就算是畅销书了。Google关键词的搜索量,某个单词的使用频率,明星的知名度,战争死亡人数,金融市场,公司规模,商品的价格,海啸地震造成的损失,物种之间的大小差异,文明的进程等等。如果你仔细想一想,你会发现绝大多数的社会事件都符合第二类随机模型,而第一类随机事件更适用于物理和生物领域。

    如果你冒然的使用高斯曲线模型,那么你会发现很多情况下效果都不理想。事实上,几乎所有的理论数学模型,在实际工程中运用的时候,都会有很多适用范围和条件,只是我们太容易忽略这些条件了。既然香农定律给出了信息传输容量的极限,为什么我们不能单独的依靠冗余编码完成某个特定信噪比条件下的无线通信,而非要加上及其严格的重传机制?因为有着不可预测的信道深度衰落。为什么那些看似无懈可击的经济学理论模型,在实际运用中却总是无法正确预测经济走势,因为社会实践中,有着太多你无法掌控的因素,包括政策走向,突发的天灾或战争等。

    回归分析法就是一种典型的理论模型建立方法。该方法是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。但是,我们也必须知道,一个社会现象,是非常多因素共同作用的结果,而从来不是两个因变量与自变量之间的关系,回归分析法使用的前提是先固定所有其他因素。一个相对客观的理论模型,常常会多次改变固定的参数(或者外表因素)得到不同的因变量和自变量的函数,再综合进行处理。而我们在实践其模型的时候,一定需要明确其条件。

    最后,回到开头的问题上,牛顿说:f=ma,请问:为什么自由落体的物体开始一直加速,但最后总会以匀速下落?

 

   是的,牛顿没错,只是实践中,还有空气阻力造成了和重力的平衡。