醉汉的漫步

希言槿2020-12-24 11:04:08

<写于2012年3月>

最近忙于一个A股IPO的项目,每天读招股书,读到快要吐。中文招股书的逻辑普遍不太好,又爱堆砌大量套话,读来更像一份政府工作报告而非一份招股文件,不明白证监会的老爷们为何喜欢这样的调调。

为了不被招股书恶心死,抽空读了一本有趣的闲书,换换眼睛。此书是2008年出版的畅销书《The Drunkard’s Walk》(醉汉的漫步),作者是美国物理学家LeonardMlodinow。

我近几年读到最好的社会科学作品似乎全都是物理学家写的,此书也不例外。作者利用统计学的知识揭示了很多社会现象中隐藏的规律,其中有一个重要的规律,就是无所不在的随机性。

随机性在作者看来是人生的常态。小到一个人的生活轨迹、大到历史事件的次第展开,尽管人们试图用“后见之明”去倒究原因,可那些事件的轨迹也许不存在什么必然理由。

此书名字“醉汉的漫步”本身是一个生动的比喻,在统计模型中这种现象也称作Markov chain (马尔可夫过程)。如果用计算机做一个马尔可夫过程的运算,去模拟一个醉汉的步伐路线,你会得到类似下面的结果:

图中看得到,从起点到终点的行进路径毫无规律。历史和未来是缺乏关联的,无法用已发生的历史事件对未来的走向进行有效的预测。这种特性也称作“memorylessness”。

这话题本身,其实不只是一个统计问题,更像是一个哲学问题。

哲学上,有一种观点叫“决定论”,意思是,世间万物存在必然的因果关系,倘若知道全部的层层细节或曰原因,你一准儿能测知结果。

这个观点最有名的代表是法国数学家拉普拉斯(Laplace)。1814年,在牛顿物理学达到顶峰时,拉普拉斯写过一段话(大意):“如果一个智慧生物知道运动的规律,且知道影响这些规律的力量,那么,大到天体运行小到原子活动,都是可预知的。对智慧生物来说,没什么是不确定的,未来与过去都如在眼前。”

他所说的智慧生物,听起来好像是帝哥的感觉。

拉普拉斯的“有因必有果,万物皆可知”的观点,在科学家眼中似乎有它的道理。譬如你随手扔出一个石子,若能充分的计算投掷的角度、力度、风速、石子形状、地面摩擦等因素,理论上可以精准预测它终将停于何方。

基于这样的理念,一些科学家热衷于创设各种模型用来模拟历史再现,或是用于预测未来。科幻小说中关于“创世模型”的情景可谓比比皆是。现实世界中,芝加哥大学化学家Stanley Miller也曾做过一个著名的实验,在烧瓶里添加化学气体并制造人为闪电,模拟早期地球的大气环境,观察地球生命最初是如何起源的。

尽管有这么多的尝试在前,可是自然世界的复杂性绝非任何计算机模型有能力模拟出来的。某些细小之极的差异,有可能在一个复杂性系统里被放大,导致面目全非之果。这方面亦有一个很知名的例子,60年代美国数学家Edward Lorenz用计算机做了一个气象模拟实验。他的前提是,若输入同样的气象参数,且告诉计算机这些气象参数如何相互影响,理论上,计算机能重复“制造”出一模一样的气象结果。

如果这个模型足够稳定,那么人们也许可用它预测未来的气象风云了。

Lorenz很意外的发现,尽管每次都输入同样的参数,但模型输出的结果每次都不同。换言之,该模型无法很好的预测未来气象。Lorenz后来发现了原因,原来计算机存储数据时,保留到小数点后6位,而Lorenz只输入了前三位。比如某个参数的初始值是0.293416,Lorenz输入了0.293,于是,这个细小的初始差异造成了下面的结果:

在图中,系统的某个初始值只发生了极微小的变异,这种差异的来源可能是完全随机的、无法预料的。起初,两次模拟的拟合度很高,几乎是重叠的线路,但是慢慢的开始分叉了,到最后,人们看到迥异的路径结果。

在自然界尤其是人类社会这些复杂性系统之中,随机性因素引致的蝴蝶效应,对机械式的“决定论”提出了很大的质疑。但是,人们总是对随机现象视而不见,人们更愿相信,一件事的发生肯定有它的模式,肯定有一些“背后的理由”。

这方面我最近读到一个很有趣的例子是二战时期,1944年,德国新研制的V-2火箭对伦敦进行大范围的袭击。这种火箭的速度极快,是音速五倍,还没听到火箭的呼啸声,火箭已击中目标了。

V-2火箭在伦敦市民中制造了广泛恐慌。伦敦的报纸发布了火箭的落点地图:

这个火箭落点图看起来似乎有点规律。市民的猜测是,没有被火箭炸到的地方,也许是德国间谍活动的区域。军方的猜测则是,德国的轰炸重点是关键性的军事目标。

1946年,二战结束之后,英国统计学家Clarke对V-2火箭的落点做了一个研究。他把伦敦地图分割为576个小块,每块边长半公里。在这些小块里,有229个块区完全没遇到任何轰炸,而有8个块区被轰炸了4次以上。他的统计分析结论是,这份轰炸地图其实是遵循了随机性分布的原则,换言之,不存在任何有意义的轰炸模式。V-2火箭没炸到的229个块区并没有德国间谍,而被重复炸了4次的块区也不是什么重要的军事目标。

与V-2火箭相仿的关于 “随机vs模式”的例子,是英国数学家GeorgeSpencer-Brown提出的一个模型。这个模型是一个计算机随机生成的数字序列,序列只有0和1 两个数字,类似于01001101010010111010……这样的没有任何规律的序列。

但是,如果这个随机序列足够的长,例如数字的个数多达10的1百万次方,那在这个超长序列里,你至少将有机会看到10次漫长的0的出现,每一次漫长的0都有1百万个,连绵不断。

想象一下你漫步于0和1的无规律交替的数字序列之中,突然间你遇到了1百万个连续的0,是什么感觉?

你的第一印象很可能是,计算机程序搞错了吧,怎能出现这般有规律的分布?实际上计算机模拟的随机序列并没有出错,此间的关键点在于:一个完全随机的过程,在概率上是完全可能产生出“看来”极有规律的结果。

当这种“有规律”的结果屡屡出现于人类生活各个层面,人们用各种理论和原因对这些现象进行事后解释,并且以为找到了因果律。人们总是遗漏一个简单的事实:某些规律只是随机性制造出来的幻觉,您以为看到了精妙的“凌波微步”,而真相也许只是踉跄的“醉汉漫步”。

明白这个道理可帮我们看清一些社会问题。

譬如在体育比赛中有一个有名的“热手效应”(hothand effect),指某个运动员连续性的发挥优异。比如,在一场篮球赛里,某人连投连中,这时他的状态就被称作“hot hand”。

人们普遍相信存在所谓的热手效应,这效应本身亦符合人类的常识:打球时突然感觉来了,怎么打怎么有,听来也属合理。况且,一个人发挥越好,同伴更愿传球给他,他的得分机会就会越大。

1985年,美国的认知心理学家Tversky研究了棒球赛的球员得分序列,发现那些被称作“热手”的球员,其得分规律在统计上,与抛硬币产生的随机序列并无实质的差异。

这个统计分析并不复杂,需要计算的是一个条件概率。这意思是,球员出现一次成功得分之后,下一次得分的概率有多高。该条件概率必须高于该球员的整体得分概率,才能证实热手效应。而Tversky的研究证明,尽管人们给热手效应赋予了许多看似合理的解释,实际上,这个效应只是一种假象。

在金融和经济领域,亦有众多类似的热手假象。这些假象已经被许多的实证研究揭破。以股票基金的投资业绩为例,1991-1995年美国800家股票基金按相对获利能力排名,可以绘成如下表格。

此表取800个基金的平均收益率为横轴(0),左侧是高业绩基金,业绩高于均值。右侧是低业绩基金。

时光回到91-95年间,高业绩基金的经理就像体育赛事的“热手“运动员,他们肯定能讲出许多成功之道,比如选股策略好、行业研究水平高、财务模型更准确、等等。

同样800家基金,针对它们未来五年的真实业绩(1996-2000年),再绘一个图表,就变成这个面目皆非的样子。

显然,用基金的历史业绩预测它们的未来,一准儿要大面积的测错。大量的明星基金在未来五年的业绩很低,而曾经很差的基金,未来不乏成功者。简言之,历史上的高下秩序在未来的时空全部土崩瓦解,基金的业绩不存在统计意义上的规律,看来更像是一个醉汉的漫步,或曰一个随机的噪音。

除了上面的社会现象,在微观个体的层面,一个人的生平际遇,也充满了随机性。下面这些文艺界大拿的怪事儿,个个都很寸,但这样的事情也同样会发生在普通人身上:

  • 乔治奥威尔的《动物庄园》成为世界名著之前,被美国出版商拒绝,理由是“美国没有人感兴趣买一本动物故事的书”。

  • JK Rowling的《哈利波特》第一部,被出版商拒绝了9次。

  • 美国法律小说大腕John Grisham的《A Time to Kill》成为畅销书之前被拒绝27次。

  • John Kennedy Toole写的《A Confederacy of Dunces》被拒N次之后,看不到前途,选择了自杀。书稿被他母亲保留11年后出版,获得普利策奖,卖出了2百万册。

我最近常听到一句话是“人最重要的是向前看”,一个人不能总被过去的生活困扰。我们的一生遭际可能更像一个醉汉踉踉跄跄的步伐,无从预测踩在何方。历史的轨迹也并没有我们想的那么重要,一个人的过去不管如何曲折变幻,对未来的生活都没有指导意义。

人生到处知何似,应似飞鸿踏雪泥。东坡先生早就看透了。

 



读书好、读好书、好读书 

长按二维码,关注希言槿

希言自然

长按二维码,求打赏 n_n



友情链接