http://ncf007.com

「600654股票」高斯分布与曼德布罗特分布

「600654股票」高斯分布与曼德布罗特分布

本报记者:007财经网

纳西姆·塔勒布认为一个事件要成为极端事件它不仅要稀有或者疯狂还必须是出乎意料的超出我们对可能性的理解而且还会被欺骗许多稀有事件会向我们展示它们的样子我们很难计算它们的可能性但很容易对它们发生的概率形成一般概念当然随机事件或意外事件也可以解释成功并且成为赢家通吃结果的原动力一个人可能完全因为随机的原因而稍稍领先于其他人


在极端斯坦没有人是安全的但是有一些模型存在一种极为天真的东西在所有这些模型中胜者一直是胜者忽略了随机性然而失败者可能一直是失败者而胜者可能被某个凭空冒出来的人取代所以没有人是安全的1957年美国最大的500家公司中只有74家在40年后仍然位列标普500指数只有少数公司因为合并而消失其余的要么衰败要么破产大公司像苍蝇一样不断坠落这个事实真正的原因就在于随机性


当人们谈论随机性时通常只看到运气其实其他人的运气也非常重要另一家公司可能有一项突破性的新产品而走运从而取代了目前的胜者运气是大均衡器因为几乎所有人都能从中受益如果只保护大公司就会把潜在的新来者扼杀在摇篮中一切都是暂时的运气缔造和毁灭了迦太基运气缔造和毁灭了罗马随机性是不好的但并非总是如此运气甚至比智慧更公平如果能严格根据能力获得报酬有可能仍然不公平因为人们无法选择自己的能力随机性能够对社会进行洗牌把那些大人物拉下马


在极端斯坦没人是安全的反过来也一样也没人受到完全失败的威胁现在的环境允许小人物在成功的希望前等待时机——活着就有希望这一思想在克里斯·安德森那里复苏他是极少数指出分形集中存在随机性的人之一互联网严重集中谷歌占据绝对的市场统治地位历史上没有哪个公司如此迅速地获得如此的统治地位谷歌能为从尼加拉瓜到蒙古西南部再到美国西海岸的人服务而不需要考虑电话接线员运输送货和制造这是赢家通吃的终极案例网络带来的除了集中以外的东西也催生了大量准谷歌同时也催生了反谷歌也就是说它使拥有某种技术专长的人能够获得小的稳定的受众群


安德森的长尾理论在改变人们的成功模式上具有根本性的作用它使胜者无法安坐促成另一个胜者的诞生它将永远属于极端斯坦总是被第二类随机性导致的集中所统治但它将是一个不断变化的极端斯坦长尾意味着小人物加在一起能够控制文化和商业的一个不小部分而这得益于在互联网环境下得以存在的小环境和附属专业但奇怪的是它也可能意味着大量不公平大量小人物和极少数超级巨人一起代表世界文化的一部分一些小人物偶尔崛起打败胜者这就是双尾小人物构成的大尾和大人物构成的小尾长尾是极端斯坦的副产品它在某种程度上减少了不公平世界对小人物而言没有变得更不公平但对大人物而言变得极为不公平没有谁的地位是牢固不破的小人物非常具有颠覆性


我们正滑向无序但不一定是糟糕的无序也就是说大部分问题向少部分黑天鹅事件集中我们将拥有更多和平和稳定的时间全球化已经发生了但并不是只带来了好处它导致全球在互相牵制状态下的脆弱性同时降低了波动性并制造稳定的假象换句话说它创造了毁灭性的黑天鹅事件金融机构合并为更少的超大机构几乎所有银行都联为一体金融生态正膨胀为近亲繁殖的官僚主义的巨型银行主导的生态它们通常使用高斯分布进行风险管理——一损俱损银行业集中的加剧似乎有减少金融危机的作用但会使金融危机更具全球性给我们带来严重的打击因此我们将面临更少但更严重的危机事件越稀有我们越不了解它发生的可能性金融业没有明显的长尾假如金融业有不同的生态可以不时破产可以迅速被新公司取代有与网络行业一样的多样化和强韧性我们的情况就会好得多


所谓的高斯分布是指大部分观察结果集中在中等水平附近也就是平均值附近随着对平均值的远离偏离平均值的可能性下降得越来越快呈指数下降传统的高斯方法只关注平均水平把意外当作附属问题高斯分布最容易发生错误理解的地方在于它在尾部事件估计上的脆弱和不足由于钟形曲线的不确定性计量方法忽视了跳跃性或者不连续变化发生的可能性及影响因此无法适用于极端斯坦使用它们就好像只看见小草而看不见参天大树虽然发生不可预测的大离差的可能性很小但我们不能把它当作意外而置之不理因为他们的累积影响如此强大


对于最大值不会与平均值相差太大的变量高斯方法对我们很有用如果数量受到向下的拉力或者存在物理上显示都非常大的数字不会出现那么我们在平均斯坦如果存在强大的均衡力量使得当情况偏离均衡时会被迅速拉回来你也可以使用高斯的方法否则请忘记它这就是为什么大量经济学研究以均衡概念为基础的原因平均值总会涵盖两种人巨人与侏儒所以两者都不会太罕见除非在极为稀少的情况下遇到超级巨人或超侏儒那将是一个偏离单位较大的平均斯坦事件越稀有我们对概率估计的错误越大即使使用高斯方法也是如此


有一种法则叫80/20法则它是一种标志性的幂律19世纪维尔弗雷多·帕累托观察到意大利的土地80%的土地被20%的人占有有人运用这一法则指出80%的工作由20%的人完成或者80%的工作只产生20%的结果反之亦然这一法则后来被约瑟夫·朱兰和其他人概括为帕累托法则20/80法则然后进一步概括为帕累托分布的概念


塔勒布认为从数学公理上讲这一法则的表述不一定是最令你吃惊的它可以很容易地被改称为50/01法则也就是50%的工作由1%的人完成它使世界上看上去更加不公平但这两个法则其实是完全一样的为什么假如存在不平均那么在80/20法则的那20%当中也存在不平均即极少数人完成大多数工作其最终结果是大约1%的人都能完成稍稍超过50%的工作


在平均斯坦中个体不可能对总体产生影响高斯变量的随机性可以通过平均来消除比如在赌场当有大量赌徒时单个赌徒对总体只可能造成微弱的影响其结果是对高斯变量平均值的偏离或者误差不会造成麻烦它们很小可以忽略它们只是在平均值附近作微小的波动标准差的概念在平均斯坦以外毫无意义高斯变量之外不存在标准差即使存在也无关紧要并且解释不了什么其钟形曲线只会满足了那些易上当的人最对简化论的需求还有一些在高斯世界之外没有或者没有重大意义的概念相关性以及更糟糕的回归但它们在我们的方法根深蒂固在商业谈话中不听到相关性这个词是很难的


只需看一看涉及两个极端斯坦变量的历史序列比如债券和股市两只股票的价格或者房地产价格和股市收益率计算这些成对变量在不同子期间的相关性比如1994年1995年1996年等等计算结果很可能表现出严重的不稳定性它取决于计算的期间但人们在讨论相关性时仿佛它是某种真实确定的东西把它实际化具体化赋予它物理属性误用了高斯方法将带来极大的危害人们有可能把观察误差当作满足高斯分布来处理而这要求它必须来自高斯环境比如平均斯坦而其实统计学并非科学更多的是一场智力大骗局世界并不存在高斯分布的普遍性它只是一个思维问题产生我们认识世界的方式


以下请注意塔勒布为原始高斯分布或温和随机性的抛硬币游戏的核心假设


第一核心假设每次抛硬币都是独立的硬币没有记忆前一次得到正面或反面不会影响下一次得到正面或反面的概率你不会随着时间的推移变成更好的抛硬币手如果考虑记忆或者抛硬币的技巧整个高斯世界都会动摇


在社会学中有一个效应叫马太效应这个效应也称累积优势也就是富人容易变得更富名人容易变得更有名这个理论很容易运用于公司商人演员作家和任何从过去的成果中获益的人还有一个理论叫偏好依附这个理论来自罗伯特·默顿对更具数学科学性质的随机性研究偏好依附理论的应用无处不在它能解释为什么城市规模属于极端国度为什么词汇表中只有少数单词被集中使用为什么菌群的大小会有巨大差异等等


塔勒布认为无论是累积优势还是偏好依附这两种理论都假设今天的成功会增加你在未来成功的可能性因此概率取决于历史高斯钟形曲线的第一核心假设在现实中不成立当然在游戏中过去的胜利不会意味着未来胜率的提高但现实中不是这样这就是塔勒布对从游戏中学习概率担忧的原因但是当胜利带来更多的胜利时以原始高斯曲线的情况相比更有可能看到连赢40次的结果


第二核心假设没有疯狂的跳跃比如我们随机步行的步长总是已知的步长不存在不确定性我们不会遇到步长剧烈变化的情况


假如这两条核心假设中有任何一条不满足你步骤比如抛硬币的累积结果就不会得到钟形曲线视实际情况它们可能导致曼德布罗特式的幅度不变的疯狂随机性分形几何学的创始人伯努瓦·曼德布罗特是塔勒布花了近15年时间才找到的另一位伟大的思想家他把许多天鹅变成了灰色曼德布罗特与塔勒布都喜欢研究疯狂随机性和黑天鹅都认为统计学很无聊


分形一词是曼德布罗特创造的用来描述不规则和支离破碎的几何图形分形是几何图形在不同尺度上的重复显示出越来越小的自相似图形小的局部在某种程度上与整体具有相似性比如树叶的脉络看上去像枝条枝条看上去像树岩石看上去像缩小的山峰当一个物体改变大小时没有发生质的变化如果将图形分解为越来越小的图形永无止境你会不断看到能够辨认的图形图形永不重复但它们互相具有相似性一种强大的家族相似性塔勒布将此称之为曼德布罗特随机性他认为可以用曼德布罗特分形理论描述大量的随机性却不必否认它的精确应用分形能够充当默认环境近似和框架它不能解决黑天鹅问题也不能把所有黑天鹅现象变为可预测事件但它极大的淡化的黑天鹅问题因为它使这些大事件更易于理解


马克·布坎南的改变世界的简单法则菲利普·鲍尔的临界点和保罗·奥默罗德的为何多数事情归于失败这三本书都展现了一个充满幂律的世界他们指出许多幂律现象具有普遍性在各种自然过程和社会群体的行为中有一种奇妙的相似性他们提出各种网络的理论支持他们的研究并显示了自然科学中所谓临界现象与社会群体的自我组织之间的联系他们把产生崩塌的事件的过程社会传染病和信息瀑布效益联系在一起普遍性正是物理学家对临界点的幂律问题感兴趣的原因之一在许多情况下既包括动态系统理论也包括统计学模型变量在临界点附近的许多特征独立于相关动态系统临界点处的指数对于同一个群体内的许多系统可能是相同的即使系统的其它方面各不相同三位作者都建议我们使用统计物理学的方法并要像躲瘟疫那样躲避使用计量经济学方法和高斯式的非突破性分布所有的这些塔勒布都赞同


但是三位作者要么得出精确的结论要么鼓吹对精确的追求因此落入了混淆正向过程与反向过程问题与方向问题的陷阱这是最大的科学和认知错误他们并不是唯一的几乎每一个与数据打交道但并不基于这些数据做决策的人都会犯同样的错误这是又一种叙述谬误在缺乏反馈过程的情况下你会认为模型证实了现实塔勒布同意这三本书的观点但不同意他们的应用方式当然也不同意作者赋予它们的精确性实际上复杂性理论应该让我们对现实的精确模型持更加怀疑的态度它不会让所有天鹅变白这是可以预料的它把它们变灰而且只变灰大部分模型都试图达到精准预测而不仅限于描述我们应该避免在对非线性过程进行校准的过程中经常犯的错误非线性过程比线性过程有更高的自由度也就是说你更有可能用错模型


从认知上讲世界对于自下而上的经验主义者来说是另一个世界我们只是观察数据对产生数据的真实过程作出假设根据进一步信息对方程进行校准随着事件的逐渐展开我们把看到的与曾期望看到的做比较发现历史是向前发展而不是向后发展通常是一个低调的过程对知道叙述谬误的人来说尤其如此研究市场中大量存在的未知的强大的不确定性从而理解对心理学概率论数学决策理论甚至统计物理学都适用的随机性的本质我们将看到叙述谬误游戏谬误和伟大的柏拉图化谬误的各种狡猾表现看到怎样从表象进入现实事前假定高斯分布对少数领域是可行的比如犯罪统计学死亡率等平均斯坦问题但对特性不明的历史数据和极端斯坦问题行不通


我们推断在历史数据中没有看到的事情但这些事情仍然应当仍然属于概率王国有一本看不见的畅销书没有在过去的数据中出现过但你必须考虑到它它是对一本书或一种药品的投资可能得到历史统计数据显示的更好的回报但它也可能是股票市场发生比历史上更严重的损失分形随机性是减少意外事件的一种方式它使有些黑天鹅变得更明显使我们意识到它们的影响把它们变成灰色但分形随机性不能产生准确的答案它的好处在于如下几点如果你知道股市可能崩盘像美国1987年那样那么这一事件就不是黑天鹅如果你使用指数为3的分型分布1987年的崩盘就不是意外如果你知道生物科技公司能够研制出一种超级轰动的药物比历史上的所有药物都很多那么它就不是黑天鹅假如这一药物真的出现你也不会感到意外


曼德布罗特的分形理论使我们能够考虑到一些黑天鹅但不是全部有些黑天鹅现象发生是因为我们忽视了随机性的来源有些黑天鹅现象是因为我们高估了分形指数灰天鹅是可以模型化的极端事件黑天鹅则是未知的未知曼德布罗特的方法为我们展现了一线希望一种思考不确定性问题的方式如果我们知道那些野生动物在哪里我们真的会安全许多塔勒布指出他宁愿在大的范围内做得正确而不愿在精确的地方犯错误
 

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。