稳定分布与广义中心极限定理
![]() |
一、真的是幂律吗?
幂律分布是复杂系统中一种非常常见的现象,例如收入的分布、地震等级的分布、单词使用频率的分布等等,几乎横跨了从自然到社会的多种学科(关于幂律分布的实证分析,请参看Mark Newmann的文章[1],有关幂律分布成因的讨论,请参看这里[2]。我们集智也曾对幂律分布进行过讨论,参见1、2)。
然而,幂律分布真的那么普遍吗?随着对大量数据的收集,我们发现,所谓的幂律仅仅适用于分布曲线的高端部分(也就是x很大的部分),这一点从分析幂律分布的数学表达式也能看出来。我们知道,如果f(x)是幂律的概率密度函数,那么:
f(x)=cx-α (1)
假如x表示的是社会上人们的收入,那么显然x有可能取0(社会上存在着收入为0的人)。但是,这在幂律分布公式的角度来看是不可能的,这是因为对于α>0,即x上面的指数是一个负数,这样就意味着,当x趋近于0的时候,f(x)的值会很快趋近于无穷大。所以,在幂律分布中,x必须大于等于一个常数m,这就意味着,幂律分布实际上只适用于尾端部分:x>m。那么人们自然要问,收入低端的分布是什么样的呢?难道,收入低于m值的概率是0?低收入的人们都死绝了吗?
事实不是这样的,Yakovenko等人[3]用美国真实税收情况估计出的收入分布曲线如下图:
![]() |
美国收入分布的累积概率图,图片来源[3]
这是1997年Yakovenko等从美国税收数据推出的整个美国收入分布的曲线。其中,横坐标是收入的数据值,纵坐标是累积概率分布,也就是收入大于横坐标x的人口比例。我们看到,收入分布曲线分成了明显的两段,第一段是左边的那段弧形曲线部分,第二段是右下角的直线。由于图中的坐标是双对数的,所以直线段是幂律的,也就是作者标出的Pareto部分,而第一段是曲线的,因而不是幂律的,作者称这部分为Boltzmann-Gibbs分布,也就是指数分布。为了看清楚低端是指数分布,作者用小图表示出了在横坐标轴不取对数,纵坐标轴取对数的图,我们知道指数分布在这样的半对数坐标下就变成了直线,因而收入的低端应该是指数分布。
不仅仅是收入分布,很多以前被看作是幂律分布的系统,例如股票收益率的分布、复杂网络上节点的度的分布等等都存在着这种尾端趋近于幂律,头端则明显偏离幂律的现象。人们不禁要问,难道这些实证上的分布真的是幂律的,还是有其它的分布?
二、稳定分布(Stable Distribution)
当你与真正的统计物理学家或者数学家交流的时候,会发现,他们更多地提及一种称之为Levy Stable Distribution或者叫α-Stable Distribution的模型[4]而非幂律分布。例如,大名鼎鼎的Mandelbrot在1967年的时候就曾经用这种Stable分布来拟合棉花期货价格的波动分布[5]。经济物理学之父H.E. Stanley和Mantegna曾用结尾Stable分布来拟合股指波动的分布[6]。
为什么这些数学、物理学家都更倾向于稳定分布而非幂律分布呢?原因是,这个稳定分布的概率密度函数恰恰具备尾端趋近于幂律分布,而在头端(xà0)偏离幂律,趋向于指数分布的性质。
阅读全文,请到:
http://www.swarmagents.cn/bs/membership/viewelite.asp?id=16660&user=jake&cid=19