0引言
人类行为具有高度的复杂性和多样性。在以往的社会、经济、通信等领域的研究中,通常认为人类行为发生的时间间隔是满足泊松分布的,出现极大和极小的时间间隔的概率都很小。然而,Barabási在对e-mail[1]和爱因斯坦等人信件[2]的数据实证研究中发现,人类的许多活动具有阵发性,即事件常常在短时间内频繁发生,然后又在很长一段时间里销声匿迹,时间间隔服从幂律分布,这一发现开创了人类行为动力学新的研究方向[3]。国内外学者对现实工作、生活中的人类活动进行了大量的实证和理论研究,不论是在网页浏览、邮件通信等个体行为方面,还是在博客评论、图书借阅等群体或组织行为方面,都得到了人类行为发生的时间间隔服从幂律分布的结论。一些理论模型也被相继提出,这些研究成果丰富了人类行为的动力学机制,使人类对自身行为规律的理解不断深入[4]。但是人类行为动力学研究仍处于发展之中,在团体的组织行为方面尚未有文献报道。
自美国9·11事件以来,恐怖主义已成为一个全球性问题,引起了各国科学家的关注。恐怖袭击是人类活动的一种集体行为[5]。对恐怖袭击事件进行统计研究,是探索其发生根本原因和机制的重要手段。Aaron Clauset等[6]对1968年—2004年的约2万件全球恐怖事件进行了统计研究。发现不论是受伤人数,死亡人数还是伤亡总数都符合幂指数为2的幂律分布。Neil F.Johnson等[7]对伊拉克、哥伦比亚、阿富汗的恐怖袭击事件进行了严重性(伤亡数)统计,得到了近似相同的幂律指数,并提出了一个自组织模型来解释这一现象。Zhu JunFang[5,8]等统计了2003年到2007年间伊拉克和阿富汗的恐怖袭击事件,发现事件的时间间隔分别服从指数为2.61和2.41的幂律分布,并假设恐怖主义的爆发和意见形成有关,建立了基于历史记忆效应的意见动力学模型,对恐怖事件的爆发提供了一个更好的理解。
以往的研究主要是对具体某一国家或地区的恐怖事件进行统计分析,缺乏针对恐怖袭击行为的主体———恐怖组织的统计研究。本文将至少造成1人伤亡的事件作为严重事件,以严重事件数量超过500件的恐怖组织为研究对象,假设各组织发动严重袭击事件的时间间隔服从幂律分布,采用最大似然估计法来计算其幂律指数,采用Kolmogorov-Smirnov(KS)检验法对该假设进行真伪性检验。
1数据来源与说明
本文的恐怖袭击事件数据来源于全球恐怖主义数据库(Global Terrorism Database,GTD)[9],该数据库提供了1970—2010年世界范围内约98 000件恐怖袭击事件数据,涵盖了袭击发生的日期、目标类型、武器类型、事件简况、伤亡数、组织名称等信息,是目前最全面最权威的恐怖事件数据库。在GTD中,将一天内同一地点同一目标的事件定义为一次袭击事件,比如,基地组织发动的9·11袭击事件就因发生地点的不同而作为3次事件记录在数据库中。本文将同一组织在同一天内的多个事件作为一个事件来统计,其严重性为该天内各事件伤亡数的总和,时间间隔τ定义为同一恐怖组织连续发动两次严重袭击事件之间的天数。表1给出了数据库中严重事件数量超过500件的组织名称和时间跨度,时间跨度为该组织首次发动袭击与最后一次发动袭击之间的时间间隔。
本文的恐怖组织详细信息来源于Big Allied And Dangerous(BAAD)数据库[10],该数据库中包含有恐怖组织的年龄、组织规模、意识形态等信息,是目前恐怖组织信息最为详实的数据库。
2参数估计与检验
对于离散型随机变量X,如果X服从幂律分布,则其概率分布为[11]
p(x)=P(X =x)=Cx-α(1)其中,C为常数。在双对数坐标系下,上式表现为一条直线。因此,对幂律指数α的拟合常用的方法就是采用最小二乘法和一元线性回归模型对其统计直方图或Zipf排序分析图进行线性拟合来得到[12],但是越来越多的研究发现这两种方法得到的幂律指数与真实值之间均存在较大差异[3]。对此,我们提出采用最大似然估计法[13]来计算幂律指数,并通过Kolmogorov-Smirnov(KS)检验来判断真伪性,该方法不仅从理论上优于最小二乘法和线性回归模型,而且在实践上也被证明更接近于所估计的参数[14]。其过程如下:
由于x趋向于0时,式(1)发散。假定x≥xmin时满足幂律分布,则通过对常数C标准化计算,可得到:
研究表明,在xmin≥6时,该估计值的偏差极小。
由于xmin是未知的,就需要采用合适的方法来对它进行估计。低估xmin会使得对幂指数的估计不准确,而高估xmin则会舍弃很多有用的样本点。在此,引入KS统计量来进行估计。
KS统计量的基本算法就是要计算两个分布之间的最大距离。即
其中,S(x)为基于样本的经验累积分布,P(x)为拟合的累积分布。使得D值最小的xmin就是估计值x^min。
KS统计量同样可以用于幂律分布的假设检验。此时的S(x)为满足给定幂律条件下(以x^min为最小值,α^为幂律指数)随机产生的分布,P(x)为拟合最好的累积分布。当KS统计量p≤0.05时,拒绝原假设。
3恐怖袭击的时间间隔分布
本文根据该方法对上述9个组织严重袭击事件的时间间隔进行拟合,得到了时间间隔的累积分布(见表2和图1)。
由结果可知,各组织发动恐怖袭击的时间间隔都服从幂律分布,幂律指数在1.8与3.1之间。这说明恐怖组。织频繁实施恐怖袭击通常发生在较长时间静默之后,表现出阵发行为的特点,具有极强的非均匀性,幂律指数越大,非均匀性越强,袭击行为就越具有发散性。统计中还发现,各组织出现较长时间静默都是在组织创立的初始期和组织受到重创的时期(如组织头目被杀、组织内部分裂等)。这是由于在创立初期,恐怖组织的人员较少,各方面条件还不成熟,发动袭击需要较长的准备时间;受到重创时,组织的领导力量削弱,需要长时间的内部调整。
在这9个组织中,只有Taliban是新兴的极端宗教主义恐怖组织,创立时间较晚,每年的袭击数量呈现不断上升的趋势;LTTE于2009年因其组织领导人被杀而解散;FMLN在1994年停止了袭击行动。这说明恐怖袭击的阵发性是一种普遍规律,与恐怖组织创立的早晚、生命周期的长短无关。
图2给出了恐怖组织平均活跃性与幂律指数的关系图,并标识了各组织的意识形态、组织规模等信息。其中,组织平均活跃性定义为该组织发动恐怖袭击事件的总数与时间跨度的比值。
从图中可知,恐怖组织的平均活跃性与幂律指数并不像人类的其他群体行为(如图书借阅[15]、电影点播[16]等)一样具有正相关关系,而是具有高度分散性。这可能是由于恐怖组织是一类特殊的群体,它的活跃性与其自身的发展状态息息相关。从图中还可看出,组织规模大小是影响其幂律指数的重要因素。
10 000人以上的恐怖组织幂律指数最大,100~1 000人的组织次之,1 001~10 000人的组织最小。这说明当组织人数超过一定规模时,组织内部的协调耗费较长的时间;当组织人数少于一定规模时,发动袭击的筹备时间较长,因而其袭击行为更具有发散性,体现在时间间隔分布上就是幂律指数较高。从意识形态看,极端宗教主义的Taliban组织的活跃性最高,极左恐怖主义的FARC和FMLN组织的幂律指数最大。
4结论
本文以恐怖袭击数量超过500件的恐怖组织为研究对象,采用最大似然估计法对其袭击行为的时间间隔分布进行了实证研究。由结果可以看出,各组织发动恐怖袭击的时间间隔均服从幂律指数介于1.8和3.1之间的幂律分布,恐怖袭击行为具有阵发性。通过分析可知,这种阵发性与组织创立的早晚、生命周期的长短无关,组织活跃性与其幂律指数并不具有正相关关系,而组织规模的大小是影响其幂律指数的重要因素。本文的研究为深入研究恐怖组织的袭击模式奠定了基础,下一步我们将建立数学模型来深入分析恐怖袭击行为的动力学机制。
参考文献:
[1]Barabási A L.The origin of bursts and heavy tails in human dynamics[J].Nature,2005,435:207-211.
[2]Oliveira J G,Barabasi A L.Human dynamics:Darwin and Einstein correspondence pat terns[J].Nature,2005,437:1251-1253.
[3] 樊超,郭进利,韩筱璞,等.人类行为动力学研究综述[J].复杂系统与复杂性科学,2011,8(2):1-17.Fan Chao,Guo Jinli,Han Xiaopu,et al.A review of research on human dynamics[J].Comples Systems and Complexity Science,2011,8(2):1-17.
[4] 闫小勇.人类个体出行行为的统计实证[J].电子科技大学学报,2011,40(2):168-173.Yan Xiaoyong.Empirical statistics on individual human travel behavior[J].Journal of University of Electronic Science and Technology of China,2011,40(2):168-173.