第 2 章 概念阐释与理论基础
2.1 大数据概述
人类社会发展到今天,数据已经突破了时间和空间的限制,遍布于人类生活的各个方面,并成爆炸式增长。人类历史从未像今天一样被如此庞大的数据包围,大数据时代已经到来。
2.1.1 大数据的概念
近年来,大数据作为一个热门名词越来越多的出现在我们的视野中并被各个领域所运用,然而其火热程度并不代表对其研究的成熟。恰恰相反,对于大数据的概念仍然存在着许多争议。单从字面意思来看,大数据无非是指规模庞大的数据,但就这一名词的提出和其运用的现状来看,其概念远非字面意思这么简单。维基百科定义,大数据是指无法用现有的软件工具提取、储存、搜索、共享、分析和处理的海量复杂数据集合.
与传统数据相比,大数据在数据量、结构、模式、处理方式等方面发生了质的变化。
从数据规模来看,MB、GB 等计量单位已经无法满足大数据的需求,现在通常以 TB、PB(1TB=1024GB,1PB=1024TB)为计量单位;从数据结构来看,大数据所包含的数据已不仅仅是以结构化数据为主,半结构化和非结构化数据所占的比例越来越大;从数据模式来看,大数据的数据模式不再是一成不变的,而是随着数据量的增长不断变化,并与数据相互作用;从处理方式来看,大数据时代已不再仅仅是用一种方式来单纯的处理数据,而是将数据作为一种资源,利用不同的方法更有针对性的来解决各类问题。由此可见,通俗来讲,大数据就是遍布于各个领域、种类繁多、规模庞大、无法用现有手段充分整理应用的各类数据。
数据库专家吉姆·格雷提出的继实验、理论、计算机后的科学研究的"第四种范式",将大数据阐述为一种数据密集型科学,四种范式的比较如表 2-1 所示。由此可见,第三种范式向第四种范式转变的实质就是由以计算机为中心转变为以数据研究为中心。数据已不仅仅是作为处理的对象,而需要我们将其当作一种资源,运用数据思维来开发,从而解决各类实际问题。
2.1.2 大数据的特征
关于大数据的特征,"4V"是目前业界比较认可的,即数量大(Volume)、种类多(Variety)、速度快(Velocity)、有价值但价值密度低(Value)。
第一,大数据的数据量巨大。大数据的规模和容量远远超出传统数据。我们常听说以"海量"数据来形容现今的数据规模,数据的计量单位也早已经跃升至了 TB、PB 乃至 ZB.
第二,大数据的数据种类繁多。大数据产生于社会生活的方方面面,来源极其广泛,种类极其丰富。除了传统的数字、符号等结构化数据外,图像、音频、视频、网页等非结构化数据所占的比例越来越大。
第三,大数据的生成和处理速度快。大数据数据流的产生是快速实时的,而与传统数据的批处理模式不同,大数据产生的快速实时性往往也需要采用快速实时的处理模式,即流处理模式。因此,处理工具也在不断演进,软件工程和人工智能等均有介入。
第四,大数据是有价值的但价值密度低。研究大数据的目的最终是将数据资源应用于解决实际问题,数据量越大,针对某一实际问题的相对的价值密度就越低,如何提取分析海量数据中有价值的数据,成为我们研究大数据的一个重要问题。
2.1.3 大数据的产生
数据库的应用,是数据处理过程中一项质的飞越,它使得原本复杂的数据处理变得较为轻松快捷。从应用数据库管理数据开始,数据的产生经历了三个阶段,也正是数据产生方式的变化,最终导致了大数据的产生。
第一阶段为运营式系统阶段。这一阶段,数据的产生往往是伴随着一定的运营活动的,如电信商的运营记录、银行的交易记录、医院的治疗记录、超市的销售记录等。这些数据的产生方式是被动的。
第二阶段为用户原创内容阶段。互联网的普及开创了数据产生方式的第二阶段。博客、微博、微信等新型社交工具的出现,激发了用户产生数据的意愿。平板电脑、智能手机的应用,为用户随时随地接入网络发表数据提供了更为便捷的手段。这一阶段数据的产生是主动的。
第三阶段为感知式系统阶段。随着技术的不断创新,各类传感设备已经遍布于社会生活的各个角落,我们的一举一动可以说都已经不再是秘密。这些传感设备时刻监控着社会的运行状态,源源不断的产生着各种数据。这一阶段数据的产生是自动的,我们目前正处于这一阶段。
简而言之,数据的产生经历了被动、主动、自动三个阶段,它们共同作用产生了大数据,而自动式数据的出现,才是大数据产生的根本原因。
2.1.4 大数据与互联网的关系
研究大数据,就不得不提到互联网。正是因为互联网的迅猛发展与普遍接入,使"大"量数据的获取、汇集、传输、存储、处理、分析、应用等变得越来越便捷,大数据才逐渐发展为一门新兴学说,更成为决策和预测问题的一种新手段、新方法。而大数据的出现,也正是互联网发展到当今这一阶段的一种特征和表现,代表了互联网的发展程度。大数据与互联网的发展是相辅相成的。
一方面,互联网的发展催生了大数据,是大数据发展的前提。由数据的产生发展过程不难看出,用户原创内容阶段和感知式系统阶段是离不开互联网的普及和发展的。而这两个阶段也是大数据产生的重要阶段。互联网应用发展过程中产生了各类数据,而各类数据又在互联网的传输、聚集、处理、应用过程中数量不断扩大、内容不断丰富、价值不断积累。这些在数据中积累的价值,正是研究大数据理论所最终追求的。
另一方面,大数据推动着互联网的发展,体现着互联网的发展程度。大数据的发展为互联网产业提供了更多资源、服务和支撑。举一个简单的例子,在 LBS(Location BasedService)系统的使用过程中,用户可以运用 LBS 定位导航,规划自己的行驶路线,而用户在使用该系统过程中所产生的数据则通过网络返回到开发商手中,这些数据反映着用户的兴趣、偏好、常用路线等,为开发商分析、维护、完善其系统和产品提供支撑。大数据的蓬勃发展,使原有的互联网技术在数据分析处理过程中变得相形见绌。在大数据蕴含的巨大价值的推动下,为了有效获取、传输、处理数据,传感器、云计算、社会化媒体等智能新技术应运而生,推动互联网发展进入了一个新阶段。
由此可见,大数据与互联网有着密切的联系,可以说没有互联网就没有大数据。因此,在研究大数据对国家安全的影响时,我们决不能抛开互联网这个前提,孤立的研究大数据,而是应该将互联网和信息技术融合进来,使得研究更为完整,更有说服力。
2.2 国家安全相关概念辨析
从国家诞生的那一刻起,国家安全也应运而生。从古到今,国家安全也一直处在发展变化之中,而且到了当代社会,其发展变化的速度进一步加快,其内容和形式也越来越丰富。正如***总书记所讲的"当前我国国家安全内涵和外延比历史上任何时候都要丰富,时空领域比历史上任何时候都要宽广,内外因素比历史上任何时候都要复杂。"
2.2.1 国家安全的含义
据英国学者 Peter Mangold 在《国家安全与国际关系》一书中考证,"国家安全"的现代用法最早出现在美国报纸专栏作家李普曼 1943 年的着作《美国外交政策》中。第二次世界大战结束后,这个提法才构成国际政治中的一个常用标准概念.
目前业界对"国家安全"的定义还存在争议,认为面对不同的主体、不同的场合、不同的时代,"国家安全"的定义是不同的。美国出版的《国际社会关系百科全书》中是这样定义"国家安全"的,即"一般是指一个国家保护它的内部社会制度不收外来威胁的能力".美国前国防部长哈罗德·布朗在《思考国家安全》一书中认为:"国家安全是一种能力:保持国家的统一和领土完整,基于合理的条件维持它与世界其他部分的经济联系,防止外来力量打垮它的特质、制度和统治,并且控制它的边界".日本警视厅在解释日本的国家安全时认为:"所谓我国的国家安全,应该理解为用军事以外的手段保卫我国的领土,国民的生命、身体和财产不受侵犯,或者指我国的基本政治组织的永存。"前苏联出版的《大百科全书》指出:"保卫国家安全,即保卫现行国家制度、社会制度、领土不可侵犯和国家独立不受敌对国家的间谍特务机关以及国内现行制度的敌人破坏所采取的措施的总和。"由此可见,各个国家对国家安全的界定是由广义概念和狭义概念之分的。
狭义上的国家安全概念,是从特定意义上的国家安全工作出发的,即隐蔽战线上的情报工作和侦察保卫工作,通俗来说就是反间防谍、刺探情报的工作。各个国家都有从事这项工作的专门机构,比较着名的如美国的国家安全局(NSA)和中央情报局(CIA),俄罗斯联邦国家安全局(原克格勃,KGB),英国国家安全局(原军情五处,MI5)和秘密情报局(原军情六处,MI6)等。
而国家安全广义上的概念则比较复杂。国家安全,是由"国家"和"安全"两个词语组成的复合名词,可以通过研究以上两个词语的含义,来概括"国家安全"广义上的概念。
国家在世界各地不同的历史时期有着不同的表现形式,例如中国春秋战国时期的诸侯各国的国家形式、古希腊的城邦国家形式等。国家安全中的"国家"是包含了国家在各个地区不同历史条件下的各种形式的高度概括的名词。按照马克思主义的国家学说,国家是阶级斗争不可调和的产物和表现,拥有一定领土、人口和主权,由经济上占统治地位的阶级来统治的有组织的暴力机关。
《现代汉语词典》中对"安全"的解释是:"没有危险;不受威胁;不出事故"."安全"不是一种实体存在,而是代表着一种状态,它必须依附于一定的主体。主体处于安全状态,即主体没有危险,不受威胁,不出事故。要使主体达到这种状态,既要排除外部的各种侵害和威胁,也要保证主体不因自身内部的原因而处于危险状态。"安全"这种状态是客观的,是不以人的意志为转移的。
当安全的主体是国家的时候,便构成了国家安全。因此,广义上的国家安全就是指一个国家处于没有危险的客观状态,并且有保持这种状态的能力。这个含义包含二层意思。
从客观来看,是指一个国家处于没有危险,不受威胁,不出事故的安全状态,也就是国家既没有外部的威胁和侵害,也没有内部的混乱与疾患的客观状态。外部威胁和侵害主要是指处于一国之外的其他社会存在对本国造成的威胁和侵害,如其他国家、外部社会组织和个人等。内部的混乱与疾患是指国内的动乱、骚乱、暴乱、政经危机、疫情等。只有在内外两方面都不存在危险的条件下,一个国家才可能安全。
从主观来看,是指一个国家拥有保持维护其安全状态的能力,既一个国家既拥有能够抵御外部的威胁和侵害的能力,又拥有能够避免内部的混乱与疾患的能力。这种主观与客观概念的结合,才能完成的诠释国家安全的含义。
2.2.2 国家安全的产生与发展
国家安全是伴随着国家的出现而产生的,它是一个国家生存和发展的前提,是统治阶级统治国家的根本保障。随着人类社会由奴隶制社会到封建社会,进而到资本主义和社会主义社会的发展,政治、经济、军事、文化、科技等方面的客观条件也不断变化,国家安全的概念和内容也在不断的复杂和丰富。
奴隶制国家是人类历史上的第一种国家形式,奴隶制国家的国家安全自然就是国家安全的第一种类型,包含了国家安全的源生内容。国民、政府、经济、军事、领土、主权这些内容在奴隶制国家已经存在,相应的奴隶制国家的国家安全也就包含了国民安全、政治安全、经济安全、军事安全、领土安全、主权安全,这些都是国家安全的源生内容。
进入封建社会时代,除了传统的国家安全内容外,人们开始逐渐意识到自身的文化安全问题。特别是在中国、日本等东方国家封建社会晚期,已经注意到自身传统文化与西方文明的差异,开始抵制西方国家的文化侵略,例如抵抗西方国家的宗教传入、社会政治思想等。在这一时期,文化安全成为国家安全的一个派生内容。
近代西方资本主义国家科学技术迅速发展,与资本主义生产方式相互作用、相互促进,给资本主义国家带来了巨大的利润。工业革命,使人类从农业社会进入到工业社会,科学技术给政治、经济、军事等方面带来的巨大发展,让人们开始注意保护本国的科技秘密和科技人才,科技安全成为这一时期国家安全的一个派生内容。
社会主义思潮的出现和社会主义国家的诞生,使国家安全的范围进一步拓展。第二次世界大战后,多个社会主义国家的出现,使社会主义与资本主义两大阵营的冲突更为复杂和尖锐。冷战时期,资本主义国家一直企图通过传播资本主义意识形态来对社会主义国家实行"和平演变",社会主义与资本主义两种意识形态的冲突,成为国家安全的重要特征。