引 言
赛博空间( Cyberspace) 是哲学和计算机领域中的一个抽象概念,用于描述在计算机网络中相互交流的虚拟世界; 其最早出现在加拿大作家 WilliamGibson 的《Burning Chrome》一书中,并被逐渐赋予新的含义。进入21 世纪,美国政府和军方逐渐认识到赛博空间安全的重要性,相继出台了一系列赛博空间作战的政策与计划; 美国国防部与各军种均成立了赛博司令部,并认为赛博空间作为一种新的作战空间,贯穿于陆、海、空、天各个领域且同时存在。在战场维度扩展的同时,以计算机网络为代表的各种军用、民用网络也在不断发展,各类信息交互构成了一个复杂的赛博信息空间,因此,开展赛博空间数据管理技术研究,对数据进行归类、分析、组织、管理,建立赛博空间信息的有序组织,对确保赛博空间信息优势,维护国家赛博空间安全有重要意义。
赛博空间作为美军提出的第五维空间,被认为是美军作战的关键领域,赛博空间防护是国家安全的重要议题。现阶段,关于赛博空间的研究正处于起步阶段,目前最具代表性的是美国国防预先研究计划局( DARPA) 开展的 Plan X 项目,该项目从 2012 年开始执行,其基础研究工作汇集了学术界、国防基础工业、商业科技行业、人机交互等各方面的专家人才; 希望研发新的军事技术,在保护己方赛博空间的同时,能够攻击敌方赛博空间系统,最终实现在赛博空间中完成关键使命、具备指挥控制能力的可操作系统。欧盟也逐步意识到赛博空间在国家安全方面的重要性,建立了欧洲网络信息安全局并赋予其越来越多的职责; 此外,俄罗斯、韩国、印度、日本、中国台湾等国家和地区也都开展了赛博空间对抗的研究。
由于赛博空间属于一个全新的研究领域,需要不断深入地了解,本文描述了赛博空间数据的主要类型,从总体和具体技术上,分析了赛博空间数据的特点; 针对这些特点,研究了规范化存储、语义查询、关联分析、自动组织、共享分发等数据管理技术。本文是对赛博空间数据智能管理的初步探索,为赛博空间数据的相关应用提供了技术支持。
1 赛博空间数据研究
赛博空间是美军提出的一个新概念,目前,各国对赛博空间的认识还处于发展中,从将电脑空间、网络空间等同于 Cyberspace,到现在理解的不断深入; 即使在该研究领域处于前沿的美国,对赛博空间的概念也没有达成一致,仍处于摸索、研究、开发与利用并进的阶段。由于赛博空间的概念与内涵在不断拓展,这里引用美国国防部《四年职能与任务评估报告》对其描述为: “赛博空间是一个由信息基础设施互联网组成的全球信息环境,包括因特网、电信网、计算机系统及嵌入式处理器和控制器。”
作为赛博空间作战四个组成部分之一,赛博空间态势感知是指对能够引起赛博空间态势发生变化的要素进行获取、理解以及预测发展趋势的活动; 从一般程度的警示目标到高度敏感的机密对象,都属于态势感知的处理范围,提供给决策者一种弹性支持,使各级别的决策有据可依。态势感知需要依据大量数据与它们的分析结果以展示当前状态和未来趋势,然而赛博空间与电磁频谱和网络化系统密切相关,具有很多与陆、海、空、天领域所不同的特点,如网络性、不确定性、无界性和高速性等。因此,需要对赛博空间探测数据的种类与特点进行分析,有效地组织与管理这些数据。
1. 1 赛博空间数据的种类
赛博空间涉及面广,信息量大,为了能清晰地表达赛博空间态势,可以将赛博空间态势分为物理层、信息层、认知层、社会层来描述; 赛博空间主要的数据类型有: 节点类数据、软硬件类数据、协议类数据、拓扑类数据、电磁频谱类数据、多媒体类数据、舆情类数据、工作流程类数据、合作关系类数据、行为关系类数据等。
1) 节点类数据节点类数据主要用于描述赛博空间各实体节点的组成与位置情况,包括固定节点( 如信息中心、网络弱电间、固定基站等) 与动态节点( 如导航卫星、通信卫星、移动基站等) 。此类赛博空间数据,一般通过离散数据的形式描述,以记录的形式存储在关系数据库中。
2) 软硬件类数据赛博空间作战是一种多层次、多维度的作战形式,软硬件类数据用于描述赛博空间目标的软硬件信息。例如,软件版本、开发单位、运行环境、分类用途等。此类赛博空间数据能够在更低的维度对实体类数据进行阐释,并在赛博空间的对抗中发挥重要的作用,一般通过离散数据的形式描述,以记录的形式存储在关系数据库中。
3) 协议类数据协议类数据是指遵循某一类协议进行传输的数据,比如按照 TCP/IPv4 和 TCP/IPv6 协议传输的网络数据、按照 Link 16 和 Link 22 等战术数据链协议传输的数据、按照 CDL 和 TCDL 等宽带数据链传输的数据、按照 SADL 等态势感知协议传输的数据,以及按照其它专用数据链协议传输的数据等。此类赛博空间数据,一般通过 XML 对协议类数据进行封装,以文件的形式存储。
4) 拓扑类数据赛博空间中通信网、传感器网、军事信息网等都存在不同的拓扑结构,拓扑类数据主要用于描述网络中各节点在物理上或逻辑上的布局,一方面可以反映节点大小、形状等基本属性,另一方面能够反映节点之间的相互关系。拓扑结构一般分为物理拓扑结构与逻辑拓扑结构。物理拓扑描述节点之间具体的物理连接方式,勾勒出目标系统中态势要素物理连接的状态; 逻辑拓扑不关心节点之间连接的具体细节,而是描述目标系统态势要素之间的相互关系。此类赛博空间数据通常采用有向图或无向图进行展示,可以通过邻接矩阵以记录的形式存储在关系数据库中。
5) 电磁频谱类数据电磁频谱类数据主要用于描述电磁设备发射、吸收的电磁波在空域、频域和能量域的时变场。例如,描述无线通信电磁波在三维空间中分布情况的体数据场等。此类赛博空间数据,一般通过非结构化数据的形式描述,以文件的形式存储。
6) 多媒体类数据多媒体类数据主要用于描述数字化的视觉、听觉媒体。例如,通过文本、图形、图像、声音、动画、视频等数据。此类数据具有种类多、数据量大、格式复杂的特点,计算机一般无法直接理解其内容,可以通过非结构化数据的形式描述,以文件的形式存储。
7) 舆情类数据舆情是一种集体现象,是社会公众意见的集合。舆情同人的社会性紧紧联系在一起,通常难以进行确切的科学分析。舆情类数据是按时间、地区、种群等多种维度分布的数据集合,难以用结构化数据的形式描述,一般通过 XML 对舆情数据进行封装,以文件的形式存储。
8) 工作流程类数据工作流程是指工作事项遵循一系列的过程规则,在不同的执行者之间进行传递和执行; 这种数据用于描述整个或部分工作过程在计算机支持下的全自动化、半自动化。赛博空间的工作流程具有多阶段、多层次、复杂并发性、动态演化性等特点,可以采用形式化方法描述工作流程,一般通过XML 对工作流程对象模型进行封装,以文件的形式存储。
9) 合作关系类数据合作关系是指两个或两个以上独立成员,为实现某个特定目标而形成的一种协调关系。赛博空间的合作关系有隶属、配属、支援、控制、指导、协同、委托代管等基本类型。一般从网络模型的角度对成员间的合作关系进行网络抽象,将各独立成员作为网络节点,合作关系作为网络的边,由此构建出合作关系的网络模型; 此类赛博空间数据可以用邻接矩阵描述,合作关系由矩阵中不同的数据来表示,以记录的形式存储在关系数据库中。
10) 行为关系类数据行为是指在一定的条件下,个体或群体在生活中表现出的基本特征,或对内外环境因素刺激所做出的能动反应,有形式化、半形式化等多种行为建模方法。行为关系类数据可以按照行为主体、行为客体、行为环境、行为手段和行为结果进行描述; 此类赛博空间数据,一般通过离散数据的形式描述,以记录的形式存储在关系数据库中。
1. 2 赛博空间数据特点分析
处于新的作战领域,赛博空间数据具有一定的特点。总体上,赛博空间数据具有数据来源多、格式差异大、种类多样、关系复杂的特点。
1) 数据来源多数据来源多是指赛博空间数据有多种来源。除了已存在的多种赛博空间数据源外,还可以利用声、光、电磁等主要技术手段,获得赛博空间目标信息,并作为数据源。例如,可以通过通信协议分析、信道编码分析、网络拓扑分析、网络嗅探器等多种探测手段获取目标的赛博空间数据。
2) 格式差异大格式差异大是指赛博空间不同种类的数据,其格式存在较大的差异; 属于同一种类的赛博空间数据,也可能因为设备种类、能力、型号、参数等因素的不同,具有不同的格式。例如,赛博空间中,计算机网络数据、预警探测信息、卫星通信信息、导航定位信息、数据链信息等不同种类数据的格式一般存在较大差异; 对于 GPS、格洛纳斯( GLO-NASS) 、伽利略这些同样属于导航定位信息的赛博空间数据,它们之间数据格式也存在差异。
3) 种类多样种类多样是指赛博空间目标涉及面广、属性各异、包括多种数据类型。赛博空间数据有计算机网络数据、指挥控制信息、战场通信信息、预警探测信息、卫星通信信息、导航定位信息、数据链信息、组织构成、社会舆情、主体行为等。例如,赛博空间存在种类、型号、方位、速度等节点类数据,导航系统的名称、版本、厂商等软硬件类数据,预警雷达的工作频率、扫描频率、极化类型等电磁频谱类数据,编队的隶属、协同情况等合作关系类数据。
4) 关系复杂关系复杂是指赛博空间数据彼此之间可能存在一定的联系,在赛博空间中,不同目标具有不同的功能,因此,数据之间的关联关系比较复杂。例如,信息中心通过无线通信设备向各成员发出指令信息,则组织构成、无线通信信息、指挥控制信息、成员主体行为这些赛博空间数据之间存在着一定的关联关系。
在赛博空间数据管理的具体技术上,需要考虑赛博空间数据的结构多样性、主题独立性、领域性、关联性、可继承性、可集成性等特点。
1) 结构多样性赛博空间数据有多种存在形式,数据的结构具有多种类型,即赛博空间数据具有结构多样性的特点。依据赛博空间数据主要的存在形式,数据的结构可以分为三类: 以离散数据形式描述的结构化数据、通过 XML 封装的半结构化数据,以及不适于数据库二维逻辑表描述的非结构化数据; 由于这三类数据的结构存在较大差异,具有不同的组织方法,所以,需要针对结构多样性这一特点,采取能够处理多种数据结构类型的赛博空间数据管理技术。
2) 主题独立性主题独立性是指由于赛博空间作战的特殊性,属于赛博空间的数据,具有赛博空间的主题属性,与其它范畴的数据相对独立。例如,赛博空间探测的数据,其模式信息一般是未知的,可以认为赛博空间探测的 XML 数据为半结构化数据。因此,在管理赛博空间数据时,需要充分考虑数据的主题独立性。
3) 领域性赛博空间数据的领域性是指数据的组织与管理应该面向赛博空间这个主题,定位在该主题领域内。在数据查询中,与通用本体库相比,建立赛博空间领域本体库,利用领域本体的知识可以得到更准确的查询结果。因此,在管理赛博空间数据时,需要考虑数据的领域性这一特点。
4) 关联性关联性是指面向同一目标,处于同一流程中的赛博空间数据,彼此之间可能存在着一定的联系。不同种类、不同数据类型的赛博空间数据之间可能因为面向同一目标而存在着关联关系,也可能因为处于同一流程的某一阶段而存在着关联关系,所以,赛博空间数据管理技术需要能够合理地分析与利用赛博空间数据的关联性。
5) 整体性赛博空间数据需要具有联系的数据项共同构成一个数据集合以描述目标某方面的整体信息,单个数据项的内容在赛博空间中意义不大,即赛博空间数据具有整体性的特点。例如,导航定位软件的数据项有名称、版本、产商、语言、操作系统、插件情况等,需要由这些数据项共同构成一个“软件”数据集合以服务于态势感知等应用,而不是关注单个数据项的内容。因此,需要采取与数据整体性相适的赛博空间数据管理技术。
6) 可集成性赛博空间数据的可集成性是指这些由数据项构成的、用于描述不同信息的数据集合可以相互组合成为新的数据集合,新的集合继承了其组成部分的所有信息; 同时为满足应用需求,也可以将新的集合拆分成原来的各个数据集合,不损失任何信息。
例如,导航定位系统具有软件、补丁、漏洞、硬件等信息,可以由描述这些信息的数据集合共同组成导航定位系统信息目标集合,也可以将信息目标集合拆分为软件、补丁、漏洞、硬件等数据集合。所以,需要针对可继承性这一特点,采取灵活智能的赛博空间数据管理技术。
2 赛博空间数据管理策略
基于以上对赛博空间数据种类与特点的分析,这里研究了赛博空间数据存储、查询与自动组织策略,以服务于态势感知,涉及自然语言处理、规范化存储、语义查询、关联分析、自动组织、共享分发等关键技术。
2. 1 赛博空间数据的存储策略
考虑赛博空间数据的主题独立性和领域性,可以采用领域内数据规范化组织策略来存储与管理赛博空间数据,如图 1 所示。【图1】
依据赛博空间数据的主要存在形式,可以将网点空间数据划分为结构化数据、半结构化数据、非结构化数据三类; 将其中的半结构化数据转化为具有良好模式约束的结构化数据,然后,按照数据结构类型,分别对这三种类型进行处理; 最后,综合三种数据处理的结果,完成赛博空间数据的规范化存储。底层的存储与管理可以采用基于关系数据库和文件系统的组织方式,并提供统一规范的交互接口。
2. 2 赛博空间数据的查询策略
针对赛博空间数据的领域性和主题独立性,可以将本体论的知识引入赛博空间数据查询中,采用基于领域本体的查询扩展策略来检索赛博空间数据,如图 2 所示。【图2】
在基于领域本体的语义查询中,利用本体对赛博空间领域进行建模,构建赛博空间领域本体知识库; 通过概念语义相似度的计算,对查询关键词进行语义扩展; 由查询粒度与查询期望生成限制条件,对扩展查询的结果进行筛除; 最后通过排序、判定得到最终的查询结果。这种方法充分利用赛博空间数据的特点检索数据,避免了只采用关键词进行查询的局限性,使赛博空间数据的管理更加智能。
2. 3 赛博空间数据的自动组织策略
考虑赛博空间数据的关联性、整体性和可集成性,可以将软件工程的思想引入到数据管理领域,采用基于数据构件的策略自动组织赛博空间数据,如图 3 所示。【图3】
首先,通过自然语言处理用户需求,可以得到需要检索的关键词,在赛博空间领域本体知识库与赛博空间数据库的支持下进行语义查询; 然后,对语义查询的结果进行关联分析,并将语义查询与关联分析的结果通过数据构件进行封装; 最后,采用XML 描述文件与数据文件等多种共享与分发的形式,提供用户所需数据。自动组织技术通过提供一种自动组织赛博空间数据的方法,使数据的管理更加智能,用户的使用更加方便。
3 结束语
赛博空间是一个激烈对抗的领域,各个国家已经把发展赛博空间对抗能力提高到了一个新的高度,以利用赛博空间、控制赛博空间、建立赛博空间作战。本文分析了赛博空间数据的种类与特点,研究了赛博空间数据管理策略,从而支持赛博空间数据的相关应用; 由于赛博空间概念与内涵是不断发展的,今后还需要研究更多技术以完善赛博空间数据的管理。