学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 农学论文 > 林业论文

林地小班数据质量检查方法设计

来源:学术堂 作者:陈老师
发布于:2016-12-01 共7564字
    本篇论文目录导航:

【题目】林地矢量数据质量控制探究
【第一章】影响林地矢量数据质量的因素研究绪论
【第二章】空间数据质量控制分析
【第三章】 林地小班数据质量检查方法设计
【第四章】林地小班数据质量检查方法实例验证
【总结/参考文献】怎样开展林地小班数据检验研究总结与参考文献
  第 3 章 林地小班数据质量检查方法设计
  
  GIS 矢量数据应用于林业地理信息系统中充分体现其优势,通过综合利用其几何数据和属性数据可以方便有效的进行林地资源数据存储和统计分析,为林业管理部门的工作提供了一种高效的资源整合和业务管理新思路。林地资源统计分析是基于林地专题数据主要是林地小班属性数据进行的一系列信息的综合应用与分析,小班数据的质量保证了林业地理信息分析成果的质量,决定了林地资源统计分析决策的科学性,所以对小班数据质量检查控制的研究特别是针对小班属性数据的质量检查控制具有重要的研究价值。
  
  本章基于上一章对数据质量误差来源和数据质量元素的详细分析,综合分析常用的数据质量检查方法,设计了一种具有通用性的矢量数据质量控制方法,采用软件自动化进行质检辅助于人工编辑方式实现了高效的矢量数据质量控制,并将本方法应用于林地小班数据的质量检查。
  
  3.1 林地小班数据质量检查流程方法
  
  林地小班数据误差主要来自于空间几何数据误差和林地属性数据误差,其中林地属性数据对林地资源统计决策具有很强的决定性,并且小班属性数据与空间几何数据之间、小班数据之间属性具有很强的规则逻辑制约性,所以林地小班数据质量检查不仅针对小班数据的空间关系检查,在侧重于属性数据质量检查的同时更应该进行图属逻辑一致性的质量检查。通过比较选取适宜于林地资源数据进行数据质量检查控制的方法,结合林地小班数据生产实际,形成一种用于林地小班数据质检的基于规则匹配的林地数据质量检查方法。
  
  林地小班数据是一种具有严格规则分布的森林资源数据,小班数据的划分方式决定了小班数据在空间分布上具有行政限制的分布规则,小班数据的空间分布又决定了小班属性内容,小班数据的信息记录形式决定了小班数据中属性项的定义、属性值的填写等。
  
  小班数据体现出的严格规则限制的数据特征也是小班数据质量问题中所暴露的问题,所以通过对小班数据进行分类、整理和提取获取小班数据特征,根据其数据特征制定的检查规则完全满足了小班数据质量检查的要求。通过制定相应的数据质量检查规则数据库可以实现数据质检系统的可定制化操作,通过修改和完善数据质量检查规则数据库在无需调整软件的情况下即可满足多种类似数据的质量检查,提高了质检软件的灵活度和自由度。
  
  将待进行数据质量检查的对素抽象为空间对象和属性对象,然后再将检查对象抽象为几何对象、属性文本、数值三种。在执行质量检查时,针对不同的检查对象应用不同的检查方法进行质检操作[31].通过 GIS 在拓扑分析方面的优势来进行几何对象的检查;通过总结属性项的规律提前编写符合软件编写代码语言规范的正则表达式,最后通过规律匹配来检查属性文本的质量;以值范围界定进行数值匹配。通过这样的抽象大大简化了数据检查操作的复杂度。执行小班数据质量检查后仍需人工交互处理最终的争议性错误数据,几何对象的错误错误可通过小班选中高亮进行区分,以满足人工辅助作业的人眼判断,但属性对象错误的小班数据缺少明显空间几何特征人工无法直接判读,无法满足进一步的人工交互作业,所以仍需要研究将错误小班数据进行可视化表达。
  
  将小班数据错误类型进行归纳、分析、整理合并,将不同属性值的错误通过特殊样式、不同颜色、不同大小的符号化形式进行展现,借助计算机显示技术把抽象的属性数据和空间上的细微差异转换为人眼视力可以直接感受的具体图形。通过构建小班数据质量检查规则数据库和错误小班可视化表达符号库以此满足质量检查和可视化表达,据此实现小班数据质量的自动化质量检查和错误数据规范化的可视化表达,形成基于规则匹配的林业数据质量检查的流程和方法。林地矢量小班数据质量检查流程见图 3-1:
  
  根据小班数据空间和属性多方面的检查规则,由林业领域专业人员参照空间分布规则、属性字段定义规则、属性数据填写规则、图属一致性规则等创建完成小班数据质量检查规则数据库,并同时一一对照完成小班数据可视化表达符号库,以完成错误小班规则化、可视化展现效果。按照检查规则数据库中的小班数据质量检查规则逐条执行规则匹配,违背任一检查规则的小班即可判定为错误林地小班数据,然后根据小班错误类型匹配小班可视化表达符号库中的符号样式,用符号库规定的样式、颜色及大小将错误小班解释成固定的错误表达图形符号,检查规则数据库的建立实现了林地矢量数据的快速、批量化的数据质量检查控制,错误小班数据的符号化处理使得图形定位简单易行,方便了进一步人机交互检查作业,提高了林地矢量数据质量检查的效率,保证了林地矢量数据质量检查的效果。检查规则数据库建立过程见下文。
  
  3.2 林地数据质量检查规则数据库
  
  目前现有的数据质检软件的质检过程通常情况下与系统代码绑定,质检规则产生变动必将引起代码的变动,增加了系统维护的工作难度。为解决类似的规则质检软件存在的这种问题,提高相关软件的适用范围和系统可重用性,本文尝试探索一种新的解决方案,尝试建立一种基于“规则-方案”的质检机制。
  
  从自然科学的角度来观察,知识是一些事实与概念、规则或规律、方法和技术以及应用这些概念、事实、规则等的能力的综合体[32],特定领域的专家知识即是对该领域内的事实与规律具有专业的解决思路与规律的能力。人们大脑中记忆了通过学习的方式获得知识,人利用大量已知的知识应用到问题解决中。在相类似的问题上,如果将人们认识到的问题解决规律通过计算机语言能识别的编码规则表达出来,通过计算机软件读取规则并应用,同样可以实现解决专业问题的目的。
  
  为满足空间数据质量检查的目的通过提前构建数据质检的专家知识规则库,通过编写一定量的软件代码程序,实现知识规则库的读取,制定质检方案利用专家知识规则达到数据质检的目的。空间数据质量检查规则是抽象后封装了待检查数据对象、检查参数和检查方法,它通过执行一个个规则检查操作以发现存在问题的空间数据。质检规则的结构如图 3-2 所示:
  
  3.2.1 小班空间几何质量检查表
  
  空间位置作为空间认知的基础,是将空间对象与其他一般对象区别开来的根本,空间关系则是对空间位置和空间对象行为的一种约束[33].空间关系知识是林业领域小班知识与空间数据质检关系的抽象表达,通常有拓扑关系、方位关系、逻辑关系等几个方面内容[51].在地理要素各种空间关系中,人们认为空间对象间的拓扑关系是空间中最关键的关系,拓扑关系作为最基本的空间关系,所产生的差异是明显,这些差异满足了对其空间位置的检查要求,可用于进行空间位置数据质量检查。
  
  (1)小班空间几何数据质量元素
  
  林业 GIS 中重要的数据来源是遥感影像图,遥感影像等数据源在数据采集和数据处理过程中引入的空间几何误差等使得采集所得的小班数据不可避免的引入了空间几何上的不确定性。小班要素之间存在着各种空间关系规则,主要包含图斑与图斑、图斑与行政界线等,不同要素间必须满足一定的空间位置关系,如,林地小班数据在空间分布上满足多级行政范围全覆盖、小班独立不重叠、小班不交叉等特性,利用林地小班数据在空间分布上的特性,建立小班数据空间几何上的拓扑分布规则,基于拓扑规则验证形成小班数据空间几何数据质量检查方法[52].林地小班空间几何质量元素见表 3-1:GIS 中的矢量数据是一种结点-弧段-多边形的数据结构,它描述了地理实体之间的连通性、邻接性和区域性等[34].GIS 领域中针对空间拓扑检查的研究分析已经很充分,应用任何一个 GIS 平台都可以完成对小班数据的拓扑分析,所以本文不针对空间拓扑检查做太多研究,充分发挥 GIS 技术的优势完成小班数据空间位置错误。林地小班数据空间位置错误类型见下图 3-3:
  
  (2)空间几何质量检查规则表
  
  针对小班数据的空间几何质量检查规则,主要涉及:图层间进行的叠置分析、同图层中不同要素间的拓扑分析等,故针对空间数据质量检查的规则表中应包括两个图层的名称和规则分析类型,利用数据库表中的主外键关系来定义表中的操作类型。所以图层分析类型表和图层显示类型表等附属关系表应该在定义规则表之前完成创建,质检规则表中的分析类型字段作为外键指向了分析类型表中的 ID 主键。空间几何质检规则表的定义见表 3-2:
  
  3.2.2 小班属性数据质量检查表
  
  小班属性数据质量是指关于地理特征和小班信息不能被准确确定的程度,它是自然界各种现象自身固有的属性。在林地数据地图中存在许多属性无法明确界定的目标,如林种、地类等这类本身便存在不确定的目标。
  
  (1)小班属性数据质量元素
  
  每个林地小班数据图层都存在至少一个属性数据配套文件,属性数据文件记录同一要素层中各要素的属性数据。同一类要素通常情况下是位于同一要素层中,同一个要素层只能有一套固定的属性数据项定义,其中的属性项个数、属性项的名称、属性项数据类型等都是固定且相同的。通过检查数据图层的属性质量即能保证各要素的质量,故本文的数据属性质检操作针对的数据图层的质检。小班属性数据质量检查又可划分为以下几种:
  
  1. 属性项正确完整性检查
  
  林地小班属性项正确完整性检查主要检查属性文件中各属性项是否定义正确、现有属性项是否全面、是否满足业务需求等。 属性数据质量的检查规则可分为多个方面:
  
  属性字段的数量、属性字段名称检查、是否可空、是否必填、属性字段定义的正确等检查。根据 GIS 矢量数据的存储规则,属性存储中属性字段的定义和完整性是正确且完整存储属性数据的基础,故进行属性质量检查应首先进行属性字段项定义的检查。
  
  2. 属性值正确性检查
  
  小班属性值正确性检查主要是检查各小班属性值的填写是否完全、是否符合现实情况、能否满足林地统计分析应用等。属性值检查规则主要包括:属性值空值检测、属性长度判断、属性值数值范围不超限等。
  
  小班属性数据的质量元素类型见下表 3-3:
  
  (2)属性质检规则表
  
  小班属性数据质量检查主要进行属性项和属性值检查两个方面。
  
  1. 属性项检查;
  
  属性项检查主要检查属性表中字段是否全面,本文采用数据表“多对多”的形式进行属性项判断,针对待检查数据图层在数据库中分别定义一张属性项定义表,如表 3-4,表中记录了图层应该包含的所有必需字段项,然后通过规则表--关系表--属性项的关联关系,如表 3-5,通过一对多关系表完成对数据属性项值的检查。
  
  2. 属性值检查;
  
  小班数据属性值包括值范围和枚举数据类型,其中属性值范围可以通过 SQL 数据库语句进行规则定义;针对枚举数据类型的属性值需提前定义字段填写可能使用的枚举值,然后通过多对多关系表进行属性枚举值的判断。
  
  3.2.3 图属逻辑一致性检查表
  
  图属逻辑一致性检查主要检查数据所记录的属性信息与其几何位置是否保持一致,是在完成小班空间几何拓扑检查和小班属性完整性检查的基础上结合几何要素和属性表内容进行的图属逻辑一致性的质量检查,主要检查内容包括:
  
  (1)属性表中的记录与图形正确匹配;图属的统一性表现在地类小班面积与属性表中的面积一致、属性表中记录的行政位置应位于正确的行政范围内、行政范围内所有小班数据总面积等于其行政覆盖面积等;(2)属性表中编码填写符合编码规则;行政编码符合行政要求、小班的林地类型编码唯一、林场等划分代码填写符合要求等;(3)属性数据间填写相互间不矛盾;各层级划分清晰正确、行政等级划分正确、林场和林地划分正确、林种划分正确等编码填写符合实际地类等。
  
  小班图属逻辑一致性检查质量元素见下表 3-8:
  
  3.2.4 数据可视化表达符号库
  
  符号化是地图数据处理中重要一项内容,数据生产和使用要想能够高质高效完成,数据的符号化表达是必不可少的。作为地图表达的基本手段,符号化可以由形状、尺寸、色彩有区别的图形或文字组成,它最大的特点是直观形象、一目了然。可视化的手段可以将已有不明显的规则用区分明显的图形表示出来,以便于人眼识别和理解。这样的表现形式方便人们对比观察各种自然、社会现象的空间分布,更容易比较发现其中客观存在的规律,获得深层次的信息,获取新的知识内容[35].
  
  林地小班数据是破碎面状的矢量空间数据,由于斑块数目众多且空间特征不明确,为方便人们观察和研究林地小班数据,通过对比以发现和处理错误小班数据,特别是错误属性数据的符号化表达,通过符号化上的区别来表达小班细微的差异,并反映各小班数据间的分布特征及相互间的拓扑关系,故本文研究构建了小班数据可视化表达符号库[54].
  
  通常情况下,在 GIS 平台中进行要素的符号化表达主要有两种方式[35]:一是在平台软件中提前定义好符号样式,在业务软件中通过代码直接调用现成的符号样式进行表达,所以此种方式增加了代码编写量同时固定了符号表达的样式,无法实现灵活多变的符号化表达;另外一种是通过设置符号的尺寸、填充空隙、填充要素等参数,实现定制化的符号化表达,此种方法实现了灵活地质图层符号的目的,填充符号化表达适用于规则化的简单样式。
  
  根据小班数据符号化表达的要求,在规则库中定义好的符号搭配参数结构表,指定默认参数值用于默认情况下的符号化表达,同时支持用户进行自定义符号参数结构和进行符号参数的修改。用户可直接编辑符号参数表中的参数值,实现不同工作内容不同的显示效果。由于该项工作专业性更强,所以需要由专门的技术管理人员具体负责能够保证错误检查类型的全面性,保证整批任务的统一,优化数据质量检查效果。
  
  基于 ArcGIS 平台进行林地数据质量检查软件的开发,采用参数化设计的实现方式,构造了一个地图符号化模块,依据地图符号化要求,用户可新增或修改符号样式参数结构表,填写和修改样式参数表中的参数值定义完成针对不同小班数据的符号化表达。
  
  3.3 成果输出预定义库
  
  林地资源成果数据的整个生产过程需要经过林地小班数据合并编辑然后经验证通过林地成果数据质检要求,经历了数据编辑和数据质检此时的林地资源成果数据才达到进行资源信息统计输出的要求。按照林业领域对成果数据的提交要求,林业成果数据通常情况下包括几类:
  
  (1)上级林业部门要求的固定格式原始数据;(2)多种林地面积统计报表;(3)固定配图样式的林统专题地图。
  
  以上几类林地成果数据都具有明确且固定的文件格式和地图样式要求,以往的林地数据处理系统中最终的林地统计数据在输出后多数仍需要经过人工以完成文件格式调整和统计专题地图的编辑后制图打印,人工交互式进行成果数据修正,增加了工作量并且无法保证成果数据的统一规范性。本文拟尝试通过定义成果数据的统计项和结果输出样式,利用“模板式” 进行成果格式定义,通过外部编辑设计好结果数据的样式,进行成果统计制作时通过调用统一的样式文件实现成果数据的统一性,减轻后期人工干预的工作量。
  
  本文预想并设计实验系统是基于 ArcGIS 平台进行针对林业领域的二次开发,故本文中的数据格式和专题图制作都遵循 ESRI 的数据和显示要求,故可以提前利用软件设置统计表格式、完成林统专题地图样式的配置,然后将样式文件进行保存,通过成果输出预定义库中编写数据统计和输出文件格式的逻辑关系,最终实现在系统中进行指定数据项的结果统计并且导出结果数据时利用固定格式的样式文件进行统一性格式的结果文件导出。
  
  3.4 林地小班数据质量检查系统
  
  GIS 数据质量检查的数据检查方面和检查过程具有纷繁复杂的特性,简单条理性的数据质检系统无法满足具有明确数据特征的空间数据(如:林地专题数据)的多方面数据质量检查的要求,故进行合理的系统设计对 GIS 数据质量检查系统的实现是必不可少的。
  
  面向对象的设计思想是指在相互交互的前提下不同对象能保持对象各自拥有自己的状态[37]
  
  ,这样的设计思想中我们不再需要编写统计的方法来显示或者调用构造或析构函数。应用该技术开发设计的计算机软件系统就称之为面向对象系统,这样的系统是一种信息隐藏技术的体现,它明确区分了系统设计人员和应用程序员之间的职责,设计人员只需明确其要提供的服务界面,而应用程序员只需利用所提供的服务接口实现整个系统的开发工作。面向对象技术实现了设计的重用和代码的重用,带来了更快的开发速度、更高的质量、更简单的维护和修改。
  
  在 GIS 领域中,空间数据是对现实世界实体的反映,数据处理的过程也是人类追求对世界实体进行更加客观表达的过程。逻辑检查可以逐一对调查基础数据进行质检操作,是森林资源二类调查内业统计工作中是最全面也是最必要的一种检查措施。故本文采用面向对象技术对基础调查数据和数据质量检查过程进行抽象化表达和模块化设计,采取类似于人类解决问题思维方法的思路方法进行数据实体的表达和系统的开发,将复杂的系统问题进行问题分解,将复杂功能拆分为多个系统功能的组合,满足系统功能可靠、丰富、可移植的要求,开发出一款功能丰富、性能稳定、易于重用和维护的林地数据质量检查系统,数据质量检查系统逻辑设计如图 3-5.
  
  在上文中对林地专题数据特征进行了详细论述,提出了基于规则的林地数据质量检查流程方法,介绍了林地数据质量检查规则数据库建立的基础根据,故在下文中设计完成了一款采用面向对象设计和基于规则匹配相结合的的林地小班数据质量检查软件。构建了适合于计算机编程方法进行重用和修正的数据质量检查规则数据库,通过数据库表和表间的相关关系以及数据库间相关关系,将这类具有明确数据质量规则的空间数据质量检查因子归纳分类后填写到对应的数据质量检查表中,通过所记录的规则以判断其是否符合林学原理,过滤筛选出不符合林学原理的小班数据。在进行系统设计的同时又设计了数据可视化表达符号库,根据数据质量检查规则定制符号化显示的样式,不同规则下的错误小班数据分别进行可视化表达,在符合林地原理和制图美观要求前提下方便了人工交互进行数据编辑操作。下章内容将对林地小班数据质量检查系统进行详细陈述,验证了林地小班数据质量检查流程方法的可用性。
  
  3.5 本章小结
  
  本章首先介绍了所设计的林地小班数据质量检查流程方法,然后针对数据质量检查方法中所用的规则检查库建库过程进行了详细介绍,最终介绍了根据所设计的数据质检方法所实现的林地小班数据质量检查系统,设计实验进行验证所设计的数据质量检查方法的可用性。本章通过论述林地数据质量元素及其各子元素,并依据各质量元素将林地数据质检分为了空间几何检查、属性数据质量检查和图属逻辑一致性检查等三大方面,并依据三方面数据质量检查规则对林地小班数据进行归纳总结以形成适用于林地数据进行数据质检的质量检查规则数据库。为满足数据可视化的要求,本文同时设计了一种用于错误小班数据符号化表达的数据可视化表达符号库, 通过形象直观、一目了然的符号完成小班数据的可视化,同时突出其中的错误数据,实现了错误林地小班数据高质高效地进行数据处理。为保证结果数据输出的统一和规范,本文设计了成果输出预定义库,通过提前的样式设计保证了最终成果数据的一致性。在文章的最后提出了用于进行实例验证的森林资源信息管理系统,根据前文所设计的流程方法综合运用所设计的数据库完成实验系统的设计,森林资源信息管理系统的研制过程和效果展示将在下章内容中进行详细介绍。
相关标签:
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站