学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 计算机论文 > 计算机应用技术论文

软件知识库中数据挖掘的运用探析

来源:学术堂 作者:朱老师
发布于:2017-01-03 共2133字
  题目

        文章首先介绍了数挖掘技术,同时将该技术与软件工程相联系,指出了将数据挖掘技术应用到软件知识库中的重要性,并从软件知识库的开发与应用两方面入手,对其具体应用手段与过程进行了分析。
  
  引言
  
  计算机以及信息技术的不断发展,使得数据挖掘技术逐渐出现,将其应用到软件工程的软件知识库中,能够使知识库中的数据得到优化管理与使用,对于软件使用效率的提高极为有利,对该技术具体应用的研究,是提高其应用水平的基础。
  
  1 数据挖掘技术
  
  数据挖掘即在大量模糊的、不完全的、有噪声的数据中,提取出有效知识的一个过程,而数据挖掘技术,则是基于上述过程所产生的一种技术[1].数据挖掘技术与统计分析具有一定的类似性,但并不完全相同,相对于后者而言,前者具有更大的先进性与优化性,能够实现对图片乃至声音的挖掘。
  
  数据挖掘技术的应用包括数据预处理、数据挖掘以及模式评价与知识表示等步骤。数据库、数据仓库、万维网以及其他信息存储库中的信息,会通过数据库与数据仓库服务器,进入到知识库当中,通过数据挖掘引擎,实现数据挖掘,并在完成模式评估的基础上,传输到用户界面,最终完成数据挖掘过程。
  
  2 数据挖掘与软件工程
  
  软件的开发、应用以及维护过程,会产生大量的数据。以软件开发为例,其中主要包括任务数据、资源数据以及源代码数据等。而其应用过程数据量更大。如何对数据进行存储处理,是软件领域面临的主要问题。采用软件配置管理系统以及缺陷跟踪系统等,能够实现对数据的管理,但效率相对较低。采用数据挖掘技术,能够实现对软件整个生命周期的管理。从软件的分析设计入手到密码、调试、测试与错误检验的迭代开发过程,再到软件的维护,均可以采用该技术对软件工程数据进行处理,通过将其存储到软件库中的方法,采用分类分析、关联分析、聚类分析以及概念分析等方法,完成数据挖掘过程,提高软件运行效率以及使用性能[2].
  
  3 数据挖掘技术在软件知识库中的应用
  
  3.1数据挖掘技术在软件知识库开发中的应用
  
  在软件开发过程中,为最大程度满足用户需求,开发人员需要不断演化源代码,这一过程需要以框架的形式,对软件进行管理,因此通常需要大量的文档数据作为保证[3].传统开发过程中,文档的缺乏会对开发过程造成极大的阻碍,增加其困难性。采用数据挖掘技术,可以使开发人员及时的获取相应文档,是提高软件开发效率的主要途径。
  
  数据挖掘技术在软件开发中的应用,需要经过构架理解过程以及系统反射框架过程,使源代码注解到程序静态依赖图,进而使软件的开发过程得以顺利完成。在开发完成之后,需要采用实验的方法,对结果进行评价,在建立评价标准的基础上,对实验结果进行分析,以判断数据挖掘技术应用的有效性。实验过程需要硬件作为支持,CPU、硬盘、软件环境以及实验软件平台均需要选用最新型的技术。以软件环境为例,可采用Windows 7或以上,为软件运行提供保证。可采用java语言编写算法完成实验。
  
  3.2数据挖掘技术在软件知识库维护中的应用
  
  软件知识库的维护对于软件性能的保证极为重要,是需要贯穿与软件整个生命周期的过程,采用传统技术实现软件的维护,难度较大,效率较低,且维护效果相对较差。计算机的运行所面临的环境十分复杂,维护人员必须时时刻刻关注系统状态,并对其加以优化,这样才能维持软件运行的稳定性。随着软件使用时间的延长,其中所包含的数据也越来越多,维护也就变得越来越困难。采用数据挖掘技术,实现对软件知识库的维护,能够达到提高维护效率,降低维护成本的目的。
  
  采用SVN作为版本控制工具,并采用Bugzilla作为主要的软件跟踪系统,能够实现对软件源代码的跟踪,但相对而言,跟踪难度较大。采用数据挖掘技术,将决策树学习应用到数据挖掘过程中,能够使噪声数据得到更加准确的识别与判断,是提高数据识别准确度的主要算法之一。CART与ID3是使用较为广泛的两种决策树形式[4].以ID3算法为例,基于信息增益方法,能够确定每个节点时所需要的合适属性,能够使信息量达到最小化,进而最大程度的提高数据挖掘效率。
  
  为判断上述数据挖掘技术在软件知识库维护中应用的有效性,需要采用实验的方法,对结果进行合理分析。实验过程需要硬件作为支持,CPU、硬盘、软件环境以及实验软件平台均需要选用最新型的技术。实验完成之后,要合理分析结果,并得出准确结论。
  
  4 结论
  
  传统方法在软件知识库中的应用,具有较大的缺陷,主要体现在开发与维护效率不高以及成本过大方面,采用数据挖掘技术实现软件知识库的开发与维护,可以有效解决上述问题,不仅能够提高效率、同时还能够降低开发与维护难度,降低其成本。鉴于数据挖掘技术的上述优势,应将该技术广泛应用于软件知识库的开发与维护过程中,以提高开发与维护的整体水平,为我国计算机技术的长远发现,奠定更加坚实的基础。
  
  引用:
  
  [1] 毛澄映 , 卢炎生 , 胡小华 . 数据挖掘技术在软件工程中的应用综述 [J]. 计算机科学 ,2009,05:1-6+26.
  [2] 王元卓 , 贾岩涛 , 刘大伟 , 靳小龙 , 程学旗 . 基于开放网络知识的信息检索与数据挖掘 [J]. 计算机研究与发展 ,2015,02:456-474.
  [3] 王德光 . 应用数据挖掘技术构建掘进机故障处理知识库的探讨 [J]. 煤矿机电 ,2011,04:54-55+58.
  [4] 檀朝东 , 岳晶晶 , 吴丽烽 , 檀竹南 . 数据挖掘技术在油藏挖掘者软件中的应用 [J]. 中国石油和化工 ,2010,10:66-67.
相关标签:数据挖掘论文
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站