学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 水利论文 > 水文学论文

水文学中的模糊聚类分析探讨

来源:学术堂 作者:姚老师
发布于:2015-10-26 共2485字
摘要

  一、引言及基本理论

  水文学以研究地球上水体的起源、分布以及其循环运动变化规律等为基本内容的一门学科;在整个水文系统中,其输入一般有降水,污染物等等,流域或区域作为一个整体的演变系统,流域或区域出口的径流,污物扩散等作为输出。从整个水文系统来看,它是一个开放的巨大的复杂的系统,而且由于整个系统的运动规律影响因素多,而且其物理机理也非常复杂,导致整个水文系统具有不确定的特性。而水文系统中存在的种种不确定性主要表现在随机性、模糊性等方面。

  在多元统计分析当中,聚类分析是其中的一个分支;它就是对一个没有在类别上进行标记区分的集合或者是样本,将它划分成为按照所选的某种规则进行标记区分的若干个子集或者类,尽量使样本或者集合中相似的元素或子集划分到同一类别当中,而尽可能的将其中不相似的元素或子集划分到不同的类别中。但是,伴随着社会的进步发展,人类的认知领域也在不断的拓展,其中,人们发现在现实世界中并不存在非常严格的界限来区分很多的事物或现象,他们在性态和类属方面存在着某种统一性或者说中介性,他们不是简单的"非此即彼"的关系,而是带有"亦此亦彼"的性质,我们将这种情况下的分类称为软分类,在这种情况下,简单的聚类分析已不能满足人们的需求。

  1965年Zadeh[1]针对事物广泛存在的模糊性提出了模糊集合理论(Fuzzy Set Theory),人们开始尝试用这种方法来处理聚类问题,而且取得了较大的成功,并将这种用模糊集合理论处理聚类问题的方法称为模糊聚类分析。

  通过对样本或集合的模糊聚类分析,不仅可以得到各样本或子集分别从属于各个类别的隶属度,又能够得到各个样本类属之间所具有的中介性。通过模糊聚类分析,得到了样本在不同类别中的不确定性描述,所得到的结论也更能够对现实世界进行客观的反映。所以模糊聚类分析成为了聚类分析研究的主流,也成为了近年来不断发展的一个研究热点[2].而模糊聚类分析也为了对水文学中的不确定问题进行处理的重要的工具。

  二、发展概况

  自从1965年Zadeh提出模糊集合理论以来,该理论得到了长足的发展,而且理论的本身的内容也得到充实和完善;而模糊聚类分析作为模糊集合理论在应用实践方面的重要领域之一,也在基础理论研究上获得了很大的进展,并且在实际工程的应用过程中取得了很好的成绩。而且模糊c均值法作为模糊聚类分析中的一种算法,由于其本身强大的实用性和理解上的通俗易懂性,使得模糊c均值法得到广泛应用,并迅速成为了对聚类问题进行研究的重要方向。下面对模糊c均值聚类的理论与算法的进展作简要的概括[3]:

  (1)算法收敛性的改进:由Cannon在1986年提出的近似模糊c均值聚类法即AFCM法,使得模糊c均值算法的收敛速度得到了大大提高。

  (2)目标函数的修改:Trauwaert等人在1991年,根据最大相关性的原则,将模糊聚类算法中的目标函数进行了修改。

  (3)目标函数在距离公式方面的改进:距离公式的改进能够使得算法聚类的数据类型的范围扩大。基于目标函数的聚类算法中,大部分情况下都会采用欧氏距离。而Gusatafson[4]

  在1978年,将协方差引入到了目标函数的距离公式的表达式中,提出了基于协方差的模糊聚类算法,从而使得在进行模糊聚类分析时,数据聚类的效果得到明显提高。

  三、方法分类

  从方法的实现上来看,进行聚类分析的方法一般可分为以下几种李晓伟重庆交通大学 重庆 400016类型[5]:基于谱系的聚类方法、基于等价关系的聚类方法、基于图论的聚类方法和基于目标函数的聚类方法。聚类方法可认为是将包含在样本集中的所有可能划分成为子集的并将子集按某种规则进行分类的处理数据的方法。如要得到理想的聚类结果,必须在采用聚类方法和选取聚类准则的时候进行谨慎的比选论证。但是,由于上述的前三种方法不适用于处理数据量比较大的情况,并且它们在实时性要求较高的场合不能满足使用要求,因此在进行实际问题分析的时候应用不是很广泛,目前,有关这三种聚类方法的研究已经逐渐减少了。而基于目标函数的聚类法则是将问题归结为一个非线性规划的问题,并且带有约束条件,通过采用以优化进行求解的方式获得样本数据集的最优模糊划分和聚类。这种聚类分析的方法在设计过程方面操作比较简单,而且所能解决的问题的范围方面也更加广泛,还可以将所处理的问题转化为有关优化的问题从而借助数学的非线性规划的理论进行求解。由于算法可以运用计算机将整个求解过程实现,所以这种方法的实用性很强。

  数据聚类分析一般包括四个过程:(l)模式表示;(2)模式相似性的定义;(3)聚类算法的设计;(4)聚类有效性评价。

相关标签:聚类分析论文
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站