四、问题与结论
在有关模糊聚类分析的问题中,由于需要聚类的对象的多样性,即遇到的水文的问题的多样性,使得需要用到的模糊聚类的算法也具有多样性。在聚类分析中一般需要解决以下几个问题:
(1)聚类样本集的多样性。由于实际问题中的样本的类型具有多样性,如样本的球形分布、线性分布、椭球形分布、等等,所以其聚类的方法也具有多样性,需要针对具体的问题采用相应的聚类算法。
(2)聚类分析时确定聚类类别个数。就是将所给的样本集划分为多少个类别更加科学,更加合理。
(3)表征样本特征的数据,在进行聚类分析时大部分数据处理方法都是基于欧氏距离的,故只能处理一些具有数值属性的数据或已经数值化的样本,对于一些符号属性或者很还没有数值化的信息就很难计算。
(4)提取样本特征。聚类时需要根据样本元素(子集)的影响特征来进行划分,有时找到这些能够有效区分类别的有效特征是困难的,而且有时就算找到了特征,但是却很难用数据将其表达出来等。
(5)当聚类样本输入顺序不同时会对聚类算法产生影响。也就是说即使聚类的样本相同,当样本的输入顺序不同时,所得到的聚类结果也会不同。
参考文献:
[1]L.A.Zadeh.Fuzzy Sets.Information and Control[J],1965,338-353.
[2]何青。模糊聚类分析理论与应用研究进展[J].模糊系统与数学,1998,12(2):89-94.
[3]高新波。模糊聚类分析及其应用[M].西安电子科技大学出社,2004.
[4]甄文智,抑制式模糊聚类算法及其应用[D],西安电子科技大学硕十学位论文,2003,01,P2-4,35-41.
[5]胡宝清。模糊理论基础[M].武汉大学出版,2004,271-279.