笔者所选用的数据是2001年重庆市各区(自治县、市)国民经济的主要指标,包括:国内生产总值GDP、人均国内生产总值(人均GDP)、农林牧渔业总产值(农牧GOV)、工业总产值(工业GOV)、社会消费零售总额(消费TRS)、区县级财政预算内收入(LBFR)、年末金融机构存款余额(YEDBFI)等7个主要经济指标对重庆市所辖区、县(自治县)进行聚类分析和判别分析,划分不同的经济区域,并根据分析结果对重庆市的各区县经济实力和经济状况进行分析。
一、聚类分析
首先采用最常用的聚类分析方法——系统聚类法进行分析,由于各指标的量纲差异,先将数据进行标准化处理,将所得的结果储存到新的变量中;然后用新的变量再进行聚类分析(见表1)。
上表显示出采用了系统聚类中Ward(最小离差平方和)法的欧式距离的平方量来做为衡量距离的标准,Ward最小方差法就是以方差最小为聚类原则。
表2是聚类表,表示的是聚类的凝聚过程,“阶”表示聚类步骤的序号;“群组集合”是在每一步中被合并的两类观测量;“系数”是距离测度值,表示不相似性的系数。
二、结论
图3为聚类树形图,两张图结合来看,在距离为5左右的时候共分为4类,此时,分类结果比较合理,因为小于这个距离时类别太多,失去分类的意义,而大于这个距离时,类别太少,不能很好的将数据区分开来。综上所述,确定类的个数为4。第一类包括荣昌县、南川市、潼南县等8个地区,属于重庆市经济发展最不发达的地区;第二类包括渝北区、万州区、合川县等5个地区,是重庆市经济发展较不发达的地区;第三类包括沙坪坝区、南岸区、大渡口去和九龙坡区等,是重庆市经济较为发达的地区;第四类是渝中区,是重庆市经济实力最为发达的地区,是重庆市的商业和政治中心。