2.高频关键词的聚类分析发现研究热点。使用Excel2010的Vlookup函数可以得到31个高频关键词的全样本词篇矩阵,如表7所示。以31个高频关键词为行,以355篇论文为列,单元格内容为每篇论文中对应行之关键词出现情况,出现该关键词标注1,未现标注0.
将词篇矩阵(Excel工作表)导入SPSS软件,方法是:将355个数值型变量选入变量框,将唯一的字符串变量“词篇矩阵”选入标注个案;统计量勾选“相似性矩阵”,绘制项勾选“树状图”,方法项选项中的聚类方法选择“组间连接”、度量标准选择“Ochiai二分类法”,从而得到高频关键词相似矩阵(详见表8)和高频关键词聚类分析树状图(详见图2)。
图2中标注在树状图纵轴的是关键词名称及其对应出现频率1 ~ 31位的排名。图中两个关键词(词群)的纵向连线所对应的横轴数字,揭示了两个高频关键词(词群)之间的关系密切程度(0 ~ 25)。
从图2可以看出,在核心期刊与CSSCI期刊论文中,我国税务会计研究文献的高频关键词聚分为以下五类:第一类是永久性差异、时间性差异、应税所得、税务会计、财务会计、递延税款、应税收益、应税收入;第二类是应纳税所得额、纳税调整、权责发生制原则;第三类是资金运动、货币计量、核算方法、企业会计;第四类是经济活动、纳税申报表、企业税务、税务机关、税收法规、税制改革;第五类是财务制度、所得税法、所得税会计、现代企业制度、财务管理、应交税金、销项税额、进项税额、营业外支出、税收会计。