学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 毕业论文 > 硕士论文

微博背景下突发公共卫生事件舆情特征与引导策略

来源:吉林大学 作者:李博诚
发布于:2020-08-27 共16242字
  摘要 
 
  目的:根据突发公共卫生事件的责任归属对事件进行分类,并利用文本挖掘的相关技术与方法,通过网民的评论数据还原突发公共卫生事件网络舆情发生和发展过程,揭示不同类型事件网络舆情发展和传播的一般规律和特异性,并针对分析结果提出舆情引导对策与建议,为有关管理部门在舆情研判、分析预测和合理引导等方面提供辅助决策支持和依据。
 
  方法:根据突发公共卫生事件的责任归属不同,即事件发展过程中是否有明确的过失方,将事件分为人为过失型事件和非人为过失型事件,选取近年来两类事件中的代表性事件并对微博中网友对于该事件的相关评论进行爬取。以日为单位利用热度计算公式计算舆情周期内的评论热度,并对各个事件的舆情周期进行划分。
 
  利用 LDA 主题模型对舆情生命周期下各个阶段的评论进行主题识别,并通过主题关键词还原网民的讨论话题。将 DUTIR 中的情感合并为乐、恶、哀、恐和中性五类,并基于此面向微博环境构建了表情符号和网络用语词典,结合前人研究构建了修饰词词典,利用上述词表对各个主题下评论进行情感分析。最终根据上述过程得到的结果,对两类事件在舆情演进方式、热点讨论话题和话题所蕴含的情感三个方面进行了对比分析。
 
  结果:
 
  ⑴通过热度计算结果对事件进行演化周期的划分并利用热度图像进行了呈现;⑵对两类事件进行主题识别,其中人为过失型事件共得到 17 个主题,非人为过失型事件共得到 9 个主题;⑶对于人为过失型事件网民总体各类情感占比如下:中性:19.4%,乐:18.9%,恶:34%,哀:8.1%,恐:19.6%;对于非人为过失型事件网民总体各类情感占比如下:中性:27.5%,乐:16.6%,恶:20.5%,哀:5.1%,恐:30.3%。
 
  结论;⑴非人为过失型事件的演进方式以“单峰”型为主,人为过失型事件的演进方式以“多峰”型为主;⑵相较于非人为过失型事件,人为过失型突发公共卫生事件的舆情持续时间更长同时舆情的增长速度也更快;⑶对于突发公共卫生事件网民的热点讨论话题的一般规律为:事件发生,引起关注——查询源头,消除影响——事后反思,总结经验三个主要方面;⑷人为过失型事件的话题数量明显多于非人为过失型事件这一现象可能与两类事件的矛盾冲突机制和政府应对行为不同有关;⑸对于人为过失型事件网民的主要情感以恶为主,对于非人为过失型事件网民的主要情感以恐为主;⑹对两类事件进行纵向对比分析可以发现,对于人为过失型事件网民存在一定的情感累积现象,即同类事件发生的越多公众恶的情绪占比越高;而对于非人为过失型事件,存在一定的情感削弱现象,即事件发生的越多公众恐的情绪占比越低。
 
  关键词:公共卫生事件,  网络舆情,  微博,  演化

  Abstract 
 
  ObjectiveAccording to the responsibility attribution of public health emergencies, this paperclassifies the events, and uses the related technologies and methods of text mining torestore  the  occurrence  and  development  process  of  public  opinion  of  public  healthemergencies  through  the  comment  data  of  netizens,  revealing  the  development  ofdifferent  types of  events The general law  and specificity of the dissemination, andprovide  public  opinion  guidance  countermeasures  and  suggestions  based  on  theanalysis  results,  and  provide  auxiliary  decision  support  and  basis  for  the  relevantmanagement  departments  in  public  opinion  research  and  judgment,  analysis  andprediction and reasonable guidance.
 
  MethodAccording to the different responsibilities of public health emergencies, that iswhether there is a clear fault party in the development process of the event, the eventcan be divided into human fault type event and non-human fault type event. Select therepresentative events in recent years and crawl the relevant comments of the microblogusers on the event. In this paper, we use the heat calculation formula to calculate thecomment heat in the public opinion cycle, and divide the public opinion cycle of eachevent. The LDA topic model is used to identify the topics of comments in differentstages of the public opinion life cycle, and the discussion topics of netizens are restoredby topic keywords. The emotion in DUTIR is combined into five categories: happiness,hate, sadness, fear and neutrality. Based on this, an emoticon dictionary and an onlinevocabulary  dictionary  are  constructed  for  microblog  environment.  A  modifierdictionary is constructed based on previous studies. The above vocabulary is used toanalyze the emotion of the comments under each topic. Finally, according to the resultsof the above process, this paper makes a comparative analysis of the two types of eventsin three aspects: the evolution of public opinion, hot topics and emotions contained inthe topics.
 
  Result(1) The evolution period of the event is divided by the heat calculation results, and theheat image is presented;(2) To identify the theme of two kinds of events, 17 themes are obtained for humannegligence events and 9 themes are obtained for non-human negligence events;(3) The overall proportion of all kinds of emotions of the netizens in the event of humannegligence is as follows: neutral: 19.4%, happy: 18.9%, hate: 34%, sad: 8.1%, fear:
 
  19.6%; the overall proportion of all kinds of emotions of the netizens in the event ofnon-human negligence is as follows: neutral: 27.5%, happy: 16.6%, hate: 20.5%, sad:5.1%, fear: 30.3%.
 
  Conclusion(1) The evolution mode of human negligence events is mainly "single peak", while thatof non-human negligence events is mainly "multi peak";(2)  Compared  with  non  human  negligence  events,  the  public  opinion  of  humannegligence  public  health  emergencies  lasts  longer  and  the  growth  rate  of  publicopinion is faster;(3)  The  general  rule  of  the  hot  topics  of  public  health  netizens  is  as  follows:  theoccurrence  of  the  incident,  the  cause  of  concern,  the  inquiry  of  the  source,  theelimination  of  the  impact,  the  reflection  after  the  event,  and  the  summary  ofexperience;(4)  The  phenomenon  that  the  number  of  topics  of  human  negligence  events  issignificantly more than that of non-human negligence events may be related to theconflict mechanism of the two types of events and the different government responsebehavior;(5) The main emotion of the netizens of human negligence events is evil, and the mainemotion of the netizens of non-human negligence events is fear;(6) Through the longitudinal comparative analysis of the two kinds of events, it can befound that there is a certain emotional accumulation phenomenon for the Internetusers of human negligence events, that is, the more similar events happen, the higherthe proportion of public bad emotions; while for non human negligence events, thereis a certain emotional weakening phenomenon, that is, the more incidents happen,the lower the proportion of public fear emotions.
 
  Keywords:Public health events, Online public opinion, Microblog, Evolution
 
  目录
 
  第一章  绪论 .............................................................................................. 1
 
  1.1 研究背景 ........................................................................................ 1
 
  1.2 相关研究现状 ................................................................................ 1
 
  1.2.1 网络舆情的内涵 ................................................................... 2
 
  1.2.2 网络舆情演化 ....................................................................... 3
 
  1.2.3 网络舆情演化分析中的技术与方法 ................................... 4
 
  1.3 研究目的与意义 ............................................................................ 5
 
  第二章  材料与方法 .................................................................................. 7
 
  2.1 数据来源 ........................................................................................ 7
 
  2.1.1 事件选取 ............................................................................... 7
 
  2.1.2 数据获取 ............................................................................... 8
 
  2.1.3 数据质量控制 ....................................................................... 9
 
  2.2 研究方法 ...................................................................................... 10
 
  2.2.1 统计分析 ............................................................................. 10
 
  2.2.2 主题分析 ............................................................................. 10
 
  2.2.3 情感分析 ............................................................................. 11
 
  2.3 技术路线 ...................................................................................... 11
 
  第三章  结果 ............................................................................................ 12
 
  3.1 舆情传播周期划分 ...................................................................... 12
 
  3.2 热点讨论话题识别 ...................................................................... 16
 
  3.3 文本情感分析 .............................................................................. 23
 
  3.3.1 表情符号情感词典构建 ..................................................... 24
 
  3.3.2 网络用语词典构建 ............................................................. 25
 
  3.3.3 修饰词词典构建 ................................................................. 26
 
  3.3.4 基于词典的情感分析 ......................................................... 26
 
  第四章  讨论 ............................................................................................ 34
 
  4.1 舆情演进方式对比分析 .............................................................. 34
 
  4.1.1 舆情持续度与增长速度对比分析 ..................................... 34
 
  4.1.2 舆情演进方式对比分析 ..................................................... 34
 
  4.2 热点讨论话题对比分析 .............................................................. 35
 
  4.2.1 话题数量对比 ..................................................................... 35
 
  4.2.2 话题内容对比 ..................................................................... 36
 
  4.3 情感对比分析 .............................................................................. 37
 
  4.3.1 网民总体情感对比分析 ..................................................... 37
 
  4.3.2 话题对网民情感表达的影响 ............................................. 37
 
  4.4 舆情引导对策与建议 .................................................................. 38
 
  第五章  结论与展望 ................................................................................ 41
 
  5.1 结论 ............................................................................................... 41
 
  5.2 创新与局限性 .............................................................................. 41
 
  5.3 展望 ............................................................................................... 42
 
  参考文献 .................................................................................................. 43
 
  作者简介 .................................................................................................. 47
 
  在学期间所取得的科研成果 .................................................................. 47
 
  致谢 ........................................................................................................... 48

  第一章  绪论 
 
  1.1 研究背景 
 
  互联网以及网络社交媒体的快速发展,极大地丰富了人们分享感受,交流意见的方式与途径。随着自媒体时代的来临,网民从传统的信息获取者逐渐转化为信息的制造者和传播者,越来越多的网络用户选择在网络社交平台表达个人意见和情感倾向。微博作为其中的代表,因其传播速度快、社会影响力大而逐渐成为网民信息传播及信息获取的重要渠道[1,2]。
 
  突发公共卫生事件(Public health emergencies)是指突然发生,造成或者可能造成社会公众健康严重损害的重大传染病疫情、群体性不明原因疾病、重大食物和职业中毒以及其他严重影响公众健康的事件[3]。这类事件因为与公众的人身健康密切相关,而关注人数多,持续时间久,而且极易触动公众的敏感神经,当事件被爆出后,公众因担忧自身生命健康安全而产生强烈恐慌、愤怒等消极情绪,在网络用户中影响巨大[4]。这些以网络评论为载体传达出来的情感容易引起社会舆论,可能会影响事件的发展进程、相关组织机构的决策甚至形成新的突发事件[5]。
 
  近年来,计算机技术和相关产业的发展,尤其是文本挖掘相关技术和方法的日渐成熟,为突发公共卫生事件舆情的监控以及舆情规律的呈现提供了新的解决思路。这些技术和方法可以帮助相关决策人员对网络中海量离散、独立的用户自生成文本[6]进行挖掘与分析,揭示事件的演化规律和公众情感的波动情况与变化规律,实时了解舆情发展状况,将舆情对社会的负面影响降到最低[7]。
 
  因此,本研究基于微博平台,探究突发公共卫生事件网络舆情的演化规律,并对舆情的合理引导与管控提出相应的对策与建议,以期更好地为应急管理与决策服务。
 
  1.2 相关研究现状 
 
  本研究从网络舆情的内涵、网络舆情演化和舆情演化分析中的技术与方法三个角度对近年来的国内外相关文献进行了梳理。
 
  1.2.1 网络舆情的内涵 
 
  随着时代的发展与更迭,舆情的概念也经历了逐步的丰富和延伸。关于网络舆情,本研究结合相关文献从网络舆情的定义和构成要素两方面进行了梳理。关于网络舆情定义,既往研究并没有达成统一认识。如高俊峰[8]认为网络舆情就是公众利用互联网,通过文字、图片等方式对特定对象所表达出的观点、意见和态度;薛可[9]认为其是大众针对网络中的热点事件所形成的可能影响事件发展和走向的舆论力量;刘晶[10]将网络舆情界定为群体以网络为媒介对某种社会现象所表达出的具有一致性的情绪和态度的集合;陶建杰[11]从评论倾向性的角度认为其是公众针对社会热点事件与问题,通过互联网所传达出的带有一定影响性和倾向性的观点与评论;纪红[12]认为其是公众针对某一事物利用网络媒体所表达出的基本态度;李钧[13]认为网络舆情就是在网络空间中传播和扩散的公众对于焦点问题所表达的具有个人倾向性的评论;Herbert B[14]认为其是在指定空间中,由讨论者的观点或者意见倾向组成的一种集体行为;Neumann N E[15]立足于沉默的螺旋理论对网络舆情进行了解析,认为其是在虚拟空间中公众的多方意见不断反复碰撞进而形成的一致性意见倾向。
 
  关于构成要素,唐涛[16]从主体、客体、场域和信息四个角度对网络舆情要素进行了划分;Senghore F[17]认为其包含主体即参与讨论的公众,客体即公众所讨论的话题,载体即留言、发帖等传递信息的媒介;Liu M H 等[18]认为其是由主体即发表评论的网民,客体即网民所评论的话题和对象,两部分共同结合、作用促进而来;李明等[19]认为网络舆情包括舆情的主体即使用互联网发表评论的网民,舆情的客体即网民评论中所提及的对象和话题两部分构成。
 
  在此,本研究在参照前人的研究与定义的基础上,认为网络舆情是指由公众通过互联网对公共事件中的热点话题所产生的认知和态度(即情感倾向),是社会舆情在网络空间中的进一步映射。包括舆情主体:参与讨论的网民;舆情客体:网民所讨论的话题和网民对话题表达出的情感倾向。
 
  1.2.2 网络舆情演化 
 
  基于网络舆情的定义和构成要素,本研究认为网络舆情的演化是针对舆情客体的演化,是舆情发展过程中网民所讨论的热点话题以及话题所表达出的情感倾向的发展和演变。现阶段网络舆情的演化研究又可以分为演化周期研究和演化过程研究两个方面。而演化周期又可以分为演化方式和演进方式,在演化方式方面,突发公共卫生事件具有一定的生命周期,事件的网络舆情演化也具有一定的生命周期,即网络舆情从萌发走向衰退的全过程。关于舆情演化方式的研究已经较为成熟,主流的方法是按照事件的发展生命周期进行时序阶段划分。本研究将相关成果归纳如表 1.1 所示。
 
  表 1.1  网络舆情演化方式研究归纳表



  在演进方式方面,事件的演进方式根据演化热度图中的出现的峰值可以分为单峰型、双峰型以及多峰形演进方式[28]。演化过程的研究是在演化周期划分的基础上融入网民的评论主题、情感倾向等因素的深化研究。如安璐等[29]将演化周期分为了四阶段,分析了埃博拉病毒事件发展过程中网民热点讨论话题的演变趋势;Zhao L 等[30]利用复杂网络分析了公众情感随时间的演化规律;将知义等[31]针对“罗一笑”事件分析了网民情感随时间的变化;陈福集等[32]基于“成都女司机”事件分析了网民讨论话题随时间的变化规律与趋势;杨谨铖等[33]以“7.5”事件为例分析了涉恐事件中网民的情感演化;王晰巍等[34]对舆情热度随时间的传播规律进行了建模分析。
 
  1.2.3 网络舆情演化分析中的技术与方法 
 
  根据相关学者对舆情构成要素的分析,本研究对话题识别和情感分析中用到的相关技术与方法进行了归纳与整理。
 
  主题分析主题分析是指运用相关主题模型对非结构化文本中的潜在主题进行聚合挖掘其中隐藏信息的过程[35,36]。其广泛应用于热点挖掘、文本分类等领域,其中最具代表且应用最广的是基于潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)的主题模型,如曾子明等[37]利用 LDA 对红绿蓝幼儿园虐童事件的评论主题进行了演化分析;Ren 等[38]基于传统的 LDA 模型利用抽样迭代进行了改进优化,来解决所生成的高维矩阵过于稀疏的问题;唐晓波等[39]通过 word2vec 进行词向量训练并基于 LDA 进行主题聚类以实现对文档摘要的自动生成;杨磊等[40]基于传统的 LDA 模型构建了 Q-LDA 模型用以挖掘网络健康社区中的隐藏主题;AsliC[41]等为进一步提高摘要抽取效果,基于 LDA 模型建立了层次主题结构取得了较好的结果。目前 LDA 在主题识别中有着良好的表现且对于微博这类短文本的主题识别有着良好的效果。
 
  情感分析情感分析(Sentiment Analysis)亦称观点挖掘,是指自动地对网络评论中的情感倾向进行分析判断,发现用户对某个产品或事件的态度和意见的过程[42]。基于情感词典的方法和基于机器学习的方法是现阶段两种主要应用的情感分析方法。
 
  基于词典的方法是通过相应词典配合规则来对情感倾向进行判定。英文领域的词典发展较早也较为成熟[43,44],中文较为常用的资源有知网的情感分析用语集(HowNet)[45]、国立台湾大学情感词典(NTUSD)[46]、中文情感词汇本体库(DUTIR)[47]。以这些词典作为基础,并通过语义规则加以运算,最终得出用户的情感倾向。如 Ragini JR[48]利用 General Inquirer 词典针对 2014 年东南亚多地洪涝灾害事件进行了积极和消极两性的情感分类;陈福集等[49]针对 13 年复旦投毒案件利用 HowNet 情感词典进行了正向负向两极的情感分类;崔安颀[50]利用台湾国立大学情感词典 NTUSD 对多个热点事件进行了褒贬两极的分析;安璐[51]利用中文情感词汇本体库(DUTIR)对 16 年魏则西事件进行了乐、好、怒、哀、惧、恶、惊七极的情感分类研究。在机器学习领域,近年来逐渐有学者将机器学习算法应用到情感分析研究中,如陈平平[52]利用 BP 神经网络和多项式贝叶斯算法对电影影评数据进行了情感分析;Smith KS[53]利用 SVM 对 15 年巴黎恐怖袭击事件和 16 年柏林袭击事件的网民评论进行了情感分析;Neppalli VK[54]利用朴素贝叶斯模型对 12 年“桑迪”事件的网民情感规律进行了呈现。伴随着深度学习相关技术与方法发展与普及,Chiu J P C[55]等人构建了一种多通道卷积神经网络,利用滑动窗口输入并进行池化合并以提高情感倾向性分析的特性;程艳[56]等使用字级别向量作为特征输入并基于卷积神经网络和层次化注意力网络提出了 C-HAN 模型进行文本倾向性分析;李慧等[57]利用卷积神经网络对商品领域进行情感分析;孙松涛[58]构建了 EM-CNN 模型,在深度学习模型中嵌入了表情符号特征,进一步增强了模型的语义步骤能力。Abdi A[59]将多个长短期记忆模型与递归神经网络进行组合,称为 RNSA 模型,用来进一步提高情感分析的泛化能力和精度。
 
  但机器学习方法的效果依赖于大规模有标注训练集,标注的过程十分耗费人力,且由于标注工作的繁复性和分类数据平衡性的限制[60],基于机器学习方法的情感分类极性主要集中在积极、消极两极或者积极、中性、消极三极的分类研究,然而,公众面向复杂的突发公共卫生事件时所表达出的情感不单单限制于简单的积极、中性、消极三性分类,而是更加复杂也更加细腻。
 
  综上所述,现阶段网络舆情演化分析研究还存在着以下局限:在分析的事件方面,现有研究多针对单一事件进行分析,缺少对不同类型突发公共卫生事件的细化对比分析;在分析的维度方面,多数研究只对网民的热点讨论话题或情感倾向进行单一维度的分析,缺少多角度的立体分析。
 
  1.3 研究目的与意义 
 
  研究目的:根据突发公共卫生事件的责任归属对事件进行分类,并利用文本挖掘的相关技术与方法,通过网民的评论数据还原突发公共卫生事件网络舆情发生和发展过程,揭示不同类型事件网络舆情发展和传播的一般规律和特异性,并针对分析结果提出舆情引导对策与建议,为有关管理部门在舆情研判、分析预测和合理引导等方面提供辅助决策支持和依据。
 
  研究意义:通过对不同类型突发公共卫生事件舆情发展态势、热点讨论话题以及话题对应的情感分布特征进行比较分析,有助于相关应急管理部门更为全面、细致地了解事件的发展情况与轨迹,掌握舆情态势、公众的关注重点、矛盾源头和情绪走向,并为合理的管控和正确的舆情引导提供一定的参考意义。

  第二章  材料与方法 
 
  2.1 数据来源 
 
  2.1.1 事件选取 
 
  对于突发公共卫生事件的分类主要集中在根据事件的性质、风险等级和危害程度等条件分为特别重大、重大等若干类别[61]。这样的分类标准有利于事件在真实世界中的分级管理并更好地调用社会资源进行控制与治理,降低事件的危害程度。但对于事件在网络环境中的映射即网络舆情来讲,这样的分类体系不利于深入了解舆情发展和扩散的深层次原因,无法更好地探究舆情产生和演化的规律,并更好地对舆情进行合理地管理与正确地引导。因此,本研究根据事件责任归属的不同即在事件发展过程中是否有明确的过失方,将突发公共卫生事件分为人为过失型事件和非人为过失型事件。选取了近年发生的相关事件,其中人为过失型事件选取了 2016 年的山东毒疫苗事件、2018 年的长春长生问题疫苗事件和 2019年的海南博鳌疫苗事件三个事件作为代表,非人为过失型事件选取了 2013 年的H7N9 禽流感事件、2016 年的 H5N6 禽流感事件和 2018 年的非洲猪瘟事件作为代表。下面对上述事件的发生原因进行简要回顾,如表 2.1 所示。
 
  表 2.1  事件起因归纳表


  通过回顾可以发现山东毒疫苗事件、长生问题疫苗事件和海南博鳌疫苗事件是由于相关的企业或者个人的违规操作和知假贩假的行为而引起的公众健康受损,有明确的事故方或责任方为典型的人为过失引起的公共卫生事件;而 H7N9禽流感事件、H5N6 禽流感事件和非洲猪瘟事件为典型的传染病事件,无明确的责任方,属于非人为过失型事件。
 
  2.1.2 数据获取网络
 
  爬虫随着因特网和移动网络设备的普及,互联网成为了大量信息的载体,信息体量呈爆发式增长,海量的信息以及网络数据的复杂性与多样性,为数据的获取提出了巨大的挑战,传统人工整理和手动下载的数据获取方式已经不再能满足对海量数据进行精确、高效获取的需求。网络爬虫为这一问题提供了有效的解决思路和方法。
 
  网络爬虫(Web Crawler),又称为网络蜘蛛,是指按照一定的规则自动地获取互联网中信息的程序或者脚本[62]。本研究基于 python 2.7 编写爬虫程序对微博博文及其评论进行爬取。
 
  
爬虫基本流程如图 2.1 所示
 
 ①发送请求:向目标网站发送请求获取,并获取目标 URL;
 
    ②获取相应内容:若请求有效,则获取目标服务器的返回内容;
 
    ③解析内容:利用正则表达式获取目标信息;
 
    ④保存数据:将解析得到的数据保存到本地。
 
  数据爬取随着 WEB3.0 时代的到来,网民从信息的接收者逐渐成为了信息的传播者与分享者,微博是一个基于用户生成、传播和互动的网络社交平台,用户可以实时通过 PC 端、移动端等方式发表和获取信息。由于使用微博的人数众多,且有一些影响力较大的政府和企业也都注册了官方账号作为发布消息的重要渠道。因此本研究选取微博作为数据获取平台爬取了上述六个事件的相关评论,爬取关键词及起止时间如表 2.2 所示。
 
  表 2.2 事件爬取关键词与起止时间



表 2.3  各个事件清洗后的评论数量 





图 2.2  研究技术路线图



图 3.1 山东毒疫苗事件演化热度图 



图 3.2 长生问题疫苗事件演化热度图

…………由于本文篇幅较长,部分内容省略,详细全文见文末附件

  第五章  结论与展望 
 
  5.1 结论 
 
  通过对以系列疫苗事件为代表的人为过失型突发公共卫生事件和以传染病为代表的非人为过失型突发公共卫生事件进行演进方式、热点讨论话题和话题情感倾向性三个方面进行分析,得出以下结论:
 
  (1)非人为过失型事件的演进方式以“单峰”型为主,人为过失型事件的演进方式以“多峰”型为主。
 
  (2)相较于非人为过失型事件,人为过失型突发公共卫生事件的舆情持续时间更长同时舆情的增长速度也更快。
 
  (3)对于突发公共卫生事件网民的热点讨论话题的一般规律为:事件发生,引起关注——查询源头,消除影响——事后反思,总结经验三个主要方面。
 
  (4)人为过失型事件的话题数量明显多于非人为过失型事件这一现象可能与两类事件的矛盾冲突机制和政府应对行为不同有关。
 
  (5)对于人为过失型事件网民的主要情感以恶为主,对于非人为过失型事件网民的主要情感以恐为主。
 
  (6)对两类事件进行纵向对比分析可以发现,对于人为过失型事件网民存在一定的情感累积现象,即同类事件发生的越多公众恶的情绪占比越高;而对于非人为过失型事件,事件发生的越多公众恐的情绪占比越低。
 
  5.2 创新与局限性
 
  本研究依据不同的责任归属类型对突发公共卫生事件进行了分类,并选取了近年来的代表性事件对人为过失型与非人为过失型突发公共卫生事件网络舆情的演进方式、热点讨论话题以及话题对应的情感分布特征进行比较分析。
 
  本研究的主要创新点如下:①从事件责任归属的角度,对突发公共卫生事件网络舆情进行了分类与对比分析,有助于更好地了解舆情发展与扩散的深层次原因,并进行针对性地管理与引导,同时丰富了网络舆情研究中事件分类与分析的维度。②在前人研究基础上,面向微博语料,扩充了网络用语和表情符号词典,丰富了情感分析中的情绪源,提高了情感分析的准确性并为后续的研究提供了一定的基础词表资源。
 
  同时研究仍存在着一定不足,如:对于舆情热度、话题和网民情感相互作用的分析,主要通过对分析结果进行归纳概括的方式完成,存在一定的主观性和人为认知影响。
 
  5.3 展望 
 
  针对目前研究中存在的不足,在未来的研究中本人拟将定性比较分析(Qualitative Comparative Analysis ,QCA)的技术与方法引入网络舆情演化研究中,对不同的讨论话题、情感类型进行编码,探究网络舆情发展过程中的多重影响关系,减少人工归纳概括,进一步提高对比分析的客观性与准确性。

  参考文献 
 
  [1]  崔彦琛,张鹏,兰月新,等.面向时间序列的微博突发事件衍生舆情情感分析研究——以“6.22”杭州保姆纵火案衍生舆情事件为例[J].  情报科学,2019,37(3):119-126.
  [2]  曹毅梅,李真奇.微博舆论对热点事件发展的影响[J].  新闻爱好者,2020(1):47-49.
  [3]  安璐,易兴悦,余传明,等.突发公共卫生事件微博影响力的预测研究[J].  情报理论与实践,2017,40(8):46,80-85.
  [4]  崔亚飞.突发公共卫生事件网络舆情演化的计算机仿真研究[D].  北京:首都经济贸易大学,2018.
  [5]  Chen  X,  Duan  S,  Wang  L,  et  al.  Research  on  clustering  analysis  of  Internet  publicopinion[J]. Cluster Computing, 2019, 22(3):5997-6007.
  [6]  Maisto A, Pelosi S, Guarasci R, et al. Text Analysis on User Generated Content: The RapLyrics Challenge[C]. advanced information networking and applications, 2018:657-662.
  [7]  陈思菁,李纲,毛进,巴志超.突发事件信息传播网络中的关键节点动态识别研究[J].  情报学报,2019,38(2):178-190.
  [8]  高俊峰,王毅军,黄微,等.网络舆情场的内涵、结构特征与功能属性分析[J].  图书情报工作, 2017,61(4):14-22.
  [9]  薛可,许桂苹,赵袁军.热点事件中的网络舆论:缘起、产生、内涵与层次研究[J].  情报杂志,2018,37(8):78-83,55.
  [10] 刘晶,吴国毅,黄艳兰.高职院校网络舆情治理的内涵、问题与策略[J].  教育与职业,2020(4):73-79.
  [11] 陶建杰.完善网络舆情联动应急机制[J].  党政论坛, 2007(9):28-30.
  [12] 纪红,马小洁.论网络舆情的搜集、分析和引导[J].  华中科技大学学报(社会科学版),2007,21(6):104-107
  [13] 李钧,宋伟.自媒体时代网络舆情影响下的高校思想政治教育研究[J].  新校园旬刊,2016(9):9-10.
  [14] Herbert   Blumer. Public Opinion and Public Opinion Polling[J]. American SociologicalReview, 1947, 13(5):542-549.
  [15] Noelle-Neumann  E.The  Spiral  of  Silence:  Public  Opinion-Our  Social[M].Chicago:University Chicago Press, second edition, 1993:50-56.
  [16] 唐涛.网络舆情治理研究[M].  上海:上海社会科学院出版社,2014,12-30.
  [17] Senghore F, Camposnanez E, Fomin P, et al. Using Social Network Analysis to Investigatethe Potential of Innovation Networks: Lessons Learned from NASA's International SpaceApps Challenge[J]. Procedia Computer Science, 2014,28:380-388.
  [18] Liu M H. Collection Mechanisms and Elements of Public Opinion Since the Founding ofNew China[J]. Jianghan Academic, 2014,33(4):11-20.
  [19] 李明,曹海军.中国网络舆情研究 13 年(2005-2017):理论、方法与实践[J].  情报杂志,2019,38(5):116-122.
  [20] Burkholder B T, Toole M J. Evolution of complex disasters.[J]. Lancet, 1995, 346(8981):1012-1015.
  [21] 潘崇霞.网络舆情演化的阶段分析[J].  计算机与现代化,2011,11(10):203-206.
  [22] 马建华,陈安.突发事件的演化模式分析[J].  安全,2009,30(12):1-4.
  [23] 易承志.群体性突发事件网络舆情的演变机制分析[J].  情报杂志,2011,30(12):6-12.
  [24] 贾亚敏,安璐,李纲.城市突发事件网络信息传播时序变化规律研究[J].  情报杂志,2015,34(4):90-96.
  [25] 方付建.网络舆论中网民反向认知现象研究[J].  情报杂志,2015,34(6):100-103.
  [26] 佘廉,张明红,黄超.公共突发事件案例表达结构化模式探讨[J].  华南理工大学学报(社会科学版),2015,17(6):69-75.
  [27] 燕道成.群体性事件中的网络舆情研究[M].  北京:新华出版社,2013:65-69.
  [28] 蒋静.公共卫生安全类事件的网络舆情研究[D].  长沙:湖南大学,2014.
  [29] 安璐,杜廷尧,余传明,等.突发公共卫生事件的微博主题演化模式和时序趋势——以Twitter 和 Weibo 的埃博拉微博为例[J].  情报资料工作,2016(5):44-52.
  [30] Zhao L , Wang J , Huang R , et al. Sentiment contagion in complex networks[J]. PhysicaA Statistical Mechanics & Its Applications, 2014, 394(2):17-23.
  [31] 蒋知义,马王荣,邹凯,等.基于情感倾向性分析的网络舆情情感演化特征研究[J].  现代情报,2018,38(4):50-57.
  [32] 陈福集,马梅兰.网络舆情事件的话题演化分析——以成都女司机为例[J].  情报杂志,2016,35(5):58-64.
  [33] 杨谨铖,张秋波,夏一雪,兰月新.面向涉恐舆情的网民心理演化系统动力学模型研究[J].  情报杂志,2019,38(3):141-147,154.
  [34] 王晰巍,邢云菲,王楠阿雪,等.新媒体环境下突发事件网络舆情信息传播及实证研究——以新浪微博“南海仲裁案”话题为例[J].  情报理论与实践,2017(9):5-11.
  [35] Zhang C , Wang H , Cao L , et al. A hybrid term-term relations analysis approach for topicdetection[J]. Knowledge-Based Systems, 2016, 93(Feb.1):109-120.
  [36] 阮光册,夏磊.基于主题模型的检索结果聚类应用研究[J].  情报杂志,2017,36(3):179-184.
  [37] 曾子明,万品玉.融合演化特征的公共安全事件微博情感分析[J].  情报科学,2018,36(12):3-8,51.
  [38] Ren H, Li C, Wang H, et al. An Improved DLDA Based Method- Nonparametric DLDA[C].computational intelligence and security, 2010:270-274.
  [39] 唐晓波,顾娜,谭明亮.基于句子主题发现的中文多文档自动摘要研究 [J].  情报科学,2020,38(3):11-16,28.
  [40] 杨磊,王子润,侯贵生.基于 Q-LDA 主题模型的网络健康社区主题挖掘研究[J].  数据分析与知识发现,2019,3(11):52-59.
  [41] Celikyilmaz  A,  Hakkanitur  D.  A  Hybrid  Hierarchical  Model  for  Multi-DocumentSummarization[C]. meeting of the association for computational linguistics, 2010:815-824.
  [42] Bing  L.  Opinion  Mining  and  Sentiment  Analysis[J].  Synthesis  Lectures  on  HumanLanguage Technologies, 2011, 2(2):459-526.
  [43] Denecke  K.  Using  SentiWordNet  for  multilingual  sentiment  analysis[C].  internationalconference on data engineering, 2008:507-512.
  [44] Stone P J, Hunt E. A computer approach to content analysis: studies using the GeneralInquirer system[C]. national computer conference, 1963:241-256.
  [45] 贾东立,崔新宇,申飞.基于高频情感词扩充情感词典的商品评价系统[J].  电脑知识与技术,2019,15(16):242-244.
  [46] 张志刚.网络新闻评论情感分析系统的研究与实现[D].  沈阳:辽宁大学,2018.
  [47] 徐琳宏,林鸿飞,潘宇,等.情感词汇本体的构造[J].  情报学报,2008,27(2):180-185.
  [48] Ragini J R , Anand P M R , Bhaskar V . Big data analytics for disaster response andrecovery through sentiment analysis[J]. International Journal of Information Management,2018, 42:13-24.
  [49] 陈福集,陈婷.舆情突发事件演化探析——基于意见领袖引导作用视角[J].  情报资料工作,2015,36(2):23-28.
  [50] 崔安颀.微博热点事件的公众情感分析研究[D].  北京:清华大学, 2013.
  [51] 安璐,欧孟花.突发公共卫生事件利益相关者的社会网络情感图谱研究[J].  图书情报工作,2017,61(20):130.
  [52] 陈平平,耿笑冉,邹敏,等.基于机器学习的文本情感倾向性分析[J].  计算机与现代化,2020(3):77-81,92.
  [53] Smith K S , Mccreadie R , Macdonald C , et al. Regional Sentiment Bias in Social MediaReporting During Crises[J]. Information Systems Frontiers, 2018,20(5):1013-1025.
  [54] Neppalli V K , Caragea C , Squicciarini A , et al. Sentiment analysis during HurricaneSandy in emergency response[J]. International Journal of Disaster Risk Reduction, 2017,21:213-222.
  [55] Chiu J P C , Nichols E . Named Entity Recognition with Bidirectional LSTM-CNNs[J].transactions of the Association for Computational Linguistics, 2016,4(1):357-370.
  [56] 程艳,叶子铭,王明文,等.融合卷积神经网络与层次化注意力网络的中文文本情感倾向性分析[J].  中文信息学报,2019,33(1):133-142.
  [57] 李慧,柴亚青.基于卷积神经网络的细粒度情感分析方法[J].  数据分析与知识发现,2019,3(1):95-103.
  [58] 孙松涛,何炎祥.基于 CNN 特征空间的微博多标签情感分类[J].  四川大学学报(工程科学版),2017,49(3):162-169.
  [59] Abdi A , Shamsuddin S M , Hasan S , et al. Deep learning-based sentiment classificationof evaluative text based on Multi-feature fusion[J]. Information Processing & Management,2019, 55(4):1245-1259.
  [60] 张鹏,崔彦琛,兰月新,等.基于扎根理论与词典构建的微博突发事件情感分析与舆情引导策略[J].  现代情报,2019,39(3):122-131,143.
  [61] 蔡筱英,麦慧祯.突发公共卫生事件的分类分级管理探讨[J].  中国公共卫生,2006,22(7):895-896.
  [62] 李世杰,高雅蓉.基于网络爬虫的网络平台用户数据获取与分析[J].  计算机与网络,2020,46(1):68-71.
  [63] Blei  DM,Jordan  M. Latent  Dirichlet Allocation[J].The  Journal  of  Machine  LearningResearch,2003(3):993-1022.
  [64] Pang  B,  Lee  L.  A  Sentimental  Education:  Sentiment  Analysis  Using  SubjectivitySummarization Based on Minimum Cuts[C]. meeting of the association for computationallinguistics, 2004:271-278.
  [65] 韩正琪,刘小平,寇晶晶.基于 Rao-Stirling 指数和 LDA 模型的领域学科交叉主题识别——以纳米科技为例[J].  情报科学,2020,38(2):116-124.
  [66] 吴江,周露莎,刘冠君,贺超城.基于 LDA 的可穿戴设备在线评论主题挖掘研究[J].  信息资源管理学报,2017,7(3):24-33.
  [67] 闫晓东,黄涛.基于情感词典的藏语文本句子情感分类[J].  中文信息学报, 2018,32(2):75-80.
  [68] Boot P , Zijlstra H , Geenen R . The Dutch translation of the Linguistic Inquiry and WordCount (LIWC) 2007 dictionary[J]. Dutch Journal of Applied Linguistics, 2017, 6(1):65-76.
  [69] F.M.  Kundi,  S. Ahmad, A.  Khan,et  al.  Detection  and  scoring  of  Internet  Slangs  forsentiment analysis using SentiWordNet[J]. Life Science Journal, 2014, 11(9):66-72.
  [70] 刘伟朋,陈雁翔,孙晓.基于表情符号的中文微博多维情感分类的研究[J].  合肥工业大学学报(自然科学版),2014,37(7):803-807.
  [71] 马秉楠,黄永峰,邓北星.基于表情符的社交网络情绪词典构造[J].  计算机工程与设计,2016,37(5):1129-1133.
  [72] 敦欣卉,张云秋,杨铠西.基于微博的细粒度情感分析[J].  数据分析与知识发现,2017,1(7):61-72.
  [73] Alaa Hamouda, Mahmoud Marei, Mohamed Rohaim.Building Machine Learning BasedSenti-word  Lexicon  for  Sentiment  Analysis[J].  Journal  of  Advances  in  InformationTechnology, 2011,2(4):199-203.
  [74] 崔连超.互联网评论文本情感分析研究[D].  济南:山东大学,2015.
  [75] 黄晓斌,余双双.网络用语对信息交流的影响[J].  情报理论与实践,2008,31(1):23-25.
  [76] 施寒潇.细粒度情感分析研究[D].  苏州:苏州大学,2013.
  [77] 陈国兰.基于情感词典与语义规则的微博情感分析[J].  情报探索,2016(2):1-6.
  [78] 李婷婷,姬东鸿.基于 SVM 和 CRF 多特征组合的微博情感分析[J].  计算机应用研究,2015,32(4):978-981.
  [79] 杜洪涛,王君泽,李婕.基于多案例的突发事件网络舆情演化模式研究[J].  情报学报,2017,36(10):1038-1049.
  [80] 晏艳阳,邓嘉宜,文丹艳.同群效应对创业活动影响的模型构建与实证[J].  中国管理科学,2018,26(5):147-156.
  [81] 易玲.新媒体时期网络舆情应对意义和策略[J].  传播力研究,2019,3(27):270-271.
  [82] 陈园园 . 关于 “ 两微一端 ” 在传统媒体发展中的运用分析 [J].  传播力研究 ,2019,3(22):52.
  [83] 谌楠,王恒山.网络舆情政府干预最佳点选择的研究[J].  现代图书情报技术,2012,28(3):53-58.
  [84] 李天龙.突发事件舆情的阶段应对策略[J].  情报杂志,2018,37(12):106-111.
  [85] 周伟.自媒体时代网络舆情政府回应困境与消解路径[J].  情报杂志,2018,37(4):100-105,99.




 
 
 
 
 
作者单位:吉林大学
原文出处:李博诚. 基于微博的突发公共卫生事件网络舆情演化研究[D].吉林大学,2020.
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站