学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 社会学论文 > 社会科学论文

社会研究中大数据的运用情况(2)

来源:学术堂 作者:胥帆
发布于:2016-01-27 共8234字

  甚至连人类起源这类由人类学和考古学回答的问题,也可以通过大数据给予重新的回答。西兰奥克兰大学的昆丁·阿特金森(Quentin D. Atkinson)把来自基因多样性的方法运用到语音研究方面,通过统计宏观数据,用语音变化的总体规律来发现人类语音的历史地图,进而验证人类起源于非洲的学说。可见大数据几乎渗透到了社会科学的所有领域。
  
  三、将大数据视为专门的社会科学研究方法论的研究

  迄今为止,从社会研究方法的角度探讨大数据的研究还不多,目前主要集中于大数据背后的思维方式、哲学基础和研究范式转变等方面。

  计算机领域的学者对这一议题作了深刻的论述。2007 年,计算机领域图灵奖获得者吉姆·格雷(Jim Uray)在其人生的最后一次演讲中,描绘了数据密集型科研“第四范式”的愿景,将大数据科研从第三范式(计算机模拟)中分离出来单独作为一种科研范式。微软公司(Microsoft)的研究人员托尼(Tony Hey et al.)等在 2009 年共同写作了一本书“The Fourth Paradigm Data-Intensive Scientific Discovery”,他们认为,由于数据的收集及其便宜和迅速,以至于超越了他们利用、分析、可视化、存储和组织的能力。借助于计算机,人类的科学研究将会被计算思维(computational thinking)重塑,他们认为尽管实证的(empirical)、分析的(analytical)、模拟的(simulation)方法能够用来回答很多问题,但是由数据密集(data-intensive)驱动的大数据将会涌现,可称之为第四范式(the fourth paradigm).国内的计算机软件学者徐磊认为,“传统的技术条件只能使人们获得小样本、静态的个体或社会关系的数据,不得不简化社会研究对象的特征,人们更多地依赖假设、直觉和经验解释社会问题,其准确性和可信度自然大打折扣”,“纠结了 100 多年的社会科学研究方法的问题,将彻底归并到更大的复杂系统认知的问题集合中”.[38]

  数学家们对这一议题也发出了声音。联合国统计署的保罗(Paul Cheung)教授在“Big data,official statistics and social science sesearch:Emerging datachallenges”的演讲中讲到了大数据包含多种数据来源,比如互联网应用记录、政府数据、商业数据、监控数据、健康数据、卫星图像等,认为大数据和传统的社会科学研究逻辑一致,都是先陈述研究假设或研究问题,再收集资料,最后分析资料,并且认为当下大数据还不完全可靠,但是其具有更为迅捷和廉价的潜力。

  社会科学家们在这些议题上多援引计算机领域的学者和数学家们的观点,没有本质上的创新。

  比如香港城市大学的祝建华(Jonathan Zhu)教授在“Big data for social science research:Hypes,myths andrealities”的演讲中,从价格和结构两个维度分析了数据的来源,认为大数据形成了不同于定性研究、实证研究、规范性研究和模拟研究新的范式,因此,仅仅关注相关关系就足够了,无需寻找一个模型,无需一个研究假设就可以展开分析。大陆学者何非与何克清等认为大数据开启了科研中的“第四范式”,人类进入了以大数据为基础的数据密集型科研 发 现(data- intensive scientific discovery)的 时 代.新闻传播领域着名学者沈浩在《大数据助力社会科学研究:挑战与创新》一文中重点探讨了大数据的基本特征,大数据为应用突变理论(catastrophetheory)、混 沌 理 论(chaos theory)、复 杂 系 统 理 论(complexity theory)研究社会治理、舆情研究、传染病传播、谣言传播、微博营销等提供了方法.社会科学家们考虑更多的是如何将大数据与社会科学研究方法结合起来,比如黄欣荣从科学认识论的角度出发,认为“科学始于数据”就是将科学理论建立在海量的、客观的原始数据基础上,这一方面克服了逻辑实证主义者将理论建立在可能被污染的少量经验数据基础上的缺陷,另一方面又避免了波普尔那种没有根据的胡乱猜想[41].

  总体来看,大数据给传统社会科学研究方法带来了范式转变,但目前对大数据方法的选题依据、理论框架、研究设计、数据分析、研究伦理、信度和效度等方面的议题仍缺乏深入的研究。

  四、互联网企业和社会科学家运用大数据方法的对比

  必须承认的是,互联网高新技术企业以及沃尔玛等大型企业对大数据的运用远超社会科学界。沃尔玛的“啤酒+尿不湿”营销组合是企业自发将大数据方法运用到企业的经营管理中的成功案例。社会科学家们接受了大数据的概念,并用之研究社会问题和社会现象。笔者认为,对大型互联网公司和社会科学家们的研究差异有必要加以探讨。

  (一)大型互联网企业的大数据应用

  个性化推荐系统是当下互联网销售企业广泛采用的大数据技术,它本质上是根据用户过往的身份信息和行为记录,预测用户对某一产品兴趣的算法和模型。亚马逊、阿里巴巴的淘宝网和京东等互联网企业都广泛采用了这一技术。

  通过搜索引擎的关键词进行趋势分析也是一个普遍的应用领域,比如百度指数就是一个根据亿万用户数据为基础的分享平台,在这里可以通过搜索关键词的变化趋势来判断网民的兴趣和需求。Google也有类似的功能。

  根据地理位置进行分析是另外一个普遍应用的技术。智能移动终端的普遍使用使得地理位置信息的搜寻更为容易和廉价。Google地图和百度地图都是这个领域的佼佼者。2015 年百度地图从时间和空间两个维度全程、动态、即时、直观地展现中国春节前后人口大迁徙的轨迹与特征,引起了公众广泛的关注。腾讯 QQ 通过其用户的登陆地也能很好地做出迁移趋势的分析。

  依据互联网上的文本做出大数据分析是当下舆情监督机构广泛采用的技术。比如人民网舆情检测室就通过爬虫软件等对传统媒体网络版、网站新闻、BBS、博客、微博等内容进行抓取,进而进行统计和分析,形成舆情监测分析报告。

  大数据时代数据往往储存在巨型企业中,它们可以利用这些数据进行分析。比如腾讯 2014 年推出的《网民睡眠质量报告》是根据QQ用户的在线活动数据作出的分析。阿里巴巴根据淘宝网和天猫等用户的购物数据发布了2015年版的《中国个性化消费大数据报告》。

  (二)社会科学家们的大数据应用

  与大型互联网企业相比,社会科学界运用大数据进行社会研究起步要晚一些,主要是通过大型数据库和对互联网上的文本进行分析,还有一些通过地理位置数据进行的研究。

  一是通过大型数据库(比如预料库)进行社会科学研究。上文提到的美国学者米歇尔(Michel)等对 500 万本 Google 图书的挖掘和一些语言学的研究都是这方面的例子。中国电子科技大学的周涛教授通过对美国 600 多个大学的 400 多万篇论文分析发现,跨学校合作的文章影响力更大,尤其是实力强的大学之间联手更好;实力强的和实力弱的联手,实力弱的大学可以提高,实力强的大学不会受损伤;实力弱的学校之间联合比单打独斗效果更差。依据大型数据库进行研究,这正是未来社会科学研究可以发力的地方。二是对互联网上的文本内容进行分析。这些数据都是公开的,通过爬虫软件就可以获得。比如,邦德(Bond R. M.)等通过Facebook 的发帖内容来分析人们的投票行为,中国社科院心理学所的朱廷劭教授通过微博内容来分析用户的性格等,都是运用这种方法进行研究的典范。社会科学家也通过地理位置的相关数据展开城市管理和人口迁移等方面的研究。比如龙瀛等利用北京市1周时间内855万个公交IC智能卡的数据,结合市民出行情况调查和城市土地利用信息,研究了市民的职住关系和通勤行为[42].应该说在这些方面的研究中,大型互联网企业和社会科学家们采用的方法没有本质差异,只是关注点各不相同,互联网企业关注的是营销、舆情判断和以位置数据为基础的产品服务,而社会科学家们关注的是政治行为、个性化教育和性格等社会科学关注的传统主题。

  大数据时代已经来临,大数据的思维方式和方法已经渗透到语义学、政治学、经济学、教育学、心理学和社会学等几乎所有的社会科学领域,而且已经有了不少成熟的研究案例,总体而言美国的研究案例更为全面一些。用社会研究方法视角审视大数据的研究主要关注的是哲学基础和范式转变,而大数据方法的选题范围、理论依据、研究设计、数据收集和分析方法、数据可视化、信度效度和研究伦理都还没有得到深入的讨论。大型互联网企业的大数据研究主要关注商品推荐系统、以搜索关键词为基础的趋势分析、互联网上文本的内容分析、以位置信息为基础的产品服务等,社会科学家也会采用类似的技术进行分析,只不过关注的是社会科学的传统主题。毫无疑问,大数据还会更加深刻地影响社会科学的发展,其理念和思维模式将会更深入地被吸纳进来。如果社会科学界不去运用大数据,社会科学界的领地将会被计算机专业的学者和数据科学家们“侵占”.

  参考文献:

  [1] DUMBIL L E. What is big data? An introduction to the bigdata landscape[EB/OL].(2015-08-26)。
  [2] 维克托·迈尔-舍恩伯格,肯尼斯·库克耶。 大数据时代:生活、工作与思维的大变革[M]. 盛杨燕,周涛,译。杭州:浙江人民出版社。 2012:2-4.
  [3] Nature. Big Data[EB/OL].(2015-03-05)。
  [4] The Economist. The data deluge[EB/OL].(2015-03-24)。
  [5] Science. Special online collection:Dealing with data[EB/OL].(2015-03-20)。
  [6] 城田真琴。 大数据的冲击[M]. 周自恒,译。 北京:人民邮电出版社,2013:2-3.

相关标签:
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站