四、关于大数据的概述
(一)大数据的概念
本文无意于过多的探讨有关大数据的具体问题,而是要探讨大数据对社会生活、特别是对法律的影响。不在在此之前,简单介绍下大数据也是必要的。
大数据(英语:Big data),或称巨量数据、海量数据、大资料,指的是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的集成共享,交叉复用形成的智力资源和知识服务能力。1早在上世纪八十年代,有关大数据的理论就出现了。未来学家阿尔文?托夫勒在《第三次浪潮》一书中,就预言到大数据时代的到来。2009年,“大数据”开始成为业界的流行词汇。真正让大数据呈现爆发发展并广泛进入应用阶段的其实是近一两年来另一项技术一一云计算的到来。云计算极大的提高了人类的计算能力,传统上认为的无法处理的巨量的数据进入了能够处理的范畴。也正是由于这个变化,原本无价值的数据拥有了巨大的价值,特别是其中巨大的商业价值首先得到了社会的重视。而在另一方面,数据处理能力的提高又反过来更刺激了人类对搜集数据的热情,带来了相关技术的进一步发展。
虽然大数据的发展依赖于计算能力的提高,但大数据的关键仍然是数据本身,所谓“三分技术、七分数据”也由此而来。业界认为,相对于搜集数据而言,计算能力和分析技术的提高是相对简单的。可以想象大数据的进一步应用,社会对数据的渴求必将更进一步,能有机会接触到数据的人,都有可能参与到数据搜集的过程中来,进一步丰富人类的数据库。
(二)大数据的应用情况
大数据在极短的时间内,爆发性的拥有了广泛的应用,包括在反恐、预防和减少犯罪等政府层面的应用,更广泛的还是商业层面的应用。
1、政府层面的应用:
2002年在9/11袭击后,美国政府为阻止恐怖主义己经涉足大规模数据挖掘。
前国家安全顾问约翰?波因德克斯特领导国防部整合现有政府的数据集,组建一个用于筛选通信、犯罪、教育、金融、医疗和旅行等记录来识别可疑人的大数据库。一年后国会因担忧公民自由权而停止了这一项目。
日本的“N系统”全年无休的使用拍照系统记录路面汽车的行驶路线和时间,同时搜索数据库比对盗脏车的车牌号码。如果发现符合,即会通知附近的警察栏截围捕。
我国也建立了自己的人员信息采集系统,对刑事前科人员、刑事案件犯罪嫌疑人、治安案件被处罚人等重点人员,进行了包括身高、体重、相貌、字迹、足迹、指纹、身份证信息、DNA数据在内信息的广泛采集。这套系统在打击刑事犯罪中起到了诸如摸底排队、现场勘查传统侦查手段无法达到的作用。笔者在侦办一起盗窃案件时,对于没有足够证据,在传唤时间到期后,不得不放人的情况下,合理利用人员信息采集的规定,对四名嫌疑人进行了人员信息采集。
随后,在得到了实质性证据之后,对四名嫌疑人办理了追逃手续。之前采集的人员信息就可以充实到全国在逃人员数据库中,为之后的追逃工作提供了十分丰富的线索,并为犯罪嫌疑人的落网提供了重要帮助。此系统的开发是专为打击犯罪而生,其中各种模块的设置都凸显了这一特点,尤其是其中的笔迹采集模块。该模块要求被采集者写一段规定的文字,而文字的内容大意为犯罪嫌疑人到公安机关一段表态的话。如果该系统任意对普通人群使用,不难想象被釆集人的抵触情绪。不过,我国包括公安部门在内的各个行政机关部门的顽疾之一就是摊派指标并进行考核,导致有考核任务的基层部门不得不想法设法完成任务。这也导致一些并不符合人员信息釆集条件,也无人员信息釆集必要的人员也被纳入到采集的范畴中来,不但白白浪费资源,更重要的就是导致了上文所述的被采集人员对此项工作的抵触。笔者认为任意的适用该系统是有很大问题的,对普通人群适用该系统实则是对人权的侵害和对被釆集人尊严的冒犯。
可以看到,政府部门应用大数据的效果喜忧参半。政府部门搜集的数据基本都关乎被采集对象的各类隐私,采集数据本身有难度。
2、商业层面的应用:
运用大数据,通过对快进次数、重播次数等的分析,热门节目《爸爸去哪儿》能够得出其最受欢迎的片段为《萌娃真心话》、《点球大战》。从而通过这些精彩片段形成《精华版》,给视频点击者更有针对性的选择机会。
微信、手机QQ等软件都能对手机通讯录数据进行预处理,链接用户手机中存储号码所对应的微信或QQ号码,形成“你可能认识的人”,帮助用户更快的寻找到自己的朋友。同时,这些软件都给予了用户选择的权利,即是否对自己手机中通讯录内容进行关联由其自己决定。
热门的网络电商都会形成“降价榜单”、“热销榜单”、“身边人在看什么”等等列表推荐给用户。当软件“360购物小蜜”的用户选中某件商品时,该软件会自动对比该商品在各个电商中的价格,甚至还有该商品的历史价格曲线。
“什么值得买”等购物推荐网站,都会通过对比各个电商的价格,形成“电商最低”;通过对比历史价格,形成“历史最低”或“近期好价”.以上这些列表基于商品的价格、销量、购买者的地理位置等各种因素形成,充分的应用了大数据技术。
这些大数据应用的实例都能给用户更好的使用体验,也必然能导致更好的用户粘性,提升了应用者的商业价值。
3、大数据应用带来的价值位阶的抉择
政府部门应用大数据技术,其核心诉求是监控人群,其核心产品为“安全”.商业实体应用大数据技术,其核心诉求当然是商业利益,其核心产品则为“便利实惠”.而无论哪个层面的应用,都无疑损害了一定程度的“自由”.“安全”、“自由”、“便利”三个位阶的价值发生冲突时,无疑“安全”是第一位的,而“自由”、“便利”要居于其后。不过,“安全”犹如空气,最重要却也最为人所不重视。人通常在感觉不到“安全”的威胁时,会选择“自由”和“便利”.当牺牲少量的“自由”,而且这部分“自由”的牺牲已经无法避免时,人们对于能换取到一定的“便利”也是乐于接受的。这也能够解释,政府部门应用大数据技术得不到如商业应用同样的肯定。