大数据是当前 IT 产业又一次划时代的技术发明. 近年来,随着云计算技术的日趋成熟和移动互联网的快速发展,各类型数据源及其所生成数据量呈现出几何级数的增长. 据相关资料显示,2011 年全球新增数据量已达到 1.8 ZB(1ZB 相当于 1 万亿GB),这远远超过了 2011 年以前人类所生成的所有信息量总和.〔1〕"现在的数据量规模如此巨大,使用传统的技术和手段已无法处理和把握,所以大数据就是指已经超出了我们的常规处理能力,必须借助新的科学技术和方法体系才能够予以处理的数据集合. "〔2〕大数据技术能帮助我们增强预测精准度,有效提升处理复杂事件的决策能力,但同时也滋生着人类前所未遇的各种伦理问题和道德矛盾,如信息异化加速蔓延、个人数据权利边界消失、信息隐私被肆意侵害和数字鸿沟不断扩大等等. 这些道德的矛盾和冲突正在侵蚀着人们的道德底线,也使人类千百年来所铸造的伦理价值体系在数据信息时代面临着严峻的挑战. 所以,随着大数据时代的来临,人类社会必将面临价值体制的冲突、碰撞、震荡和价值观念的修正、扬弃与重建.
一、网络信息伦理缺失的表征
"大数据正在开启一次重大的时代转型. 就如同显微镜使我们观测到深邃的微观世界,望远镜让我们认识到浩瀚的宇宙,大数据技术正在改变我们的生活习惯以及理解世界的方式. "〔3〕同所有的新技术一样,大数据技术也将给人类带来一系列意料之外的伦理风险.
1. 信息异化加速蔓延
"异化"(Alienation)一词源自于拉丁文 alienatio,本义为"让渡、丧失、差异、疏远"等. 马克思使用"异化"这一概念用以说明"劳动异化"现象,即人类劳动的产物却对象化为一个奴役人、控制人的异己对象世界.〔4〕278因此,异化一般指主体活动后果成了主体的异己力量,并反过来支配和奴役主体自身.所谓信息异化也就是指作为信息生产者、 创造者的主体,由于对信息的过分依赖和盲目崇信,逐步丧失了对信息的掌控能力反被信息所支配、奴役.
莎士比亚说:"凡是过去,皆为序曲. "预测是大数据技术的核心价值,它利用数据挖掘算法对过往的海量数据进行提纯,使得分析者能够对未来进行精准的行为预测. 比如,每逢春节来临,很多人会先在网络上查询各种出行信息,挖掘这些数据信息就可预知哪些线路最热门、哪些城市的人口流动量最多,2014 年上线的"百度迁徙"就首次采用可视化的方式将春运客流轨迹动态及时地呈现在了我们眼前. 然而,在数字化生存的时代,随着网络越来越智能、预测越来越精准,人类曾经引以为傲的精明头脑,却显得越来越笨拙、愚钝和力不从心. 面对数据洪流的爆炸式增长,人们很可能会逐渐丧失反思和批判的能力,而听由诸如"专家"或者"数据决断"代为做出抉择.〔5〕这种程式化的决策方式不仅意味着创新意识的凝滞和冒险精神的失落,还可能导致人们丧失自己的意志、情感和德性,最终沦为数字形而上学的追随者. 在一个预测的时代里,人类的自由意志神圣而不可侵犯,这一点不可轻视.
2. 个人数据权利边界消失
大数据时代人类的生产方式也将迎来根本性变革,数据将成为生产力的一个重要来源. 人们对海量数据的挖掘与应用,将预示着新一轮的生产力增长和消费者盈余浪潮的到来. 谁掌握大数据,谁就可以获得隐藏在海量数据中的潜在生产力. 所以,在"数据有价"的大数据时代,有必要赋予公民组织数据财产权,保护其数据权利. 所谓数据权利,也就是权利人直接支配特定的数据财产并排除他人干涉的权利.〔6〕大数据时代, 数据宛如一座神奇的钻石矿,拥有无穷的价值潜力. 但问题是这些海量数据该归谁所有? 传统的直连式数据存储完全以服务器为中心,数据附着在服务器上. 而当前的海量数据存储必然无法用单台的计算机完成,只能采用分布式计算架构. 因此,数据的存储设备就从单个的固定硬件转变为由众多的存储设备和服务器所构成的一片"云". 于是,大数据使数据的归属权责变得更为复杂:产生数据的各类用户,提供数据存储设备的云存储运营商和拥有立法权和行政管辖权的各国政府,三者的数据归属权责并不明确. 在法理层面上,虽然各方都承认"用户明确同意是数据处理程序合法化的必要条件"〔7〕. 但在实际执行过程中,这几乎是无法实现的,因为数以亿计的互联网用户不可能对每次网络行为都进行授权. 况且,网络运营商为了自由而合法地获取用户数据,往往会使用晦涩的增补服务条款来绕过用户的明示授权. 用户在面对这些过于隐晦的专业性解释条款时,很难明晰数据权限控制的具体细节,甚至连个人数据的最终流向也无从知晓.
3. 信息隐私被肆意侵害
大数据时代, 随着个人数据搜集的日益普遍,用户对个人隐私安全的关注也随之上升. 历史地看,隐私权的概念意义和使用语境是随着社会历史不断变迁的. 19 世纪末,"隐私"主要指公民的住宅和通信自由不受侵犯. 而随着互联网的不断发展,用户个人数据信息已经成为一种超出了其控制范围的商品,隐私一词的内涵也随之超越了"当事人不愿他人干涉的个人私事或当事人不愿他人侵入的私人领域",而扩展为"个人信息的收集、控制、存储和使用".〔8〕大数据时代,公民个人数据隐私保护将面临更大的挑战,"信息隐私已成为隐私的实质性方面或者说至少是主要方面. "〔9〕为实现更为精准的广告营销,商业组织往往会着力发掘隐藏在零星数据中的潜在价值,而这常常会触及个人信息隐私. 比如,美国塔吉特公司曾从数据库中挖掘出 25 种与怀孕高度相关的商品,通过分析女性顾客的网购数据来预测客户是否怀孕. 根据这一"怀孕预测"指数,该公司成功获取到一名在校女生的妊娠隐私,这比她的家人知悉这一隐私还要早一个月.〔10〕另外,虽然大数据联动挖掘模式所采集到的数据看似都是完全不涉及隐私的非结构性数据,但是恶意分析者完全可以对碎片化的、看似无关联的简单数据进行复合运算,从中发掘出隐藏在各种网络交互活动中的特殊关联性, 这就会有意或无意地侵犯用户隐私.这样不仅会"降低用户对于匿名隐私数据存储的信任和参与热情,而且会导致大批网络用户因惧怕私人生活被侵扰而最终叛离数据服务. "
4. 数字信息鸿沟不断扩大
信息鸿沟(Digital Divide),又称数字鸿沟、信息分化,是指在信息社会中,不同国家、地区、行业的人群由于对社会信息资源占有和使用程度的不同而造成的"信息落差"和"知识分隔". "信息鸿沟"的概念最早由美国前副总统阿尔·戈尔在 1996 年提出. 他指出信息富有者和信息贫困者之间的鸿沟正随着新的传播技术的变革而不断扩大,这种大峡谷一样深的数字鸿沟最终会危及社会的公正与民主,并引发严重的"贫富分化"和"社会裂解".〔12〕因此,信息鸿沟问题实际上涉及一个信息时代的社会公正问题,即"某些群体在信息可及方面遭受到了不合伦理和得不到辩护的排除. "〔13〕大数据时代,现实生活的全部内涵都以数字来建构,人的存在就是数字化存在. 因此,信息成为人类生存和发展的一个决定性要素,而对信息的公正分配和对信息技术的普遍可及便成为大数据时代的一个基本价值诉求. 然而,在大数据背景下,信息"富有者"与"贫穷者"之间的这道数字鸿沟却在迅速拉大. 首先,对于网络服务商和政府组织来讲,大数据是一笔蕴藏着巨大经济开发潜能的宝贵财富.
拥有数据掌控权的网络服务商普遍将用户数据信息视为核心机密或者未来的核心竞争力,因此要实现数据资源的开放共享和普遍可及并非易事. 其次,大数据挖掘涵盖数据的获取、存储、挖掘、呈现、分配和安全等诸多领域和环节,每一个环节都需要强大的技术支撑. 根据《哈佛商业评论》的一项调查,世界 1000 强企业中的"大多数企业仍然只处在大数据的入门阶段,目前并不具备真正的数据挖掘和处理能力".〔14〕显然,对于普通用户来讲,大数据更是犹如一个美味的坚果,因为大数据挖掘所用的遗传算法、聚类分析和神经网络方法等技术于普通人来讲不啻为天方夜谭.
二、网络信息伦理缺失产生的原因
大数据时代网络信息伦理缺失产生的原因是多方面的,总的来说,虚拟人格异变是网络信息伦理缺失产生的主体根源,大数据技术的负效应是其产生的客观条件,而规约机制匮乏则是其产生的社会背景.
1. 虚拟人格异变是信息伦理缺失的主体根源
大数据时代,基于云计算的海量数据需要越来越复杂的虚拟化存储设备,这些海量数据的持续生成正在改变着人类社会的生产方式和生活方式,人类的虚拟化生存已逐渐成为现实. 特别是当社交网络成为人际交往的一种主要方式,人格异变正在成为一种常态. 现实社会中,人们往往承载着来自各方的压力但却无从发泄, 许多人长期处于紧张、压抑、烦躁、焦虑甚至是困惑不满的社会环境中,却无法找到更多交流与宣泄的渠道以消解内心的苦闷.
而在虚拟的社交网络中, 人们则可以通过微博、贴吧、论坛和社区来寻找"志同道合"之人,在这些广阔而自由的倾诉空间里,他们肆意发泄着情绪来聊以慰藉. 这些在社交网络上参与侮辱、谩骂、恐吓、攻击等群体行为的人,绝大部分都是刻意隐藏自己真实身份的"无名氏". 在网络这个不受约束的"自由"空间内,虚拟人格因"无标注"群体的出现而发生异变. 换言之,在虚拟空间中,被现实道德准则所压制的"本我"层面得到了彻底释放. 作为人类所面临的一种全新社会生活空间,数据化生存方式跨越了国家、地域、民族和种族的现实边界,原本畅通于现实生活空间的规范和秩序也突然丧失了其应有的效用. 所以,虚拟空间强烈的理想化色彩与弱规范性必然导致网络行为者伦理缺失现象的普遍滋生和社会人文精神的全面沦丧.