第五章 价值构造:作为余论的边缘法学研究
它山之石可以攻玉。刑法是一个从否定角度的价值判断过程,而且这种否定是对犯罪行为的透彻、激烈的否定。从刑法本身出发,当然能够依据理论和事实确证刑罚的合理性、公正性。如果能够从更开阔的的角度思考问题,从更多依据确证和分析刑罚的依据,自然会增强刑法的权威性。
一、经济分析
前文已经论述了大数据财产化保护的障碍,其中涉及到产权的问题。大数据既可以产生商业价值,同时又兼具公共性的特质。作为一种公共资源,数据分配的公平性和财富分配的公平性一样,都会对社会结构产生非常大的影响。
(一)大数据的公共物品性质
大数据是非常典型的俱乐部型公共物品,即具有可排他性及非竞争性。萨缪尔森认为,公共物品是“每个人对该产品的消费不会造成其他人消费的减少。”
这一定义是侧重于从公共物品的非竞争性来界定的。大数据本质上是待利用的潜在信息,对大数据的分析可以重复、多次、交叠进行,而数据除了本身的折旧率之外并不会有特别的消费上的竞争。“排他性与竞争性的研究依然是公共物品研究的两大主流视角”。
而一些“部分公共物品”并不完全具备这两个特点。布坎南根据物品不可分的程度和不可分的范围对物品进行了归类。所有的物品和服务均可在这两极之间排列。这两极即是纯私人物品和纯公共物品。
布坎南提出的俱乐部公共物品,就是指“只要集团的人数很少,个人的消费数量就不会增减,但是超出一定范围,这种纯公共性就不再存在,而在独立的集团之间,这种公共性根本就不存在。”
大数据的范围虽然广泛,但是数据的获取、存储、使用都有一套完整的权限制度,或者至少可以通过制定规则来明确权限。整体上大数据显然无法认为是纯粹私有的私人物品,也不是完全开放的平等获取使用的全面共享的公共物品。
所以从数据的可排他性管理与可重复消费两方面看,大数据从经济学上与俱乐部公共物品具有很大的相似性。
大数据时代产生了两种资源池。一是信息资源池。开放数据平台是典型的数据资源池,通过对特定具有访问权限的组织和个人分享相关数据,能够实现数据的最大化信息效用。
政府 2.0 是电子政务的新阶段和新形式,是政府在信息时代,在数据电子信息上职能的新转变。它让政府利用互联网的多元性,实现数据的共享和社会化利用,在数据平台上实现数据的最大价值。有文章评价“它是政府在电子政务职能上的一个根本性转变,它与民众直接互动和沟通,从条块分割、封闭的架构迈向一个开放、协同、合作、互动的架构,使政府真正成为服务型政府。”
二是运算资源池,例如,Google 的 brog 工具则把整个云端(可以跨几个数据中心)的服务器资源作为整体完整保存,然后根据用户的需求动态分布这些资源。而某公司向云计算公司申请 500 个 CPU 的计算量和 2TB 内存,都是由 brog 来分配,但是用的是哪些服务器上的 CPU 和内存,既无法准确确定,又无法实现预知,关键是,无论对云计算服务商还是对用户,这都并不重要。这个过程表明,云计算是资源池化的,多租户与资源共享是其重要特征。而资源池的特性正表明了大数据的非私人属性,和非竞争性。另一方面看,对资源池的排他性限定之容易与可行正表明了大数据的部分公共物品属性,准确地说,是俱乐部公共物品的经济属性。
(二)刑法风险责任界定的合理方案
信息是一种的特殊的客观存在,大数据则可以认为是信息的前阶段存在形态。
“知识产品的产权界定只有采取产权私有的形式,才能对抗“搭便车”行为,使知识产品生产者得到成本补偿,从而刺激其生产知识产品的积极性。”
只是作者在文章中也承认,“财产权的保护与竞争秩序的维护均是现代知识产权制度不可或缺的重要功能”,同时在有关知识产权的的另外文章中也提到,“努力维护正当的竞争秩序也是世界贸易组织《与贸易有关的知识产权协议》等保护知识产权国际条约的价值选择。”
但是大数据带来的窘困就在于它自身是一个宏观的集合性的概念,它同时还具有动态性和不确定性,数据的产生者和使用者之间权利裹挟不清。更重要的一点是,大数据作为具有一部分公共物品性质的对象,是高风险的。
对大数据的收集、使用和分析,各个环节都风险极大,公共性极其容易衍生公地悲剧。有文章认为,政府和企业可以依靠数据存储与分析技术的发展做“数据银行”业务,让每个公民都有机会在“数据银行”存储和提取自己想要的数据。
即将大数据完全开放,社会化利用。但是考虑到本文第二章所分析的种种安全风险,大数据的完全开放不大可行。
信息社会是风险社会,刑法的任务是维护正当的信息秩序,防止风险带来的社会危害。刑法具有经济性,是指“以最少量的刑法资源投入,获取最大的刑法效益”。在信息社会,刑法的经济性就表现为通过刑罚的调整和配置,对社会风险实现合理预防和控制,实现刑法资源的最少投入,获得社会防卫的最大化效益。
可以通过对大数据自身风险的合理分担来得出一个相对公平合理的结论。有文章从风险社会的角度提出了刑法的重构。即针对利益者、决策者、弱势者不同的风险分配,消解刑法危机。我认为这种刑事理性是合理与慎重的,对风险社会的主要问题予以了正面的回应。
二、符号学与复杂网络分析
数据和网络,这两个关键的对象都是人类智慧的延伸,从这两个对象本身出发,深度挖掘其自身的本质、规律和意义,显然对理解与此相关的问题大有裨益。
数据本身就是一种符号,而网络的深入研究则应当着眼于网络结构的现象和规律,即分别从符号学和复杂网络的分析。
(一)数字化到数据化的进阶与数据的超文本性质
尽管“数字化带来了数据化,但是数字化无法取代数据化,数字化是把模拟数据变成计算机可读的数据,和数据化有本质上的不同。
从数字化到数据化的差别,就是数据取得超文本性质的过程,是体现大数据特殊之处的过程。
数字化就是量化的过程,量化是联通现实世界与数字世界的桥梁。而数据化则是在数字化的基础上进行分析,对大数据的处理将得出意想不到的结果,这些结果同样对应着现实世界,会落回到现实世界。而这个分析过程是一个超越性的,会从元数据获得超文本的信息,这个飞跃式的改变将对应于对现实世界的巨大冲击,这种超越性就是大数据的魅力。
索绪尔被认为是当代语言学的创始人。他指出,“语言符号是由音响形象和概念含意构成的,没有概念含意的音响形象不能称其为符号。“语言符号是一种两面的心理实体”对这两面他用“能指”与“所指”的概念加以界定。所谓“能指”,英文 signifier,是符号所对应的实体;所谓“所指”,英文 signified,是符号以能指为中介物,所能指代的能指以外的关系物。诗人于坚的散文集《思想随笔》中有一篇文章,名为《绳子》,开篇就对形象为“绳子”这两个方块字、发音为“shengzi”这两个音节的符号进行了能指与所指的精妙论述。符号所对应的细长条的物,便是能指;而人们以此物为中介,将符号与捆缚、系、连接、上吊等等隐含的意义联系起来的时候,这些对象便是此符号的所指关系物。另一位符号学大师皮尔斯认为,构成一个有效符号的基本成分应该包括符号代表项(representamen)、对象(object)和解释项(interpretant),三者合一,构成了不可分割的符号化过程(semiosis)。
皮尔斯对索绪尔的挑战在于他添加了解释项这一概念,认为解释项是实现符号替代关系的不可缺少的主体性概念。例如,海子的名诗《亚洲铜》中有一段:“看见了吗?/那两只白鸽子/它是屈原遗落在沙滩上的白鞋子/让我们——我们和河流一起/穿上它吧”。其中的白鸽子在诗文中的词语本身是符号,而以此一词语所能指的实际上的白鸽子的动物实体为中介,诗人将意象一下子拉回到两千年前的屈原投河遗留的白鞋子,将语词符号同诗人理想主义热忱建立了所指关系。“我们”则是解释项,必须要经由“我们”这种主体性的解释,“我们”来“穿上它”,才能实现这种符号经能指、所能指关系的完整过程。
数据是二进制的语言,是计算机和网络的语言,同样也有能指和所指的问题。
数字化记录的生活被编码成为虚拟世界的符号,这就是符号的本体。符号的直接能指是大数据所直接对应的生活记录,如点击页面这一行为;符号的所指则是信息的价值,即大数据分析和数据挖掘的结果;至于解释项,可以理解为是技术处理过程,其中包含人的思维贡献,例如对挖掘方向的构想和创新,但真正的解释实施者和实施过程是自动化处理设备。
大数据和大数据到信息的集成过程就是所指和能指的分解呈现,在现实社会中可能很抽象的符号理论,由于有了现实到虚拟、虚拟到现实的折返过程而被拉长,整个符号的意义被清晰地放大呈现。我们可以清晰地看到大数据、信息和信息集成过程各个环节。
另一位符号学大师巴特提出了符号内部构成理论。根据这一理论,索绪尔语言学思想中能指和所指之间存在的约定俗成的、单向的确定关系出现断裂,符号的能指不再指向某个深处的所指而是能指自身,对符号所指的关注也被转移到符号的能指上来,符号的意义不再是确定的、唯一的。
这同我们对大数据的分析解读是一致的:符号(即大数据)的关注必须在其自身。也就是说,对大数据的保护必须提前到对这种网络整体资源、具有信息价值可能性的客体本身上来。
Web3.0 的概念不断被提起,其中语义网概念的提出则是对网络分析更高阶段的描绘,从符号学的角度看,语义网就是网络符号的“隐喻化”、“去符号化”、“深意化”。语义网,是用计算机理解的语义为互联网上的文档进行标记,用这种方式将整个互联网络连接起来。通过语义链接,对统一资源进行“标记”,语义网能理解人物、地方、想法、类型等等,更广泛、有效、自动聚集和搜寻元数据。
语义网从一种未来的视角和技术理想状态出发,描绘了一幅看上去激动人心的美好憧憬——信息成为最核心的价值载体,并且可以脱离符号本身实现独立化的存在。符号的能指不在重要,甚至可以不再存在;而省略了这一步骤后的世界,直接以能指而彼此相连。这是高度经济性、高效率、成本节约、准确精炼和直截了当的本质导向与问题导向的思维模式和生活模式,是计算机和网络技术高度发达的期待状态,可以说是现在的符号中心的社会的高阶形态和进化状态。但是,目前信息还不能脱离大数据而单独成为存在的对象。因此,可以参考信息在未来可能的核心主宰地位,来帮助我们理解大数据所隐藏的价值可能性,并且理解大数据到信息集成过程的重要意义,并以未来信息可能成为极其重要与特殊的对象的技术前景作为思考现有大数据问题、信息时代刑法转型问题的前瞻性指引。
(二)网络结构与数据秩序
目前大数据的整体秩序性非常松散,无论是对于数据的权利界定、对信息权的理解或者对于分析运算的过程控制,都尚在摸索的初级阶段。大数据的一个特点就是涌现性。“涌现性是网络数据有别于其它数据的关键特性。涌现性在度量、研判与预测上的困难使得网络数据难以被驾驭。网络数据的涌现性主要表现为模式的涌现性、行为的涌现性和智慧的涌现性。”
简单来说,涌现性就是一种无序。
大数据是以网络为载体的,而网络则在其演变中体现着演变进化。虽然完全是人类设计的,“但互联网现在有了自己的生命”。网络的生长和复杂网络结构的形成会为大数据的规律探究提供相当重要的借鉴。全球复杂网络专家巴拉巴西教授以整体、关联和系统论的方式展示了复杂网络的结构域特征。在《链接》一书第二部分,他主要从幂律分布和无尺度网络两个方面概括了复杂网络的分布规律。“幂律最突出的特征不是有很多小事件,而是大量微小事件和少数非常重大的事件并存。但这些非常重大的事件绝不可能出现在钟形曲线中。”“幂律分布和钟形分布在分布的尾部存在着重要的定性差异。钟形分布的尾部指数衰减,衰减速度比幂律分布快很多……相比而言,幂律分布衰减得慢得多,允许像枢纽节点这样的‘罕见事件’存在。”
“在连续的层级中,无法找到一个能够代表所有节点特征的节点。在这些网络中并不存在固有的尺度。”
但是,幂律本身是 20 世纪后半期很多颠覆性的惊人理论的核心,例如在混沌、分形、相变等领域中。在物理学家研究不同系统中有序从无序中的“涌现”过程中,幂律不断在相变过程中被发现。这表明在系统的相变中“从无序到有序的道路,是自组织在强有力地推动,并通过幂律铺就……幂律不仅是刻画系统行为的另一种方式,更是复杂系统自组织所独有的特性。”
大数据的问题是同网络的混沌、涌现、无序等等特征都不可分离的,而大数据的秩序,恐怕也是要遵从网络结构的幂律、要在涌现性中构筑秩序。这样的秩序同样是无尺度的、聚团性的复杂结构,这就是为什么传统刑法无法应对大数据的复杂性——传统刑法是常见的系统,这样系统中量仍然遵循钟形曲线,刑法的制度也就是在这样的系统中构筑起来的,自然无法面对大数据时代,网络信息产生的用现行问题。
在复杂系统的秩序形成时,幂律无处不在。同样大数据的问题也必须认清这一点。大数据时代,大量的数据持有者——公司,服务提供商,是数据网络的枢纽节点,他们同时决定了数据秩序的强壮性与脆弱性。因此,如何以这些关键的节点为入口,构筑一个清晰、合理、有效的大数据秩序是当前所需要解决的重要问题。这是遵从现实打击数据有组织经济犯罪的现实需要、刑法风险理性分担的理论结论,也符合幂律对于相变的有序性描述。