摘要:互联网信息分布零散、体量庞大的特征日益凸显出对信息组织、分类和过滤的重要性, 这导致搜索引擎占据了现代社会信息传播的枢纽位置。由于控制了公众对信息这一重要资源的可及性, 搜索引擎具有显著的公共性。搜索引擎公司根据自身商业利益来影响信息的结构、编排, 凸显和遮蔽信息的现象, 说明法律根据公共利益来规范搜索引擎服务的必要性。否则, 信息的多元性、个人自治等诸多价值将会受到挑战。但是, 搜索算法中的主观判断因素使得难以按照某种统一、客观的标准要求搜素引擎“中立”, 规制方案应当聚焦于强化信息披露、合理使用结构性规制并激励行业自律等方面。
关键词:搜索引擎; 信息; 可视度; 多样性; 个人自治;
The Influence of Search Engine on Information Dissemination and Its Legal Regulation
Zhao Peng
Abstract:
The fragmented and huge volume nature of Internet information is increasingly indicative of the importance for information organization, classification and filtering, and more importantly, what rule should be followed by the above-mentioned activities. Locating on the bottleneck of the Internet information disseminating system, search engines can highlight and obscure some information by structure and choreography, which give them the power of constructing meanings. Once out of control, this power will profoundly affect the diversity of information, individual autonomy, economic efficiency and many other values, which constitutes a legitimate basis for government intervention. At the same time, subjective judgments in search algorithms make it difficult to ask search engine for “neutrality”which ask for some uniform and objective criteria. Regulatory programs should focus on strengthening information disclosure, using structural rules rationally and encouraging industry self-regulation.
Keyword:
search engine; information; visibility; diversity; individual autonomy;
一、搜索引擎:公共性与“私权力”
继魏则西事件之后, 今日头条的起诉再次将百度置于舆论的风口:2018年1月29日, 今日头条发表声明称, 百度通过搜索算法的干预, 将其负面新闻置顶, 并在搜索页面将其官网红色标出“提醒:该页面因服务不稳定可能无法正常访问”的警告。该声明还引用相关媒体的报道称, 之前江苏省消协就百度违法侵犯用户隐私向法院提起公益民事诉讼后, 该协会网站同样被百度搜索红字标出类似警告。
引发巨大争议的搜索引擎并不限于百度, 几乎在魏则西事件的同时, 美国亦发生了针对谷歌操纵搜索结果, 隐藏希拉里负面新闻, 帮助其竞选的广泛质疑;[1]不久前, 欧盟也因谷歌在其搜索结果中偏向自身的比较购物服务, 而对其处以28亿美元的罚款。[2]
上述事件表明, 商业利益驱动下的搜索引擎, 正在全面影响整个社会的信息传播环境, 如果不在法律层面设计适当的约束机制, 它将对整个社会的知识建构和偏好形成产生巨大的负面影响。
(一) 搜索引擎的公共性
在前互联网时代, 信息的传播依赖一些重要的中介渠道, 例如, 报纸、电台和电视, 信息也大多由控制这些传播设施的公司以一种集中的方式生产。互联网的出现产生了显著的去中介效果, 信息传播不再需要借助某个或某几个关键节点, [3]这种信息传播结构使所有人都拥有几乎无限的发言机会。信息传播瓶颈的打破, 根本性地改变了信息获取、传播、记录和解释的方式, 使他们越来越以一种分散、民主的方式进行, 解放了信息的生产力, 导致信息在供给端的加剧。但是, 受制于生理极限, 个体对信息的吸收能力无法同步增长, 巨大的信息量日渐使信息接受者的注意力成为一种稀缺资源。[4]
由此, 互联网在解决了传统信息传播体系的瓶颈之后, 却在相反的方向遇到了自己的“阿克斯之踵”, 即信息的爆炸和对应的注意力短缺。这种短缺凸显了对信息组织、分类、过滤的重要性。在合格意义上, 信息的过滤者而非信息本身才是真正的王者。正是因为掌握了这种信息过滤的关键位置, 搜索引擎具有了显著的“公共性”:
1. 信息传播的枢纽
搜索引擎聚合了网络上的信息, 并通过对用户提问的回答呈现这些信息, 将信息搜寻者和信息提供者匹配起来, 在这方面, 搜索引擎相当于网络信息的图书馆目录。技术上, 用户如果知道某一网页的网址或统一资源定位符 (Uniform Resource Locator, URL) , 不通过搜索引擎也可以定位到相应的信息。但实际上, 用户大多不会专门记忆这些复杂的地址。而且, 伴随互联网上信息量爆炸式增长以及其分散式分布的特征, 用户并不知道互联网上存在哪些信息, 更不知道这些信息存在于何处。因此, 使用搜索引擎是绝大多数互联网用户获得信息的必要选择。而对信息的发布者来说, 搜索引擎拥有控制相关信息内容的可视度 (visibility) 的巨大力量, [5]能在很大程度上决定相关信息是否能被潜在的读者所获取:
首先, 在绝大多数情况下, 只有当一个网站被搜索引擎收录, 它才有可能被用户找到。在某种意义上, 可以说, 只有被搜索引擎收录的才是存在的;其次, 由于用户寻找信息是需要耗费时间成本的, 它们一旦找到“自认为”合适的信息即会放弃进一步搜寻, 即使可能存在其他更完整、更准确的信息来源。因此, 一个网站的受关注度受其在搜索结果排列位序的高度影响———伴随排序的降低, 关注度也会递减, 不能在搜索结果的前几页显示也相当于不存在。
由此, 搜索引擎占据了现代社会信息传播的枢纽位置, 凭借这种位置, 它们能够深刻地影响公众对相关信息的可及性。[6]
2. 现代社会信息的重要性
在搜索引擎获得现代社会信息传播枢纽位置的同时, 信息对于人的自我发展、社会文化传承、经济发展进步以及民主政治有效运行的重要作用也越来越凸显。伴随网络对日常生产、生活的渗透, 社会也越来越以信息的广泛应用为前提和基础来组织生产、社交和娱乐。因此, 虽然历史上信息对经济社会运行始终具有重要作用, 但在当下, 它所扮演的角色远为复杂, “信息已经渗透到日常生活的所有方面:从公共生活到工作、休闲、教育和消费”。[7]正是在这种意义上, 现代社会被描述为信息社会, 即社会有效运行越来越依赖于电子化的信息和通讯网络, “信息资源日益成为重要生产要素、无形资产和社会财富”[8]。
当某一服务占据了社会生活中的特殊地位, 使得公众对于一些重要资源的获取非常依赖于它, 且其很难被其他类似服务替代时, 我们便可以认定这一服务与公共利益的实现具有非常直接的关联, 具有了显著的公共性。而一旦具有这种公共性, 即使相关服务的提供主体是私人公司, 也不能完全适用私人自治的法则, 而必须在更大程度上向公平、正当等公共价值负责。[9]以此衡量, 搜索引擎具有显著的公共性。
搜索引擎的这种公共性应受到法律的高度重视, 毕竟, 拥有了决定何者被收录、何者被排除、如何排序的权力, 就可以在相当程度上确保哪些内容会成为公众的永久记忆, 哪些内容只是转瞬即逝的插曲。[10]在这个意义上, 搜索引擎拥有建构意义的力量, 借助这种力量, 搜索引擎可以深刻地影响用户的偏好和决策。而且, 这种影响远超出个体层面, 而对整个社会的知识积累、公共讨论产生极为深远的影响。
(二) 凸显与遮蔽的“私权力”
与搜索引擎的公共性对应的是, 少数居于垄断地位的公司控制着搜索服务市场。目前, 我国搜索市场的基本格局为:百度占据统治地位, 其他几家品牌如360、搜搜/搜狗等亦是有影响力的市场参与者。这种寡头竞争的市场格局并非我国独有, 在海外市场, 很多国家也形成了谷歌占统治地位, 其他品牌如雅虎、微软也拥有一定市场影响力的竞争格局。这种现象可能在相当程度上源于搜索市场的内在特点:
其一, 无论是对网络信息资源进行自动勘探, 还是回答量级庞大的用户提问, 均需要大量投资基础设施, 这使得市场巨头相较于初创企业拥有非常巨大的优势;其二, 绝大多数搜索引擎均将算法当作核心商业秘密, 新进入企业无法在已有技术基础上创新, 而且, 算法需要大量用户参与才能不断完善, 但用户基础基本已被市场巨头垄断, 这使搜索市场呈现出强者越强的格局;其三, 搜索引擎的硬件投入和软件开发需要支出, 但是, 每增加一次搜索行为带来的成本几乎可以忽略不计, 这使得搜索引擎具有规模效应, 即那些用户规模较大的企业具有更高的效率。[11]
上述市场结构意味着少数公司拥有影响甚至支配信息流通、凸显或者遮蔽某些信息的巨大能力, 而市场竞争对这一力量并不能提供有效的约束。如果我们遵循韦伯的思路, 将权力理解为在社会关系中哪怕遇到反对也有贯彻自己意志的能力的话, 搜索引擎的运营者显然具备这种权力, 只是这种权力并非法律授权, 而是凭借私人对技术、资源的控制, 属于“私权力”[12]。这种私权力根据商业逻辑行使便会产生与搜索引擎公共性的系统性紧张。
虽然曾有搜索引擎从业人员辩护, 基于商业利益和基于用户需求的搜索结果展示与排序具有内在的一致性。但是, 搜索引擎对商业利益的追求会天然地偏向广告主等客户, 而客户的需求与搜索用户及公共利益的需求并不一致, 两者之间存在天然的紧张关系。实践中, 在竞价排名等商业模式下, 搜索结果可靠性已经引发了广泛的质疑。
而且, 在一些事件中, 搜索引擎公司有意识地操纵搜索结果来凸显或者遮蔽一些消息。前述今日头条的声明, 就表明百度搜索涉嫌故意将竞争对手的负面新闻置于较高的排序来引发关注, 甚至直接在竞争对手的链接上作出某种负面暗示。虽然今日头条的这一指责尚需要法律程序的证实, 但是, 将一个来源并非权威且已经发表数月的文章置于排序首位的确很难说是算法自动产生的结果;而对一个强劲对手的网站的负面提示也大概率是刻意为之。可以想象, 如果百度的确有意识地通过算法调整, 将一些对今日头条带有偏见的文章长期置于搜索排序的前列, 它将使搜索用户形成一种对今日头条带有偏见而非全面的判断。更加严重的是, 从媒体揭露的情况来看, 在一些公关策划下, 搜索引擎故意提高某个网页的搜索排序, 从而营造一个公共事件, 或者降低某些网页的可视度, 来平息公众的舆论等操作已经常态化。
虽然追求商业利益本身是企业存在的目的, 而且持续盈利也是搜索引擎向用户提供稳定、优质服务的基本保障, 但是, 前述公共性和私权力的紧张仍然需要法律高度关注:首先, 大量的、不特定的人群通过搜索引擎来搜寻信息, 同时, 又有大量的、不特定的人群依赖它被潜在的“听众”在浩如烟海的信息中被发现。在这个意义上, 搜索引擎是公众日常信息交流的重要渠道。其次, 搜索引擎的价值也源于公众的参与, 只有大量用户的参与, 才使得搜索算法被不断完善, 也因为大量用户的参与, 才使得搜索引擎对广告者等内容提供者具有价值。而且, 公众对某一搜索引擎的使用越多, 它就越有价值。由此, 搜索引擎价值的关键亦在于其公共性。[13]
正是由于搜索引擎服务于公共交流的功能, 以及其价值源于公众参与的特点, 它需要被适当规制, 以服从于公共利益, 满足作为公众交流、创新和公共参与空间的若干必备条件。否则, 没有这样的规制, 追求利润的冲动将破坏健康的信息交流环境, 从而对诸多法律保护的价值形成破坏。下文将对此重点论述。
二、搜索引擎滥用权力对相关法益的影响
搜索引擎身处信息传播的枢纽位置, 其力量的运用一旦缺乏约束, 服务于有意识的信息操纵, 将对整个社会信息的传播环境造成扭曲, 并对诸多法律保护的价值产生负面影响。
(一) 搜索引擎的滥用会削弱信息的多样性
互联网在现代社会中承载的功能极为复杂, 在某种程度上, 它综合了前互联网时代电话、邮局、电影院、电视、商场、广场及其他众多功能, 从而成为发表意见、便利公共讨论、协助研究等众多活动开展的平台。[14]因此, 这一平台上信息传播的基本结构对于整个社会的政治、经济、教育、文化等有着巨大影响。而搜索引擎控制了这些具有广泛政治、文化、教育意义的信息———而非仅仅是商品和服务的信息———对公众的可视度, 将深刻地影响整个社会信息的多样性。
信息的多样性是指一个社会拥有广泛的、相互竞争的信息来源, 确保这种多样性对公共利益具有非常重要的意义:其一, 只有社会存在广泛的、体现不同观点的信息, 才能在思想领域形成一个有效的市场, 而这种市场对于真理的发现具有非常重要的作用;其二, 多样性的信息有助于从不同角度展开对公共问题的充分讨论, 否则, 一些意见将无法被有效倾听, 这将阻碍社会有效对话, 侵蚀整个社会的公共精神;其三, 多样的信息是更广义的文化多元性的重要因素, 拥有了这种多元文化, 可以给个体提供更丰富的选择, 激发其创造力。[15]
就现实而言, 搜索引擎对搜索结果编排的编辑考量与商业利益的紧密联系导致了对搜索结果过度倾向于商业性信息的系统性偏见。在很大程度上, 他们会倾向于对那些付费更多或者与其有商业合作关系的网站以更高的评价, 而这些网站往往是商业性的。由此, 商业性信息被凸显, 而有关科学、教育、文化等方面的信息将被有意识地遮蔽。[16]因此, 过度的商业化将可能对整个社会的长远发展产生大量的不利影响。而在一些事件中, 人为操纵搜索排序则更为恶性。这些活动导致呈现于公众之前的相关内容是具有高度偏见的, 公众无法获得关于该问题全面的信息, 无法就相关问题进行深入的公共讨论, 妨碍了整个社会的对话, 从而侵蚀了整个社会的民主商谈。[17]
实际上, 信息的多样性是我国《宪法》所保护的重要价值。我国《宪法》第35条规定, 中华人民共和国公民享有表达的自由。[18]这种自由既有对抗国家干预的“主观防御权”面向, 也具客观价值秩序的面向, 即要求国家为表达自由的实现创造条件。[19]我国学界对于前者关注较多, 而对后者较少涉及。现有文献中, 也大多从表达渠道权和媒体近用权等角度展开论述, 以试图解决媒体渠道的有限性导致一些意见事实上难以获得发表的问题。[20]但是, 如本文一开始即论述的, 这些问题已经由于互联网的崛起而得到了有效缓解。与此同时, 伴随互联网上的信息爆炸和用户注意力相对稀缺这一问题的凸显, 已经在事实上发表的信息能否在网络上获得足够的可视度才是日渐突出的矛盾。
客观而言, 信息的可视度问题并不是互联网出现以后的新问题, 历史上, 传统媒体也面临争取读者、听众和观众的竞争。但是, 互联网技术显然极度放大了这一问题:它一方面使信息的发布者数量更加庞大, 分布更加零散;另一方面, 又在传统发布和获得关注之间创造了搜索引擎等新的、居于垄断地位的媒介。在这个意义上, 互联网技术虽然并未从根本上改变个体之间信息交流的本质, 却革新了信息交流的社会条件。凭借这种革新, 搜索引擎使得历史上已存在但并不突出的问题, 迅速由背后走向前台。而正是这种被时代所凸显的问题, 构成了我们需要重新检视的理由。[21]
(二) 搜索引擎的滥用会侵蚀个人自治
在现代政治和法学理论中, 个人自治一直是一个被反复强调的价值。[22]在某种意义上, 我国市场化改革的历史也是对这一价值不断肯认和强调的历史。[23]尽管精确定义个人自治非常困难, 但仍然有一个基本的共识, 即个人自治的核心是人按照自己的意愿选择过一种他认为有意义的生活。由于所有的选择都需要以信息为基础, 搜索引擎对信息可视度的操纵可以导致有意识的信息操纵, 从而侵蚀个人自治。对此, 我们可以借鉴约瑟夫·拉兹 (Joseph Raz) 的理论进行进一步分析。
拉兹将外在力量影响个人选择分为两类, 即强制 (coercion) 和操纵 (manipulation) 。前者是指通过强力限制他人的选择范围, 后者则是有意识地影响他人做出决定、形成偏好。[24]例如, 一个人既可以通过强力抢劫另外一个人的财产, 也可以通过欺骗让他“和平”地移交自己的财产, 但两种方式均违背了当事人的真实意愿。相较于强制, 操纵发生效果的机制更为复杂, 但是, 在某种程度上, 操纵对个人自治的入侵更深。有学者将个人自治分为两个层面的关系:其一, 一个人根据自己的本质形成自己的偏好;其二, 一个人根据自己的偏好采取相应的行动。在这个意义上, 强制只能在第二个层面上影响当事人的自治, 而操纵可以同时在两个层面发生作用。[25]也正因如此, 强制往往会引起相关主体的警觉和反抗, 但操纵则更为隐蔽, 对相关主体的影响更为深远。
操纵的发生一般在于信息的运用, 即通过呈现虚假的、不完整的、不准确的信息来影响当事人。由此可见, 信息与个人自治有着异常紧密的联系。如果少数企业可以控制信息的流动, 选择性地呈现信息, 而且这种选择是专断的、不受制约的, 那么, 根据这些信息形成偏好、采取行动的主体则很难说是自治的。而且, 当搜索引擎隐秘地运用其能力时, 这种对个人自治的入侵将更加深入。因为, 用户无法意识到这种凸显与遮蔽力量的运用。
在此方面, 魏则西事件便是典型的例证:当魏则西及其家人试图通过搜索引擎寻找疾病治疗方案时, 搜索算法向他们呈现的信息, 并非因为算法真诚地确信这些信息与魏则西的问题最相关, 而主要源于商业利益的考量。而且, 对魏则西而言, 这种商业利益的存在并未获得充分的披露。如事件随后展现的, 搜索引擎呈现的这一系列信息至少在相当程度上塑造了魏则西及其家人对细胞免疫治疗技术的理解。由于获得的信息并不完整、准确, 这一理解存有相当多的误解成分。而悲剧正在于, 他们正是基于这种误解, 形成了偏好, 进而做出了治疗决策。
三、搜索算法中的主观判断及其对规制路径的影响
搜索引擎对信息传播的巨大影响使得适当的政府监管成为必要, 然而, 如何设计规制路径仍然需要仔细权衡。一些观点认为应当以提高搜索引擎的“中立性”为规制目标, [26]但是, 考虑到搜索算法设计无法避免的大量主观判断因素, 依据这种思路设计规制路径面临巨大的挑战。
(一) 搜索算法设计中的主观判断因素及其规范意涵
虽然一些监管规则试图将搜索结果区分为“自然的”和“付费的”。[27]但是, 严格意义上, 所有的搜索结果都不是自然的, 它们均受到主观选择的影响, 这些选择本质上体现了算法设计者对信息价值的主观判断。[28]
首先, 当用户进行搜索时, 他并不是在搜索整个互联网, 而是在搜索该引擎建立的网页索引库, 只有被索引库收录的信息, 才可能在之后的搜索结果中被展示。索引库的建立需要借助自动程序 (通常被称为网络机器人, Robot) [29]自动访问并抓取网络上的信息。但是, 由于技术限制, 网络机器人并不能抓取网络上的所有信息:一方面, 网络机器人无法实现对网络信息的全面、适时覆盖, 它只能按照一定的路径去访问网页, [30]这种访问路径是由搜索引擎的技术人员按照一定标准预先设定的, 这种标准本身就决定某个网页是否被访问、何时被访问以及以多大的频率被访问;另一方面, 即使被访问, 网页上的信息也并未被全部抓取或编入索引, 而需按照算法设计者设定的标准筛选。由此, 网页索引库建立过程是算法设计者大量主观选择的后果, 这些选择本质上体现了算法设计者对相应信息价值的主观判断。
其次, 搜索引擎向用户展示搜索结果, 更是大量复杂而精细的人为选择结果:一方面, 当用户向搜索引擎提出问题时, 搜索引擎需要判断其意图, 由于相同用语往往拥有非常不同的含义, 搜索引擎需要考虑复杂的变量, 例如用户的位置、搜索的历史等。因此, 将哪些因素纳入考量并赋予相应的权重, 均是主动选择的结果;另一方面, 搜索结果的排序由非常复杂的算法自动完成, 但是, 选择将哪些因素纳入算法考虑、如何赋予不同因素相应的权重, 有着大量复杂而不同的方案。[31]同样, 在这些步骤中, 不论将何种因素纳入权衡, 均反映了算法设计者对相关网页内容价值的主观意见。[32]
对于搜索引擎算法设计中的这些主观判断因素, 法律应当如何理解和对待, 颇有争论。以美国为代表的一些国外法院据此认为搜索结果展示类似于报刊编辑对相关资讯的编排, 属于一种言论, 应当在很大程度上免于法律干预。Langdon v.Google一案中, 原告认为, 搜索引擎应当刊登其广告, 并“诚实” (honestly) 地对其网站进行评价和排序, 而负责审理的地区法院则认为, 这种主张相当于强迫搜索引擎发表相应言论 (compelled speech) [33];而在另外一个案件Search King, Inc.v.Google Tech., Inc中, 法院也认为, 谷歌对网站的评价和排序属于关于特定网站和用户问题相关性的“观点” (opinion) , 需要获得完全的宪法保护。[34]
上述裁判观点本身争论巨大。首先, 通常意义上的言论, 一般是包含了某些实质性内容的信息, 例如, 网页上的内容可以被视为言论, 而搜索引擎对搜索结果的展示排序, 虽然含有一些表达元素, 但并不具有充分的内容意涵;其次, 搜索引擎作为帮助用户寻找网页内容的选择中介 (selection intermediaries) , 它提供的关于网页的信息属于“关于信息的信息”, 将其作为某种与言论相关的内容, 而不是言论本身更为合适;其三, 搜索引擎对搜索结果的展示, 引导用户去点击相关网页的意图更明显, 而与用户进行主观思想交流的意图更弱, 因此, 它更类似于行为, 而非言论。
此外, 虽然搜索引擎对搜索结果的展示具有一定的主观判断属性, 但是, 无论是搜索引擎自身宣称的, 还是我国现行法制的态度, 均强调其作为消极“通道”的属性, 并以此为基本前提来设计相关规范。其中, 最具代表性的规范, 便是“避风港”原则:当搜索引擎链接的网页存在侵权内容时, 我国现行法律在很大程度上给予了其不同于传统媒体的责任豁免, [35]其原因就在于法律假设它们与传统的媒体有所不同, 只是信息传送的通道。[36]在这种情况下, 再承认搜索引擎主观选择具有独立言论价值, 将引发法律体系的内在矛盾。
因此, 搜索算法设计中的主观判断因素并不能使其排除适当的政府干预, 但是, 它的确表明, 政府干预必须考虑一个重要前提:何为对用户有价值的信息, 不存在一个客观的标准, 而必须诉诸某种主观判断。
(二) 政府规制搜索引擎的路径选择
上述分析表明, 互联网拥有多样化的技术结构, 造就了非常不同的信息交流环境, 基于某个方面的相似性就援用相应的规则, 可能是过于简化的, 规制方案的设计应当深入相关活动在互联网中的具体语境和应用机制, [37]搜索引擎正是这种复杂情况的代表。
一方面, 搜索引擎作为信息筛选的中介, 它的核心功能在于将用户导向某些信息。在这方面, 它更接近于一个相对客观的图书馆目录, 而非努力用自身见解影响用户的媒体, 它扮演的角色相当于信息传送的“通道”。由于通道所具有的公共性特征, 基于公共利益的需要对其施以较强的约束是具有正当性的。
另一方面, 搜索引擎需要判断信息的价值, 虽然这种判断和选择依附于其作为信息传送“通道”的功能, 不具有独立的言论价值, 但是, 基于主观判断的人为选择内在于搜索原理, 无法根除。在一个信息爆炸和注意力短缺的时代, 搜索引擎的核心功能即在于帮助用户节省信息搜寻成本并合理分配注意力, 这必然要借助对信息的选取来实现。但是, 何为对用户有价值的信息, 如何收录网页, 如何认定网页的质量和相关性, 不可能找到一个客观统一的标准, 必须诉诸带有主观判断色彩的选择。
在这个意义上, 正如谷歌的律师所主张的, 搜索引擎展示的搜索结果, 具有主观 (subject) 意见 (opinion) 的因素, 而不能用一个客观 (objective) 标准来要求其符合一定的条件。[38]以此为依据, 以“搜索中立”为目标来设计监管框架的思路需要被审慎对待, 特别是一些关于“有关部门应从信息的采集、软件设计开发等方面加以规范和协调, 建立完整有效的信息索引机制”[39]的强管制建议更是需要得到慎重评估。
监管框架的设计者需要认识到, 搜索引擎的价值虽然在于提供高质量的搜索结果, 然而, 如何定义这种质量却无法形成统一的认识。无论遵循何种技术路线, 都无法消除主观判断和价值分歧。毕竟, 何为高质量的信息, 即使相同的人在不同语境下也可能得出完全相反的结论;而且, 对信息的主观评价亦包含了心理、审美、伦理等大量复杂因素, 既没有可能也没有必要给出统一的标准。由此, 政府规制的路径应当聚焦于强化搜索引擎信息披露责任、避免商业模式的滥用、禁止为了不正当利益而在个别事件中修改算法操纵搜索结果, 从而避免直接介入搜索引擎自主的判断空间。
四、寻求理性的规制方案
魏则西事件之后, 国家互联网信息办公室 (以下简称“网信办”) 迅速出台了《互联网信息搜索服务管理规定》 (以下简称《规定》) 。透过《规定》, 网信办已经明确自己是互联网信息搜索服务的监督管理执法主体, 这意味着它可能进一步在执法过程中发展出更为详尽的监管要求。然而, 理性的规制亦需要妥善设计规制方案。特别是对于互联网这一生态复杂、演化迅速的领域, 不必要的规制既无法达到目标, 还会阻碍创新, 侵蚀互联网服务公共福祉的能力。
(一) 慎重干预搜索引擎的算法设计
目前, 《规定》要求搜索引擎提供客观、公正、权威的搜索结果。虽然《规定》对于如何判断是否客观、公正、权威, 未给出具体的标准, 但是, 监管部门在就魏则西事件处理百度时, 曾尝试提出相应标准, 要求百度调整相关技术系统以信誉度为主要权重排名。这种直接为搜索引擎算法设定标准的思路可能过于激进。
如前所述, 无论根据何种标准, 都无法消除个人对搜索质量的主观判断和价值分歧。在此情况下, 政府直接干预搜索算法的设计, 尝试给出一个唯一“客观”的标准是不现实的。而且, 搜索引擎开发的算法固然具有一定的偏见, 但政府直接介入算法设计的挑战则在于, 如何确保监管标准本身不偏好某些内容, 而歧视另外一些内容。同时, 又如何证明后者比前者更可接受。
以监管部门提出的“信誉度”标准为例, 虽然它并未具体指出这种“信誉度”为何, 但从语义而言, 它更偏好那些在市场中已经建立了声誉的成功企业。以此作为算法的基准, 客观上将强化已成功企业的优势地位, 同时对初创企业更为不利。如果搜索引擎基于自身的判断采取这一标准并无问题, 而政府强制推行这一标准, 则会产生不平等对待的问题。与此同时, 政府规制标准要求所有搜索引擎必须执行, 这会挤压不同搜索引擎提供差异化搜索结果的空间, 反过来破坏政府规制本身需要追求的保护信息多样性的目标。
除去上述规范层面的考量, 大量技术问题也导致政府直接干预算法设计很可能是得不偿失的。网络空间技术复杂、演化迅速, 很容易导致直接干预技术设计的规制方案刚刚颁布就失去意义。[40]因此, 一旦监管部门决定从实质上干预搜索引擎的算法, 就面临及时将规制方案与技术革新相同步的巨大的挑战。[41]因此, 后果很可能是要么监管要求无法得到实际执行, 要么监管要求束缚了技术的发展。
因此, 政府对算法的干预应当克制。某种情形下, 政府对搜索算法可以提出一些负面清单。例如, 监管规则可以要求, 搜索引擎不得基于不正当利益而修改算法进而凸显或者遮蔽特定信息。但是, 政府规制应避免尝试推广一套统一的体系。
(二) 扩张信息披露的适用范围
相较于直接干预算法设计, 通过信息披露提高搜索结果透明度来确保公众和受影响的企业准确理解搜索结论, 并督促搜索引擎自我约束, 可能是更为稳妥的规制方案:一方面, 用户向搜索引擎提出问题, 是因为它拥有远强于用户自身的答案发现能力, 在这方面, 搜索引擎与律师、医生等传统的专业顾问具有高度的相似性。传统的信托义务要求专业人士以客户利益行事, 避免自身利益与客户利益的冲突。搜索引擎的特殊之处在于, 它无法向用户收费, 而只能依赖于其他收入。既然潜在的利益冲突不可避免, 充分、及时地披露应当成为一种底线要求。[42]另一方面, 借助搜索算法重要考量的披露, 特别是有关搜索结果排序和搜索引擎商业利益关联信息的披露, 用户可以意识到相关搜索结果的潜在缺陷, 从而采取更为审慎的态度, 并寻求通过其他信息来源来验证所获得信息的质量。这样, 可以在相当程度上降低搜索引擎选择性呈现信息对个人自治的影响。
具体而言, 这种以建立透明度为目标的信息披露规则可以从强化搜索引擎披露其商业利益对搜索结果潜在影响的信息入手。实际上, 《规定》已经明确要求搜索引擎醒目区分自然搜索结果与付费搜索信息, 对付费搜索信息逐条加注显著标识。鉴于信息披露在搜索引擎规制中的重要意义, 这一规定还有进一步完善的空间:对于何为“显著”, 监管部门可以考虑制定进一步的指南, 例如, 是否需要在不同于自然搜索结果的单独区域显示, 或者是否需要用不同于自然搜索结果的颜色标明, 等等。[43]
更重要的是, 上述规定还是仅限于竞价排名这一搜索引擎的传统商业模式, 但实际上, 搜索引擎的商业模式一直处于变迁之中, 监管部门必须对新的商业模式所带来的利益冲突保持特别的关注。例如, 目前, 不少搜索引擎的运营者同时也是内容的提供者, 或者控制了一些内容的提供者。以百度为例, 除搜索之外, 它已经在其本地生活服务、视频、医疗、房产、教育、旅游等方面有广泛布局, 这使得它有充分的利益将更多读者导向自己的战略伙伴, 而这种导向不一定以付费为对价。对此, 监管部门应当将商业模式不断变化所导致的利益冲突问题予以全面考量, 并适时设定信息披露的准则。
(三) 合理使用结构性规制
搜索引擎的商业模式使其偏好商业性的信息, 而对教育、文化、学术等信息形成了系统性的歧视。因此, 监管部门试图引入结构性规制来矫正这种歧视。例如, 在魏则西事件之后, 监管部门明确要求百度严格限制商业推广信息比例, 每页面不得超过30%。
这种控制的正当性在于, 当竞争充分时, 信息传播渠道的控制者对某些内容的偏好可借助不同的信息获取渠道得到制约。然而, 当信息获取渠道具有稀缺性时, 法律可能要求搜索引擎经营者负有呈现信息的义务, 为诸如教育、文化等处于弱势的信息提供一个被显示的机会, 从而维护公众利益。结构性控制在一些国家对传统媒体的监管实践中, 亦有体现。例如, 在美国, 广播者被要求覆盖一些公共议题, 并为正反两方的意见提供公平的表达机会;有限电视公司被要求为公共、教育和政府频道留出空间;卫星通讯公司也要为教育目的项目留出空间。[44]在我国, 传统的媒体, 如电台、电视频道等由国有企业控制, 它们对内容选择所产生的问题可以由政府内部的政策指令推动, 基于法律层面的规制需求并不强烈。然而, 搜索引擎的特殊之处在于, 它是由私人资本投资并控制的, 但实际上却构成了公共交流网络的瓶颈设施。因此, 通过法律授权, 对于这些渠道施以一定的公益约束有其正当性。
但是, 这种结构性规制毕竟影响了搜索引擎的盈利能力, 一旦超出一定限度, 可能越过财产权需要承担的社会义务的界限, 构成管制性征收, [45]从而引发进一步的法律争论。[46]而且, 一些特殊类型的搜索引擎, 可能并不适合采取结构性规制。例如, 一些主要提供价格比较的电子商务类搜索引擎可能采取付费收录的模式, 即只有付费会员的网站, 才会在搜索结果中被展示。这些搜索引擎的核心功能本在于撮合交易, 而非提供公共交流, 并无适用结构性规制的必要。
因此, 未来可以考虑要求搜索行业制定行业性的自律规范, 对不同类型的搜索引擎作出不同的要求。[47]此外, 矫正搜索引擎商业化导致的内容偏好并不一定仅仅依靠结构性规制的方法。要求具有政府背景的搜索引擎提供商业搜索引擎没有动力提供的服务, 也是可以依赖的路径。目前, 我国本身已经存有中国搜索等搜索“国家队”, 从实际运营来看, 它们也非常注重关键词广告等商业收入, 从而与私人搜索引擎的功能高度重合。从政府与市场关系的角度, 这类搜索引擎应当定位于补充市场之不足, 而非直接与市场主体在相同领域竞争。因此, 对这类搜索引擎进行公益化改造, 弥补商业搜索引擎之不足, 亦可成为可以考虑的政策选项。
(四) 强化行业的自我规制
目前, 对于信息传播环境影响最明显的情形是, 搜索引擎对特定内容通过算法调整予以凸显或者遮蔽。这种活动在一些情况下是根据法律的要求作出, 例如, 《办法》要求搜索引擎发现含有法律法规禁止内容的信息, 应停止提供相关搜索结果。[48]但是, 在很多情况下, 搜索引擎则是受到公关活动的影响, 来营造或者平息一项热点。对此, 《办法》要求除了前述理由外, 搜索引擎应当尽量避免积极干预搜索结果, 不得为了“牟取不正当利益”, 而“断开相关链接或者提供含有虚假信息的搜索结果”, [49]也不得通过“干预新闻信息呈现或搜索结果等手段谋取不正当利益”。[50]
问题在于, 上述规定缺乏有效的执行机制:一方面, 搜索引擎的商业利益非常隐蔽, 而搜索引擎本身有大量的裁量空间去判断有关内容是否需要被阻止。因此, 如何防止搜索引擎以执行法律要求为名, 掩盖不正当的商业利益, 挑战巨大。实际上, 2011年, 当中央电视台连续报道百度竞价排名引发的问题后, 百度曾屏蔽了有关报道, 理由便是报道违反相关法律法规;另一方面, 搜索算法也具有高度的复杂性, 某些搜索结果的呈现是根据算法本身运行的结果, 还是人为对算法的个别处理操纵, 需要大量技术层面的判断, 监管部门基于预算和编制的有限性, 难以凭一己之力查证。
对此, 一个可行的办法是从法律层面强化行业的自我规制, 即当某个网页内容在搜索结果出现异常变动, 进而影响到相关方利益时, 相关方可以向行业自律组织提出申诉, 由其进行调查, 而法律承认行业自律组织的认定甚至处理决定。这样, 搜索引擎对搜索结果的影响将处于相对专业的同行的监督之下, 受到一定的约束。同时, 在确有必要由监管部门正式介入的情况下, 行业自律组织的认定和处理, 也可以为监管部门提供大量的证据和线索。
实际上, 在今日头条诉百度事件中, 就可以发现这种自律机制的重要性:在今日头条质疑百度操纵搜索算法, 故意将其负面新闻置顶之后;百度则称搜索结果排序与用户需求、相关性、时效性以及用户的点击行为等一系列因素相关, 该条内容被置顶是搜索算法的自然结果。这一分歧事实的认定对于法律层面的处理具有关键意义, 但是, 无论是监管部门还是法院实际上并无技术能力进行认定, 而由行业自律组织自我规制则是可行的。
五、结语
互联网演化发展至今天, 理论上, 我们仍然有无数途径可以去获取信息、发表意见。但实际上, 我们能否根据自身真实的意愿和需求获得相应信息, 我们能否有效地将自己的意见传达给潜在的读者, 越来越依赖于搜索引擎这类服务。然而, 这些具有支配地位的网站, 其商业利益与我们自身的利益并非完全一致, 它们有潜在的冲动去操纵我们所能获得的信息范围, 进而引导我们对世界的认知, 对商品和服务的选择。在这一过程中, 就个体而言, 个人自治的空间受到挤压;就社会而言, 知识传播的质量受到削弱, 对公共问题的讨论也会被扭曲。
因此, 虽然搜索引擎技术及其商业模式自诞生之日便争议不断, 法律学者也已从广告法、知识产权法等具体层面展开了广泛讨论。但是, 魏则西案、今日头条诉百度纠纷案等的独特意义在于, 它们提醒我们去更加全面地审视搜索引擎在现代社会信息传播中的独特作用, 去思考搜索引擎服务所具有的“公共性”和其运营者未受充分约束的“私权力”之间的巨大紧张。
如何处理这种紧张, 在本质上取决于我们希望法律维护何种价值。实际上, 搜索引擎已经在相当程度上成为公众观察、认知世界的窗口。问题在于, 我们希望透过这个窗口获得关于这个世界客观、完整的图景, 还是愿意任由它提供扭曲、剪切的画面。正是出于对后者的担心, 本文提出对搜索引擎探索建立一套更具整合性、系统性的规制体系。这套体系尽管在具体规制措施上需要因应搜索引擎技术的固有逻辑, 避免激进、过度, 但在立场上则应立足于维护整个互联网信息传播秩序的高度, 在审慎权衡的基础上, 设定商业主体的基本行为准则, 进而确保社会公共利益得到切实的维护。
唯此, 我们才能确保资本与科技结合这一已经取得巨大成功的模式, 继续服务于公众的福祉;唯此, 我们才能确保社会对互联网未来的信心。
注释
1参见缪琦、刘佳、钱童心:《谷歌有没有为了希拉里而“作恶”》, 载《第一财经日报》2016年6月13日, 第A1版。对于搜索引擎选择性地呈现信息对社会的政治观点的影响的进一步分析, 可参见Jonathan Zittrain, Engineering an Election, 127 Harvard Law Review Forum 335, 335-341 (2016) 。
2详细的介绍与分析, 可参见邓志松、戴健民:《数字经济的垄断与竞争:兼评欧盟谷歌反垄断案》, 载《中国市场监管研究》2017年第10期, 第32-35页。
3这种从终端到终端直接交流对互联网的意义, 可以参见Lawrence Lessig, The Future of Ideas:The Fate of the Commons in a Connected World 34 (Random House Inc.2001) 。
4有学者认为, 信息时代, 稀缺性即在于人类有效利用信息的注意力。Richard A.Lanham, The Economics of Attention:Style and Substance in the Age of Information 7 (University of Chicago Press 2006) .
5Yochai Benkler, The Wealth of Networks:How Social Production Transforms Markets and Freedom 199 (Yale University Press 2006) .
6See John Battelle, The Search:How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture 1 (Penguin Group2005) .
7McQ uail, Media Accountability and Freedom of Publication 4 (Oxford University Press 2003) .
8《2006-2020年国家信息化发展战略》 (中办发[2006]11号) 。
9See Robert W.Crandall, The Remedy for the“Bottleneck Monopoly”in Telecom:Isolate It, Share It, or Ignore It?72 University of Chicago Law Review 3, 10 (2005) .
10Alexander Halavais, Search Engine Society 1 (Polity Press 2008) .
11See Oren Bracha&Frank Pasquale, Federal Search Commission?Access, Fairness, and Accountability in the Law of Search, 93 Cornell Law Review 1149, 1181-1182 (2008) .
12这里使用的“权力”的概念并非规范层面的, 而是描述性的, 即一方“事实上”拥有的影响和支配力量。这种力量在寡头垄断的互联网领域较为普遍, 详细分析可以参见周辉:《变革与选择:私权力视角下的网络治理》, 北京大学出版社2016年版, 第45-53页。
13此外, 搜索引擎的价值也依赖于其用户产生的内容。Jack Balkin, Media Access:A Question of Design, 76 George Washington Law Review 933, 937 (2008) .
14Roy Rosenzweig, How Will the Net’s History Be Written?Historians and the Internet, in Academy and the Internet 26 (Helen Nissenbaum&Monroe E.Price eds., Peter Lang Publishing Company 2004) .
15See Urs Gasser, Regulating Search Engines:Taking Stock and Looking Ahead, 8 Yale Journal of Law and Technology 201, 228 (2006) .
16参见王秀峰、柯青:《搜索引擎的商业行为分析与思考》, 载《情报科学》2005年第7期, 第1114-1118页。
17有学者特别批评了搜索引擎对搜索结果的特定干预, 并认为需要通过强有力的政府规制来迫使搜索引擎更全面地披露这种干预的原因。See Oren Bracha&Frank Pasquale, Federal Search Commission?Access, Fairness, and Accountability in the Law of Search, 93 Cornell Law Review 1149, 1171-1179 (2008) .
18我国《宪法》第35条规定, 中华人民共和国公民有言论、出版、集会、结社、游行、示威的自由。
19参见张翔:《基本权利的双重性质》, 载《法学研究》2005年第3期, 第21-36页。
20参见李树忠:《表达渠道权与民主政治》, 载《中国法学》2003年第5期, 第50-56页;闫海:《表达自由、媒体近用权与政府规制》, 载《比较法研究》2008年第4期, 第46-56页。
21See Jack M.Balkin, Digital Speech and Democratic Culture:A Theory of Freedom of Expression for the Information Society, 79 New York University Law Review 1, 2 (2004) .
22代表性的讨论可以参见Gerald Dworkin, The Theory and Practice of Autonomy 6 (Cambridge University Press 1988) 。
23市场经济和个人自治的关系, 典型的体现便是改革开放后民法对意思自治的确认。参见江平、张礼洪:《市场经济和意思自治》, 载《法学研究》1993年第6期, 第20-25页。
24Joseph Raz, The Morality of Freedom 377 (Clarendon Press 1986) .
25Yochai Benkler, Siren Songs and Amish Children:Autonomy, Information, and Law, 76 New York University Law Review 23, 38 (2001) .
26邓元宏:《搜索中立和搜索偏向在美国的争论和理论分析》, 载《新闻界》2016年15期, 第62-66页;金耀星:《魏则西事件与搜索中立》, 载《人民邮电》2016年5月12日, 第3版。
27例如, 《互联网信息搜索服务管理规定》第11条要求, “醒目区分自然搜索结果与付费搜索信息”, 对付费搜索信息逐条加注显著标识。
28Lucas D.Introna&Helen Nissenbaum, Shaping the Web:Why the Politics of Search Engines Matters, 16 The Information Society 169, 171-175 (2000) .
29也被称作网络游客、爬虫程序、蜘蛛程序等。
30除了技术限制外, 网页所有者的态度也会限制搜索引擎的收录, 网页的所有者对网页内容享有版权等权利, 它可以通过技术手段限制网络机器人访问, 也可以设定自己网站机器人协议 (robots协议) 来禁止搜索引擎收录。
31有学者曾梳理了排序技术的发展, 参见杨思洛:《搜索引擎的排序技术研究》, 载《现代图书情报技术》2005年第1期, 第43-47页。
32See Eric Goldman, Search Engine Bias and the Demise of Search Engine Utopianism, 8 Yale Journal of Law and Technology 188, 191 (2005) .
33Langdon v.Google, Inc., 474 F.Supp.2d 622, 629 (D.Del.2007) .
34Search King, Inc.v.Google Tech., Inc., No.CIV-02-1457-M, 2003 U.S.Dist.LEXIS 27193, 6-12 (W.D.Okla.May 27, 2003) .
35相关分析参见张新宝、任鸿雁:《互联网上的侵权责任:〈侵权责任法〉第36条解读》, 载《中国人民大学学报》2010年第4期, 第17-25页;王迁:《〈信息网络传播权保护条例〉中“避风港”规则的效力》, 载《法学》2010年第6期, 第128-140页。
36例如, 在“华纳唱片有限公司、环球唱片有限公司、SONY音乐娱乐香港有限公司诉北京百度网讯科技有限公司等侵犯录音制作者信息网络传播权纠纷案”中, 法院认为, “百度公司是根据网络用户的指令进行搜索、建立临时链接, 基于这种服务的技术、自动和被动等性质, 即使百度公司施予与其能力相当的注意, 也难以知道其所提供服务涉及到的信息是否侵权”。该案例被最高人民法院列入《2011年度全国法院知识产权司法保护十大案件》, 因而对法院的观点具有代表性。
37Timothy Wu, Application-Centered Internet Analysis, 85 Virginia Law Review 1163, 1168 (1999) .
38Search King, Inc.v.Google Tech., Inc., No.CIV-02-1457-M, 2003 U.S.Dist.LEXIS 27193, 9-12 (W.D.Okla.May 27, 2003) .
39赵建国:《把搜索引擎作为重要公共物品来建构》, 载《新闻界》2009年第6期, 第6-7页。
40总体而言, 由于技术变化迅速, 政府直接对技术管制的历史, 基本上就是一部充满失败案例的历史。对此, 有学者曾以政府对DAT, CD, MP4等技术规制的事例论证, 每当形成对一个技术的规制法案, 就有新的技术替代原来的技术。William W.Fisher III, Promises to Keep:Technology, Law, and the Future of Entertainment 83 (Stanford University Press 2004) .
41See Herbert Burkert, Four Myths about Regulating the Information Society-A Comment, in Starting Points for ICT Regulation:Deconstructing Prevalent Policy One-Liners 240 (Bert-Jaap Koop et al.eds., T.M.C Asser Press 2006) .
42有学者专门论述过数字时代的信息信托关系。See Jack M.Balkin, Information Fiduciaries and the First Amendment, 49 UC Davis Law Review 1183, 1205-1209 (2016) .
43有学者对此提出了相应的建议。See Andrew Sinclair, Regulation of Paid Listings in Internet Search Engines:A Proposal for FTC Action, 10 Boston University Journal of Science and Technology Law 145, 162 (2004) .
44Jack M.Balkin, Digital Speech and Democratic Culture:A Theory of Freedom of Expression for the Information Society, 79 New York University Law Review 1, 2 (2004) .
45两者的界限参见林华、俞祺:《论管制征收的认定标准--以德国、美国学说及判例为中心》, 载《行政法学研究》2013年第4期, 第124-131页。
46一旦构成管制性征收, 将引发政府补偿的问题。正因如此, 也有学者主张通过政府向商业搜索引擎提供补贴的方式来强化搜索引擎的公共产品属性。参见赵勋:《论搜索引擎服务的准公共产品属性与竞价排名》, 载《理论导刊》2011年第2期, 第61-63页。
47这种自律机制在我国互联网搜索行业已经存在, 例如在百度和奇虎360关于机器人协议的争论后, 中国互联网协会于2012年11月1日发布了《互联网搜索引擎服务自律公约》, 该公约的发起单位包括百度、即刻搜索、盘古搜索、奇虎360、盛大文学、搜狗、腾讯、网易、新浪、宜搜、易查无限、中搜。
48《互联网信息搜索服务管理规定》第8条规定:“互联网信息搜索服务提供者提供服务过程中发现搜索结果明显含有法律法规禁止内容的信息、网站及应用, 应当停止提供相关搜索结果, 保存有关记录, 并及时向国家或者地方互联网信息办公室报告。”
49参见《互联网信息搜索服务管理规定》第9条。
50参见《互联网新闻信息服务管理规定》第13条。