摘 要: 本文简要介绍了搜索引擎的原理,指出了大数据环境下搜索引擎用户数据信息存在的安全问题,并针对当今大数据发展趋势,提出了保障搜索引擎用户信息安全的建议。文章具有一定的参考价值。
关键词: 大数据; 搜索引擎; 信息安全;
在大数据时代,搜索引擎帮助用户获取了众多的信息,给用户带来了极大的方便。但是,也引起了一系列的信息安全问题。因此有必要就大数据趋势下的搜索引擎用户信息安全问题进行深入探讨。
1 、搜索引擎原理
通常情况下,搜索引擎可以通过定期搜索和提交网站搜索两种方式实现自动信息搜集功能。其中,定期搜索是通过引擎派出的“蜘蛛”程序实现对IP地址范围内的互联网站的检索。如果在检索过程中发现了新的网站,就会将其自动提取到自己的数据库中。而提交网站搜索是网站拥有者主动向搜索引擎提交网址。
2 、大数据环境下搜索引擎用户信息安全存在的问题
2.1 、信息失真
在使用搜索引擎的时候经常会遇到精度降低、信息失真的问题。用户在利用引擎进行搜索的过程中经常会面临众多的虚假信息,其还会严重威胁个人的生命财产安全。并且,有的钓鱼网站专门冒充正常网站发布很多的虚假信息,给大数据信息的可靠性造成了严重的影响。图1展示了搜索引擎常见的安全事件所占比例。
2.2 、诱发诈骗
在数据信息层出不穷的今天,用户总会不知不觉泄露部分个人隐私。例如在在线交互时,浏览过程也会带来许多副产物,个别非法用户将其进行深入挖掘就会发现其潜在的商业价值,这样不法分子就会通过量化搜索的方式寻求更多的信息,并在此基础上实施诈骗。
图1 搜索引擎发生安全事件所占比例
2.3、 个人信息泄露
就目前互联网的使用情况来看,大部分用户在信息安全方面的意识还比较淡薄。例如,在登录社交网站或者使用公共Wi Fi时,通常要对账户密码进行设置,而这在无形之中就让用户同意了相关的用户协议。在大数据全面普及开来的今天,搜索引擎已全方位融入了我们的工作与生活。尽管大数据为我们提供了众多便捷的服务,但也出现了相当数量的信息泄露事件。不过据调查,用户在使用搜索引擎发生安全事件后,基本只是对相应网址进行了屏蔽或者减少了对相应搜索引擎的使用频率,而对有关问题进行申诉或投诉的用户相当少。
2.4、 数据信息无意识泄露
在大数据时代,网络信息相关技术都在不断发展、不断普及,无论对于个人,还是对于社会、企业以及政府等部门,只要其在网络上有过运行信息,与之有关的身份特征、使用习惯、关注点、兴趣、爱好以及资料等有关信息都会成为能够被存储、被用于分析的数据。所以,对于网络社会来说,任何人的任何行为都会一直处于被实时监视的状态,只要在信息网络中有过的行为都必然会留下足迹。需要关注的是,通常情况下,在信息网络中留下的种种痕迹都会以数据的形式留存在相关的信息系统中,加上当今大力推进的大数据技术的支持,这些数据信息就很容易被整合、计算与处理。基于以上分析不难看出,上述众多无意识的行为很容易成为非法分子恶意网络搜索、恶意网络攻击、恶意窃取信息的途径,并且这些类型的资源是十分容易且无意识、有针对性地威胁到个人、社会、企业以及政府机构等的安全的。所以,如果不懂得正确应用大数据信息技术,就很有可能给社会乃至国家带来众多的安全隐患。
3、 大数据趋势下保障搜索引擎用户信息安全的建议
3.1、 管理方面
(1)明确数据使用者的责任
一方面,数据使用者应当充分了解自身的责任,要有意识地保证其输出数据结果的真实性、可靠性。同时,数据使用者要注意设置隐私保护模式。特别是在当今大数据技术突飞猛进的时代,数据使用者要更加注意自身行为,要勇敢担起自身责任,禁止出现个人数据被非法再利用的行为出现。
(2)提升搜索行业的自律性
事实上,出现用户数据信息安全问题并不是单独某个搜索引擎造成的,整个搜索行业都有脱不开的关系。因此,整个搜索引擎行业都应当高度重视自律性问题。为此,相关的搜索引擎企业需要制定科学、有效的行业准则,不断提升员工的职业操守,全方位规范对数据的操作行为,严格避免操作不当或为了谋取商业利益造成用户信息被泄露等一系列的安全问题。
(3)完善相关的法律保护
尽管我国已出台了《侵权责任法》、《信息安全技术公共及商用服务信息系统个人信息保护指南》等相关规定用于保护个人信息安全。但是,总体来说我国在用户信息安全保护方面的法规条例还相对零散。因此,必须结合大数据时代的特征制定针对性强的有关法律保护,以不断完善大数据时代的隐私保护法。
3.2、 技术方面
(1)用户安全补丁
一方面,用户要注意有效利用安全补丁修复系统漏洞,以更好地解决网络信息问题。同时,用户应当意识到自己才是处理网络数据信息安全问题的最好补丁。因此,用户必须想方设法不断提升自身的知识水平与自我保护能力,让自己具有充足的能力评估威胁,从而全力维护个人信息的私密性。
(2)技术保护
为了在充分实现大数据安全高效搜索的同时做好隐私保护,就要在技术保护方面下足功夫。如图2所示,可以从大数据中信息归约与知识发掘、用户搜索需求感知的任务表示与管理以及隐私感知的快速高精度智慧解答等方面入手,寻求科学的技术支撑。
针对以上三大科学问题,将内容细致划分并寻求各自的特点。如图3所示,要深入挖掘面向大数据的信息融合以及知识萃取的相关技术,要充分考虑大数据高维度、时空演化等特有属性研究粒度化的知识表示和推演技术。由于现有的用户平台不能充分感知不同用户的个性化需求,而且众多平台的特征参数未对用户透明,所以要考虑建设支持平台与用户互动的搜索任务表示模型。同时,要全面掌握用户搜索任务的数据资源特点,着力研究基于用户体验驱动的任务管理技术。另外,大数据搜索是具有生命周期的,要结合不同阶段的特征搭建基于差分隐私的安全搜索机制。
图2 技术支撑关系
图3 科学问题细化
4 、结论
在大数据趋势下,搜索引擎用户信息安全面临着众多的问题与威胁。因此,必须结合行业特征,利用科学方法,采取有效监管措施保证数据信息安全。
参考文献
[1]王赛.营销4.0:从传统到数字,营销的“变”与“不变”—“现代营销学之父”菲利普·科特勒专访[J].清华管理评论,2017(03):60-64.
[2]许超.面向信息安全的垂直搜索引擎的研究与实现[D].上海:华东理工大学,2014.
[3]梅丹.基于信息安全领域本体的语义搜索引擎的设计与实现[D].上海:华东理工大学,2012.
[4]陈华,黄东军.搜索引擎与个人信息安全[J].电脑知识与技术,2010(11):2584-2585,2590.
[5](英)维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012.
[6]周丽娜.大数据背景下的网络隐私法律保护:搜索引擎、社交媒体与被遗忘权[J].国际新闻界,2015(8):136-153.