摘要:伴随着互联网技术的蓬勃发展, 各种类别的企业信息与数据日益剧增。这不可避免涉及信息安全、身份安全校验、信息权限管控的问题。在庞大的数据中如何安全快速查询出相关联的, 如何提高数据准确性, 并对特定数据针对特定的用户身份进行过滤与展示, 显得尤为重要。基于此, 重点围绕百事通搜索引擎解决准确搜索与权限的问题。
关键词:搜索引擎; 关联数据; 权限;
Inquiry Based on Search Engine and Authority Platform
Zhao Jun Song Weiping Yang Fan Zhong Bingzhi
Aostar Information Technologies Co., Ltd.
Abstract:
With the vigorous development of Internet technology, the information and data of all kinds of enterprises are increasing dramatically. This inevitably involves information security, identity security check, and information permissions control. It is particularly important how to quickly and quickly query the correlation in the huge data, how to improve the accuracy of the data, and to filter and display specific data for specific user identity. This article will focus on the search engine and search engine to solve the problem of accurate search and permission.
Keyword:
search engines; associated data; permission;
1 引言
伴随着我国城市化建设的加快, 经济实力的不断加强, 人们对出行方式的多种选择, 那么研发一种快捷、准确的出行数据查询方式显得尤为重要。同时, 考虑到出行数据对不同企业或单位的安全隐患问题, “交通百事通”应运而生。
2 一般性搜索引擎的开发背景
现阶段的搜索一般都类似于百度、谷歌、搜狗等的数据信息搜索平台[1,2,3,4,5]。这些平台的信息虽然经过信息化处理, 最终实现了对数据的搜索与关联。但是, 还存在以下问题。
(1) 数据没有针对特定角色或用户进行权限分类与数据过滤; (2) 类似于特定区域的数据没有进行数据减缩, 例如, 某些地名没有实现地理位置的区域进行缩放, 存在地名查询不到的情况; (3) 类似于特定的交通道路数据更新周期过长, 没有达到即时性; (4) 缺少业务场景的关联, 无法满足用户多元化的运用; (5) 针对交通出行的引擎搜索凤毛麟角, 一般都是类似于高德的道路查询场景。由于以上条件的存在与限制, 交通方面的搜索引擎始终没有达到期望, 这对交通百事通搜索引擎的开发与应用就显得尤为迫切与重要。
3 交通百事通搜索引擎的工作原理
(1) 将当地的交通数据按照某种特定的规则进行基础数据整理与归类, 随后保存到搜索平台的数据库中; (2) 将数据库中的分类数据建立对应分类后的索引以便于后续的检索; (3) 同时, 对即时数据通过远程抓取来获取, 进行更新保障数据的即时性; (4) 对于不同角色用户建立不同的访问权限并保存到数据库中。具体如图1所示。
图1 工作原理
4 交通百事通搜索引擎设计方案
(1) 针对特定业务建立对应的场景搜索:面对数据较多的普通搜索需建立单独的搜索场景进行搜索, 以此提高搜索效率, 例如, 针对互联网中的热门新闻搜索达到数百万的检索, 不适合统一于其他场景搜索。 (2) 对于整理在数据库中的数据采用索引检索, 在对应的搜索场景中建立对应的搜索场景并对进入该场景的用户角色进行限定, 即一般性用户无法访问该查询界面。 (3) 数据关联性检索, 隐私性类信息与非隐私性类数据在保存初期建立相应的字段用于数据库保存时作为区别[6,7,8,9,10,11,12]。在数据相互关联时且信息隐私字段一致则可以进行关联查询。实现场景之间可以相互通过超链接关键字进行相互查询。例如:查询车牌号显示对应驾驶员, 通过驾驶员的个人交通过往违规情况对用户进行适当提醒。为实现该检索, 需要将数据库中的各个索引文件进行合并与同步, 最终将合并后的索引运用到全文检索中。 (4) 建立一个公共的综合搜索场景来实现对全文检索, 设计实现方案类似与第3点。此外, 公共搜索场景搜索出的结果在点击后可以输入特定的数据调用涉及该信息的场景。例如:在综合搜索中输入车牌号, 搜索结果除对应的结果外, 还需要将查询驾驶员的人员信息接口调出。
5 交通百事通搜索引擎的权限方案
本系统的权限根据不同单位或企业进行一级分类, 根据不同的用户在系统中扮演的不同角色进行二级分类[13,14,15,16,17]。一级分类主要用于系统中各个不同查询场景进行权限控制;二级分类主要用于对数据的增删改查的权限控制, 就一般用户而言只有查询的权限, 而类似单位管理员具有增删改数据的权限。具体如图2所示。
图2 权限方案
6 搜索引擎未来的展望
目前, 在互联网行业搜索引擎在权限管理领域还存在很大发展空间, 从用户的立场来说除能提高搜索的准确性外, 还能够使权限的管控更加清晰化、透明化。 (1) 如何提高用户数据的搜索的准确度, 除增加搜索词的精确分词外, 对用户搜索词的分析也显得尤为重要。掌握不同用户的搜索习惯, 并给予关联度高的信息推送也将是一个亮点。这里面也可能涉及当下火热的人工智能, 通过用户搜索词搜索不断训练搜索集, 使推送信息的准确率大幅度提升也无不可能。 (2) 对于搜索权限的问题探究也很有必要, 权限问题一般来说都涉及信息敏感问题, 对于一般企业而言, 担忧的莫过于商业信息的泄露, 能够在搜索数据的同时对搜索人员的权限加以控制, 对企业的数据安全将达到新的领域。
7 结语
目前, 交通百事通系统的权限控制是对数据的拥有者与查询者进行权限限定, 但这并不是最安全的方法。最安全的方法是对数据本身进行限制, 而不是对数据访问进行限制。随着未来人们对数据安全有更大的需求, 将会有新的检索机制解决其中的技术问题, 让人们享受到数据准确与权限并存的优质服务。
参考文献
[1]阮卫华.搜索引擎优化技术的研究与实现[J].软件, 2014 (7) :72-77.
[2]梁宏倩.Web搜索引擎及优化的研究与应用[D].西安:西安电子科技大学, 2010.
[3]人民网.刘建国:中文搜索引擎技术未来展望[EB/OL]. (2004-09-02) [2018-10-05].http://www.people.com.cn/GB/it/8219/37153/37162/2757234.html.
[4]张涛.针对企业网站的搜索引擎优化策略[J].湖北工业大学学报, 2009, 24 (5) :61-63.
[5]池莹.企业网站搜索引擎优化策略研究[J].科技广场, 2008 (7) :31-33.
[6]王晰巍, 赵丹, 魏骏巍, 等.数字图书馆网站搜索引擎优化指标及实证研究--基于信息生态视角的分析[J].情报理论与实践, 2015 (11) .
[7]林元国, 许振和.基于长尾关键词的SEO策略[J].计算机系统应用, 2014 (1) .
[8]黎邦群.基于搜索引擎与用户体验优化的OPAC研究[J].中国图书馆学报, 2013 (4) .
[9]王姣, 徐海霞.搜索引擎工作原理再探究[J].电脑知识与技术, 2016 (25) .
[10]钟肖英, 王秀梅.电子商务2.0时代商业模式创新路径与竞争优势建立[J].商业经济研究, 2016 (19) .
[11]马汉.百度排名规则及算法总结[J].计算机与网络, 2015 (16) .
[12]张建国.盘点那些曾风靡一时的SEO黑帽方法[J].计算机与网络, 2015 (Z1) .
[13]方向阳.SEO及其在网站运营的应用探析[J].信息与电脑 (理论版) , 2014 (12) .
[14]谢冠怀.辨析响应式网页的浮动布局和伸缩盒子布局[J].现代计算机 (专业版) , 2014 (15) .
[15]蒋雪瑛, 徐福缘.基于百度搜索引擎的创业网站优化策略研究[J].现代情报, 2014 (3) .
[16]Blessington H.Search Engine Optimization Made Easy[J].Motorcycle&Powersports News, 2013.
[17]Silva N, Aguiar A.Web site optimization for search engines:An empirical study[C]//Information Systems and Technologies.AISTI, 2014:1-7.