随着互联网技术的不断深入发展和演绎,科技期刊正日益突破传统数据库出版和传播模式的禁锢,成为互联网上浩瀚信息中的一分子.Google 搜索、百度搜索、必应搜索等主流搜索引擎已经日益成为搜索科技信息的重要平台,也成为广大读者了解和认识科技期刊的重要平台.英国Netcraft公司进行了一项全球网站数量的调研,截至2015年7月底,全球网站数量已超过8 亿大关,达到 849 602 745 个,且还在急速增长;全球共有网民30亿,平均3.5个网民就拥有一个网站.根据中国互联网络信息中心2015年6月数据统计,国内网站的数量357万个,半年增长6.6%.
据《全球互联网调查报告》数据显示,中国现有网页数量600亿,全球网页数量至少有1万亿.如何在"信息海洋"-互联网中脱颖而出,已然成为科技期刊深入发展必须面对和思考的重要问题之一.因此,科技期刊在关注发展期刊质量的同时,必须关注主流搜索引擎对科技期刊影响力提升的作用.鉴于此,本文简要分析了国内外主流搜索引擎的现状和发展趋势,并结合科技期刊的搜索现状,对提升科技期刊在主流搜索引擎中的可见度提出了一些建议.
1 搜索引擎的现状和发展趋势
搜索引擎(Search Engine)是一项筛选互联网信息的系统[1-3].这个系统以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的.按工作方式来分,搜索引擎可以分为全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine).3类搜索引擎分别采用了不同的搜索技术,具体如表1所示[4].由表1可知,不同搜索引擎的工作方式是不一样的.全文搜索引擎侧重于HTTP标准协议,注重信息网页本身信息的标准性和规范性;目录搜索引擎侧重网页内容的学科属性;元搜索引擎更重视搜索网页本身内容的关注度,也即信息热点.由此也可以看出,全文搜索和元搜索针对的主要是无序的信息,而目录搜索主要针对的是有序信息.但是,无论是哪种搜索引擎搜索出的信息,结果都存在一定的局限性[5],概括起来主要表现为信息不完全、垃圾信息过多、对自然语言提问没有理解能力、对多媒体内容的检索尚不成熟等.
2014 年的一项调查显示:36% 的互联网用户一个星期花超过2小时的时间在网上搜索;71%的用户在使用搜索引擎的时候遇到过麻烦,平均搜索12分钟以后发现搜索受挫,搜索受挫中46%是因为链接错误[6].搜索引擎技术经历了基于网页名称的搜索策略、基于网页内容的搜索策略、搜索向导技术、搜索结果排序之后,正朝着人性化服务、智能化搜索、结构化搜索、专业化搜索和本土化搜索的方向发展[6-9].
2 科技期刊在互联网中的可见度分析
随着互联网技术的日益普及和成熟,科技期刊与大众见面的机会越来越多.早期,受传统出版模式的限制,科技期刊的内容只能出现在印刷媒体和少数几个大型的数据库出版平台中,读者要了解期刊上的某篇文章的内容,花费较多.科技期刊给普通读者的感觉是"阳春白雪",渴望而不易及.而 今,搜 索 引 擎 遍 天 下,Google、百 度、Yahoo !、搜狗、360 等纷纷出现,依靠功能强大的搜索引擎,读者很容易就能查到科技期刊载文相关的信息,且许多科技期刊都建有自己独立的网站,再加上功能强大的数据库出版商,科技期刊慢慢揭开了自己"神秘的面纱",为大众所熟悉.打开"百度"搜索工具,在搜索栏内输入"上海大学学报(自然科学版)",很容易就可以进入到学报的官网.但是,在搜索栏内输入2015年第3期刊文的标题"河流水-气界面碳交换研究进展及趋势",得到的却不是期刊网站上的内容.类似地,在搜索栏内输入"应用数学和力学(英文版)"可以直接查到期刊的网站链接,但是输入期刊刊文的标题,得到的却不是在期刊网站上的刊文,而是Springer平台上对应文章的网页链接.事实上,在搜索得到的前20条结果里面,仅只有第一条与期刊直接相关,其余对应的内容都与期刊无关,出现这种情况最重要的原因,是由于百度的竞价排名,大多数科技期刊没有这方面的资金投入.由此可见,科技期刊网站要征服主流搜索引擎,提升在互联网上的可见度,任重而道远.
3 提升科技期刊在主流搜索引擎中的可见度分析
科技期刊的发展与期刊载文的影响力密切相关,而影响力和可见度也是密切相关的.在互联网信息日益膨胀的今天,随着科技期刊读者阅读习惯的改变,要提高科技期刊载文的影响力,必须要提升科技期刊在主流搜索引擎中的可见度.这就要求期刊在关注刊文质量的同时,也要关注刊文的外在表象(如关键词的匹配等),关注在主流搜索引擎中的具体表现.
首先,科技期刊刊文的格式应该尽量采用结构化设计的文本格式,如可扩展标记语言(xml)格式、html格式等,以利于主流搜索引擎尽快提取有用的信息.虽然目前几乎所有的主流搜索引擎都支持word、pdf等非结构化或者半格式化数据,但在提取这些文件的信息的时候,都会先将这些数据进行预处理[10],这个过程可能会影响到这些数据的完整和准确表达,不利于信息在搜索结果中的优先选择.
其次,期刊内容应该体现规范化的要求,具有代表性和覆盖性.规范化是目录搜索引擎的基本要求.代表性和覆盖性是文档收集的基本要求,也是元搜索的基本要求.文档搜集是网络信息检索的基础,高质量的文档要求文档既能代表某一类文档中有特色的文档实例,又具备完整的代表性文档实例[11].这也就要求所收集的文档必须是当前有代表性的热点信息,且包含的内容比较完整,也即创新性较强.
再次,要注重期刊网站的品牌营运.分析表明[12-13],主流搜索引擎更注重网站的权威性,且习惯性搜索会逐渐影响搜索排名.因此,可以通过在各大主流搜索引擎上注册科技期刊的信息,以及发布期刊最新刊文信息来增强期刊的可见度,同时尽可能地提高每天网站的访问量[14-15].
最后,要重视基于移动互联网的主流搜索引擎的发展状况.当前移动互联发展迅猛,据《第36次中国互联网络发展状况统计报告》的统计数据,截至2015年6月,我国使用手机搜索引擎的用户数达4.54亿,使用率达76.5%,用户规模较2014年底增长2 520万人,增长率为5.9%.手机搜索引擎也在手机应用中位列第二位.因此,科技期刊的网站设计理念,也应从用户的角度出发,从单一的基于传统的互联网平台,逐步转移到基于移动互联网及传统互联网的多平台上,以增加科技期刊网站的可见度.
4 结语
当前,搜索引擎已是人们除即时通信及电子邮件之外使用频率最高的互联网应用,手机搜索引擎也在手机应用中位列第2位.因此,为了进一步提升科技期刊的影响力,除了做好内容之外,我们必须重视科技期刊新的传播平台--互联网,而重视在主流搜索引擎中的可见度正是提升科技期刊在互联网上可见度的绝佳途径.
参考文献
[1] 许新 . 搜索引擎的发展及趋势 [J]. 计算机光盘软件与应用,2010(12):5.
[2] 郝中良 . 中文搜索引擎营销模式分析 [J]. 中国电子商务,2011(4):238-239.
[3] 孙巧稚 .CNKI 学术搜索引擎的特点及发展趋势研究[J].韶关学院学报,2010(6):33-36.
[4] 魏琳 . 信息检索技术的发展及其应用 [J]. 中国科技信息,2008(10):77-77.
[5] 偰娇 . 浅析搜索引擎排名优化 [J]. 通讯世界,2015(4):247-248.
[6] 张一涵 . 我国高校学生互联网信息获取行为的影响因素研究[D].南京:南京大学,2014.
[7] 郑淑娟 . 浅议个性化搜索引擎关键技术及应用 [J].中国电子商务,2012(16):52.