2.3 内容索引。
利用Luence索引工具对数据库中结构化信息建立索引文件,然后把创建好的索引文件保存到磁盘中,根据用户输入的查询条件在索引文件中进行查询,最终查询结果按照一定的顺序进行排序返回给用户。
实现的关键代码:
/*索引一个索引库的数据 * * @param indexConfig Index */private void indexData(Index index) throws Exception {.
StringTokenizer stFetcher = new StringTokenizer(index.fetcher, FETECHER_SPLIT)。
while (stFetcher.hasMoreTokens()) {String strFectcher?Name = stFetcher.nextToken()。
Fetcher iFetcher = (Fetcher)new ObjectUtility()。newIn?stance(strFectcherName)。
int records = iFetcher.doIndex(index)。
LOG.info(index.name + “, Index Records:” + records + “,Fetcher Class:” + strFectcherName)。
} }.
2.4 搜索引擎界面设计。
本搜索引擎界面简单清新。其效果图如图8所示。
3 结束语。
针对物联网技术产生的大量数据,设计了一种搜索引擎,并将核心功能完成,能应用于实际。本搜索引擎有如下功能:
1)通过对网络爬虫的扩展满足自己从网络站点抓取相关信息的要求。
2)通过jsoup网页解析工具实现对目标网页进行抽取,并将抽取内容保存到数据库中。
3)通过luence检索工具完成对存储在数据库中信息的索引,最后通过jsp向用户展示所抓取并过滤后的信息。
4)与MYSQL数据库结合使用,减少企业的开销成本,同时,在数据处理方面,MYSQL数据库提供了很大的优势,在数据的返回处理方面,减少了结果集的负担,同时,也加快了数据的传输。
5)系统界面简单美观。
最后,本文通过对搜索引擎的分析与测试,表明对基于JA?VA的搜索引擎的设计与实现是成功的,该搜索引擎性能稳定,高效。
综上所述,本课题成功地实现和设计了基于JAVA的搜索引擎,并结合了MYSQL数据库的使用,软件的UI交互设计友好。
参考文献:
[1] 袁津生, 李群, 蔡岳。 搜索引擎原理与实践[M]. 北京: 北京邮电大学出版社, 2008, 11.
[2] 郑宇卫。 基于Lucene构建的Web服务搜索引擎[J]. 电脑编程技巧与维护, 2015.
[3] 任丽芸。 搜索引擎中文分词技术研究[D]. 重庆: 重庆理工大学, 2011.
[4] 邱哲, 符滔滔。 开发自己的搜索引擎--Lucene 2.0+Heritrix[M]. 北京: 人民邮电出版社, 2007-06.
[5] 桂许军。 基于JavaEE平台与Lucene的信息文档搜索引擎系统的设计与实现[D]. 成都 西南交通大学, 2011.
[6] Cay S.Horstmann, Gary Cornell.Core Java 2, Volume 1-Funda?mentals,6E[M].Prentice Hall/Pearson, 2003.
[7] Bruce Eckel. Thinking in Java[Z].4th ed. 2007.