预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
亲,该文档总共60页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
PAGE毕业论文互联网信息检索系统的研究与实现PAGEI摘要互联网信息检索系统(搜索引擎)是专门提供信息检索服务的平台,它将互联网上大量的网页数据采集到服务器,经过处理形成的信息数据库和索引数据库,实现对用户提出的各种信息检索作出响应。本系统使用MicrosoftVisualStudio2005为主要开发工具,以WindowsServer2003操作系统为运行环境,主要实现了网页数据的抓取,网页数据存储,数据的索引,数据的检索,日志管理等功能。本文对互联网信息检索统中几个关键技术的设计和实现进行了研究。从理论上对这些关键技术进行了详细的讨论,并完成了基于Lucene.net互联网信息检索系统的实现。文章从下面几个方面进行了讨论:首先,本文介绍搜索引擎的市场需求和研究状态。这一部分阐述了搜索引擎丰富的历史背景和客观的用户需求,自身的特点,以及人们对搜索引擎的关注程度。其次,本文讨论了搜索引擎中基本结构、实现的理论基础和实现方法。这一部分研究了搜索引擎的关键技术,将中文分词技术、数据采集技术和数据索引技术有机的结合起来,并对全文检索引擎Lucene.net进行分析和研究。最后,详细描述了一个基于Lucene.net的互联网信息检索系统的设计与实现。关键词搜索引擎;Lucene.net;数据存储;信息检索PAGE53ABSTRACTInternetinformationretrievalsystem(searchengine)isdesignedtoprovideaplatformforinformationretrievalservices.ItwillcollectalotofpagesdataontheInternettotheserver,andprocessedformoftheinformationdatabaseandindexdatabase.Madetoachievetheusertorespondtothevariousinformationretrieval.ThesystemusesMicrosoftVisualStudio2005asthemaindevelopmenttool,torunWindowsServer2003operatingsystemenvironment,themainachievementofthewebcrawldata,webdatastorage,dataindexing,dataretrieval,loggingmanagementandotherfunctions.Inthispaper,severalInternetinformationretrievalsystemdesignandimplementationofkeytechnologieswerestudied.Theoryonthesekeytechnologiesarediscussedindetail,andcompletedtheInternetinformationretrievalsystembasedonLucene.netrealization.Thearticlediscussedthefollowingaspects:Firstofall,thearticledescribesthesearchenginemarketdemandandresearchstatus.Thispartdiscussesthesearchenginerichhistoricalbackgroundandobjectiveoftheuserrequirements,itsowncharacteristics,aswellaspeoplepaidmoreattentiontosearchengine.Secondly,thearticlediscussesthebasicstructureofsearchengines,toachievethetheoreticalbasisandimplementationmethods.Thispartofthesearchengine'skeytechnology,Chinesewordsegmentation,dataacquisitionanddataindexingtechnologycombineorganic,andfull-textsearchengineLucene.netonanalysisandresearch.Finally,adetaileddescriptionofanInternet-basedLucene.netInformationRetrieval