计算机科学与实践2005,Vol.3Issue(1) :4-7.

Nutch搜索引擎分析

Analysis of Search Engine Nutch

郝子昭 宿红毅
计算机科学与实践2005,Vol.3Issue(1) :4-7.

Nutch搜索引擎分析

Analysis of Search Engine Nutch

郝子昭 1宿红毅1
扫码查看

作者信息

  • 1. 北京理工大学,计算机科学与工程系,北京,100081
  • 折叠

摘要

通过对开放源码的搜索引擎Nutch的源代码进行分析,着重分析了Nutch中网页爬取,索引,基于关键词搜索等主要技术,并对Nutch中采用的重要数据结构进行了研究,掌握了搜索引擎的实现方法和技术特点.在此基础上进行了词法分析模块的改造,实现了Nutch的中文搜索.

关键词

搜索引擎/爬虫/索引/

引用本文复制引用

出版年

2005
计算机科学与实践
计算机科学与实践杂志社

计算机科学与实践

ISSN:1729-584X
参考文献量2
段落导航相关论文