首页|基于Nutch的搜索引擎技术

基于Nutch的搜索引擎技术

扫码查看
Nutch是一个优秀的基于Java的开放源码搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代商业搜索引擎工作原理一样:文本搜集、建立索引和查询.为了使它能够支持中文搜索,在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能.
Study on Chinese Search Technology for Java-Based Search Engine-Nutch

刘高原、张国平

展开 >

平顶山学院,河南,平顶山,467000

Nutch 搜索引擎 分词 正规式

2008

平顶山学院学报
平顶山学院

平顶山学院学报

影响因子:0.159
ISSN:1673-1670
年,卷(期):2008.23(5)
  • 2
  • 2