国家学术搜索
登录
注册
中文
EN
首页
|
基于Nutch的搜索引擎技术
基于Nutch的搜索引擎技术
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
Nutch是一个优秀的基于Java的开放源码搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代商业搜索引擎工作原理一样:文本搜集、建立索引和查询.为了使它能够支持中文搜索,在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能.
外文标题:
Study on Chinese Search Technology for Java-Based Search Engine-Nutch
收起全部
展开查看外文信息
作者:
刘高原、张国平
展开 >
作者单位:
平顶山学院,河南,平顶山,467000
关键词:
Nutch
搜索引擎
分词
正规式
出版年:
2008
平顶山学院学报
平顶山学院
平顶山学院学报
影响因子:
0.159
ISSN:
1673-1670
年,卷(期):
2008.
23
(5)
被引量
2
参考文献量
2