科技信息(学术版)2011,Issue(19) :I0038-I0039.

中文分词技术的研究及在Nutch中的实现

科技信息(学术版)2011,Issue(19) :I0038-I0039.

中文分词技术的研究及在Nutch中的实现

扫码查看

摘要

研究了中文分词技术的原理,比较了现有分词器的速度和准确性。通过研究开源搜索引擎Nutch的架构和工作流程,分析了源代码,在Nutch加入JE中文分词器,实现了Nutch的本土化。

关键词

Nutch/中文分词/搜索引擎

引用本文复制引用

基金项目

出版年

2011
科技信息(学术版)
山东省技术开发服务中心

科技信息(学术版)

ISSN:1001-9960
段落导航相关论文