国家学术搜索
登录
注册
中文
EN
首页
|
中文分词技术的研究及在Nutch中的实现
中文分词技术的研究及在Nutch中的实现
引用
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
中文摘要:
研究了中文分词技术的原理,比较了现有分词器的速度和准确性。通过研究开源搜索引擎Nutch的架构和工作流程,分析了源代码,在Nutch加入JE中文分词器,实现了Nutch的本土化。
收起全部
展开查看外文信息
关键词:
Nutch
中文分词
搜索引擎
基金:
项目编号:
10213557
出版年:
2011
科技信息(学术版)
山东省技术开发服务中心
科技信息(学术版)
ISSN:
1001-9960
年,卷(期):
2011.
(19)