国家学术搜索
登录
注册
中文
EN
首页
|
园区网站内全文检索系统
园区网站内全文检索系统
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
因特网诞生以来,网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为急待解决的问题.HTML文件具备许多平面文件没有的优点,实现了内容、结构和表现三者的分高,适于数据表现、存储和检索.目前,HTML已经成为Web数据表现、存储、集成和展示的行业标准.为了更加有效地利用、加工、分析和处理HTML,本课题在前人已有工作的基础上,针对HTML文档的具体特点,提出一种文档标准化处理和关键词加权的方案.论文探讨了现有较为成熟的文档解析和中文切词技术的实现,并在此基础上加以改进使之适用于HTML文档;研究了Model-View-Controller设计模式,jsp标准标志库、表达式语言,过滤器、Scrvlet、Jsp等java web编程技术;本文分析了基于java的全文检索工具Lucene具体实现以及它的应用,并从MVC设计思想的角度,详细的介绍了的全文检索系统的设计与实现.
收起全部
展开查看外文信息
作者:
陈暄
展开 >
作者单位:
浙江工业职业技术学院,浙江,绍兴,312000
关键词:
园区网站内全文检索
检索
索引
搜索引擎
中文切词
出版年:
2010
网络财富
中国电源学会
网络财富
影响因子:
0.105
ISSN:
1672-5441
年,卷(期):
2010.
(22)
被引量
1
参考文献量
2