园区网站内全文检索系统

陈暄¹

扫码查看

作者信息

1. 浙江工业职业技术学院,浙江,绍兴,312000
折叠

摘要

因特网诞生以来,网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为急待解决的问题.HTML文件具备许多平面文件没有的优点,实现了内容、结构和表现三者的分高,适于数据表现、存储和检索.目前,HTML已经成为Web数据表现、存储、集成和展示的行业标准.为了更加有效地利用、加工、分析和处理HTML,本课题在前人已有工作的基础上,针对HTML文档的具体特点,提出一种文档标准化处理和关键词加权的方案.论文探讨了现有较为成熟的文档解析和中文切词技术的实现,并在此基础上加以改进使之适用于HTML文档;研究了Model-View-Controller设计模式,jsp标准标志库、表达式语言,过滤器、Scrvlet、Jsp等java web编程技术;本文分析了基于java的全文检索工具Lucene具体实现以及它的应用,并从MVC设计思想的角度,详细的介绍了的全文检索系统的设计与实现.

关键词

园区网站内全文检索/检索/索引/搜索引擎/中文切词

引用本文复制引用

出版年

2010

网络财富

中国电源学会

网络财富

影响因子：0.105

ISSN：1672-5441

被引量1

参考文献量2

段落导航