首页|园区网站内全文检索系统

园区网站内全文检索系统

扫码查看
因特网诞生以来,网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为急待解决的问题.HTML文件具备许多平面文件没有的优点,实现了内容、结构和表现三者的分高,适于数据表现、存储和检索.目前,HTML已经成为Web数据表现、存储、集成和展示的行业标准.为了更加有效地利用、加工、分析和处理HTML,本课题在前人已有工作的基础上,针对HTML文档的具体特点,提出一种文档标准化处理和关键词加权的方案.论文探讨了现有较为成熟的文档解析和中文切词技术的实现,并在此基础上加以改进使之适用于HTML文档;研究了Model-View-Controller设计模式,jsp标准标志库、表达式语言,过滤器、Scrvlet、Jsp等java web编程技术;本文分析了基于java的全文检索工具Lucene具体实现以及它的应用,并从MVC设计思想的角度,详细的介绍了的全文检索系统的设计与实现.

陈暄

展开 >

浙江工业职业技术学院,浙江,绍兴,312000

园区网站内全文检索 检索 索引 搜索引擎 中文切词

2010

网络财富
中国电源学会

网络财富

影响因子:0.105
ISSN:1672-5441
年,卷(期):2010.(22)
  • 1
  • 2