计算机科学与实践2004,Vol.2Issue(1) :83-91.

半结构化中文文本的索引和查询算法研究

Research on indexing and querying scheme for semi-structured Chinese documents

吕刚
计算机科学与实践2004,Vol.2Issue(1) :83-91.

半结构化中文文本的索引和查询算法研究

Research on indexing and querying scheme for semi-structured Chinese documents

吕刚1
扫码查看

作者信息

  • 1. 吉林铁路经济学校计算机系,132001
  • 折叠

摘要

半结构化文本使我们可以完成更加准确、复杂的查询,但也带来了无结构文本查询中不存在的一些问题,如结构化查询的实现、查询策略的选择以及原有的相似度计算方法不可行等.针对以上问题,该文从三个方面提出了新的解决方案,一是建立了一种完善的、模块化的索引体系M-Index;二是提出了一种启发式的半结构化双向查询策略;最后提出了适合于对半结构化文本进行任意层次查询的基于片断的相似度计算方法.实验证明这些方案是有效的,既大大提高了查询执行的效率,又提高了查询结果的准确性.

关键词

半结构化/索引/查询

引用本文复制引用

出版年

2004
计算机科学与实践
计算机科学与实践杂志社

计算机科学与实践

ISSN:1729-584X
参考文献量6
段落导航相关论文