首页|基于TF-IDF算法的分层搜索引擎设计

基于TF-IDF算法的分层搜索引擎设计

扫码查看
随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求.据此,论文提出了一种两阶段的搜索引擎设计方案.在第一阶段利用网络爬虫爬取相关的网络信息,并构成词条语料库,在第二阶段基于TF-IDF算法搜索词条语料库,得到与待查询语句最相近的词条.该引擎利用Flask框架构建本地Web界面,实现简洁明了的界面显示与快速的数据传输,且该框架易于维护.实验结果表明,该搜索引擎采用的爬虫技术所形成的语料库覆盖率广,TF-IDF算法具有计算速度快、匹配精度高的特点.
Design of a Layered Search Engine Based on TF-IDF Algorithm

张贤亮、张尤赛

展开 >

江苏科技大学电子信息学院 镇江 212003

搜索引擎 网络爬虫 TF-IDF算法 Flask框架

2021

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2021.49(3)
  • 5
  • 9