国家学术搜索
登录
注册
中文
EN
首页
|
基于TF-IDF算法的分层搜索引擎设计
基于TF-IDF算法的分层搜索引擎设计
下载
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
国家科技期刊平台
NETL
NSTL
万方数据
维普
中文摘要:
随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求.据此,论文提出了一种两阶段的搜索引擎设计方案.在第一阶段利用网络爬虫爬取相关的网络信息,并构成词条语料库,在第二阶段基于TF-IDF算法搜索词条语料库,得到与待查询语句最相近的词条.该引擎利用Flask框架构建本地Web界面,实现简洁明了的界面显示与快速的数据传输,且该框架易于维护.实验结果表明,该搜索引擎采用的爬虫技术所形成的语料库覆盖率广,TF-IDF算法具有计算速度快、匹配精度高的特点.
外文标题:
Design of a Layered Search Engine Based on TF-IDF Algorithm
收起全部
展开查看外文信息
作者:
张贤亮、张尤赛
展开 >
作者单位:
江苏科技大学电子信息学院 镇江 212003
关键词:
搜索引擎
网络爬虫
TF-IDF算法
Flask框架
出版年:
2021
DOI:
10.3969/j.issn.1672-9722.2021.03.007
计算机与数字工程
中国船舶重工集团公司第七0九研究所
计算机与数字工程
CSTPCD
影响因子:
0.355
ISSN:
1672-9722
年,卷(期):
2021.
49
(3)
被引量
5
参考文献量
9