首页|一种基于上下文的抽象样本信息检索系统

一种基于上下文的抽象样本信息检索系统

扫码查看
本发明提出了一种基于上下文的抽象样本信息检索系统。该系统中抽象样本特征化表示方法利用Word2vector提取词义特征,获得抽象词的词向量;而后,对抽象词的词向量进行“最优适应度划分”的聚类,并根据聚类结果将抽象词替代表示为聚类质心;最后,根据质心及其所代表的抽象词的词频,构成词向量聚类质心频率模型(ST?IDF),用于特征化表示抽象样本。本发明降低了聚类及适应度计算的执行次数,提高了抽象样本相似性分析的性能,提升了样本分类准确率。

CN201610369833.4

CN106095791B

发明专利

2016-05-29

2019-08-09

G06F16/332(2019.01)

长源动力(北京)科技有限公司

韩广、李亚楠、袁鑫攀、吴琳

100095 北京市海淀区高里掌路1号院2号楼2层201-004

中国(CN)