青岛科技大学学报(自然科学版)2020,Vol.41Issue(6) :93-98.DOI:10.16351/j.1672-6987.2020.06.013

一种基于词向量及位置编码的Jaccard相似度算法

Jaccard Similarity Algorithm Based on Word Embedding and Position Encoding

周艳平 李金鹏
青岛科技大学学报(自然科学版)2020,Vol.41Issue(6) :93-98.DOI:10.16351/j.1672-6987.2020.06.013

一种基于词向量及位置编码的Jaccard相似度算法

Jaccard Similarity Algorithm Based on Word Embedding and Position Encoding

周艳平 1李金鹏1
扫码查看

作者信息

  • 1. 青岛科技大学 信息科学技术学院,山东 青岛 266061
  • 折叠

摘要

针对句子的词序问题,提出了一种基于词向量及位置编码的Jaccard相似度算法.该方法首先使用词向量模型将每个词映射成高维语义向量,然后结合词位置编码计算出各个词向量的相似度,最后使用Jaccard算法计算出句子之间最终的相似度.实验结果证明:本工作提出的方法与传统的Jaccard算法和基于词向量的Jaccard相似度算法相比,有效提升了相似度准确率,对词序也有很好的辨别能力.

关键词

位置编码/Jaccard算法/词向量/句子相似度

引用本文复制引用

基金项目

国家自然科学基金(61402246)

出版年

2020
青岛科技大学学报(自然科学版)
青岛科技大学

青岛科技大学学报(自然科学版)

CSTPCD
影响因子:0.297
ISSN:1672-6987
被引量4
参考文献量3
段落导航相关论文