科技与创新2021,Issue(21) :107-108.DOI:10.15913/j.cnki.kjycx.2021.21.046

基于BERT的中文文本向量化表示

祖成
科技与创新2021,Issue(21) :107-108.DOI:10.15913/j.cnki.kjycx.2021.21.046

基于BERT的中文文本向量化表示

祖成1
扫码查看

作者信息

  • 1. 首都经济贸易大学管理工程学院,北京 100070
  • 折叠

摘要

近年来,自然语言处理领域的研究出现的文本向量表示方法大多无法解决一词多义的问题,导致向量的表示脱离句子意义,引入BERT模型利用其独特的Transformer结构对文本进行处理和双向学习,同时利用TF-IDF算法加强单个词对文档的影响力,构建具有权重信息的词向量,提高文本词向量化的准确率.

关键词

BERT/TF-IDF/词向量/文本分类

引用本文复制引用

出版年

2021
科技与创新
中国计算机用户协会

科技与创新

ISSN:1008-0570
被引量1
参考文献量1
段落导航相关论文