首页|基于word2vec的程序编译错误信息特征提取方法

基于word2vec的程序编译错误信息特征提取方法

扫码查看
输入表示为固定长度的特征向量是机器学习算法要求之一.针对编程中的编译错误信息特征,论文提出了基于word2vec模型对编译错误信息进行特征提取.利用滑动窗口取词的方式,建立one-hot字典,结合word2vec中的Skip-gram模型,构建Huffman树,从可变长度的文本中学习固定长度的特征表示.最后使用SVM分类算法进行实验结果的验证.结果表明,该特征提取方法在编译错误信息中有显著的效果.
Feature Extraction Method of Program Compilation Error Information Based on Word2vec

何烨辛、谷林、孙晨

展开 >

西安工程大学计算机科学学院 西安 710048

西安科技大学管理学院 西安 710054

西安市阎良区新型农村合作医疗经办中心 西安 710089

word2vec 编译错误信息 Skip-gram模型 Huffman树 SVM

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(6)
  • 1
  • 10