摘要
针对人工智能生成文本智能识别与检测的问题,研究基于词频计算的信息熵和机器学习相结合的方法,建立了基于信息熵和GBDT算法(梯度提升决策树)预测模型.通过对大量文本样本进行特征提取和模型训练,构建分类检测模型.为了检验梯度提升决策树模型用来判断是否能由AI生成文本的精确度,进行相似度的计算,基于ROC曲线方法论对其进行验证.所提出模型的预测准确率较高,为AI生成文本的质量评估提供了新的视角,也为未来AI文本生成技术的发展提供了重要参考.此外,有助于保护知识产权,防止AI生成文本被误用或滥用.
基金项目
云南省教育厅科学研究基金项目(2024J1064)
云南省高等学校计算机教学研究会项目(云高计教202305)