基于微调原型网络的小样本敏感信息识别方法
Few-shot Sensitive Information Recognition Based on Prototype Network Fine-tuning
余正涛 1关昕 1黄于欣 1张思琦 1赵庆珏1
作者信息
- 1. 昆明理工大学 信息工程与自动化学院,云南 昆明 650500;昆明理工大学 云南省人工智能重点实验室,云南 昆明 650500
- 折叠
摘要
敏感信息识别主要是指识别互联网上涉及色情、毒品、邪教、暴力等类型的敏感信息,现有的敏感信息识别通常将其看作文本分类任务,但由于缺乏大规模的敏感信息标注数据,分类效果不佳.该文提出一种基于微调原型网络的小样本敏感信息识别方法,在小样本学习框架下,利用快速适应的微调原型网络来缓解元训练阶段通用新闻领域和元测试阶段敏感信息数据差异大的问题.首先,在元训练阶段,基于通用新闻领域的分类数据训练模型来学习通用知识,同时在训练过程中经过两阶段梯度更新,得到一组对新任务敏感的快速适应初始参数,然后在元测试阶段敏感文本数据集的新任务上,冻结模型部分参数并使用支持集进一步微调,使模型更好地泛化到敏感识别领域上.实验结果证明,相比当前最优的小样本分类模型,该文提出的快速适应微调策略的原型网络显著提升了敏感信息识别效果.
Abstract
Sensitive information recognition refers to the identification of sensitive massages related to pornography,drugs,cult,violence and other types of sensitive information on the Internet.A few-shot sensitive information rec-ognition based on prototype network fine-tuning is proposed in this paper.The proposed method employs the fast adaptation function under the framework of few-shot learning to bridge the domain gap between the dataset in meta-training stage and that of meta-test stage.Specifically,the proposed model is trained on general news domain in me-ta-training stage with a two-stage gradient update mechanism to obtain a group of initial parameters.In meta-testing stage,model freezes a part of parameters to be fast finetuned for the sensitive text dataset.The experimental results show that the performance of the proposed model in sensitive information recognition task is significantly improved compared to a strong baseline few-shot model.
关键词
敏感信息识别/小样本学习/微调策略/原型网络Key words
sensitive information recognition/few-shot learning/fine-tuning strategy/prototype network引用本文复制引用
基金项目
国家自然科学基金(U21B2027)
国家自然科学基金(619721868)
国家自然科学基金(61732005)
云南省重大科技专项计划项目(202202AD080003)
云南省重大科技专项计划项目(202002AD080001)
云南省高新技术产业专项(201606)
云南省基础研究专项面上项目(202001AT070046)
出版年
2024