用于金融文本挖掘的多任务学习预训练金融语言模型

Pretraining Financial Language Model with Multi-Task Learning for Financial Text Mining

刘壮 ¹刘畅 ²Wayne Lin ³赵军⁴

扫码查看

作者信息

1. 东北财经大学应用金融与行为科学学院辽宁大连 116025
2. 中国石油物资采购中心沈阳 110031
3. 南加州大学计算机学院美国加利福尼亚州洛杉矶 90007
4. IBM研究院北京100101
折叠

摘要

近年来,机器学习,尤其是深度神经网络方法促进了金融文本挖掘研究的发展,在金融科技(Fintech)领域起着越来越重要的作用.如何从金融大数据中提取有价值的信息已经成为学术界和工业界一个非常有挑战的研究.由于深度神经网络需要大量标注数据,但是金融领域缺乏训练数据,因此,将深度学习应用于金融大数据挖掘并没有取得很好效果.为了更好地解决该问题,利用自监督学习和多任务学习等深度学习领域最新的思想和技术,提出了基于BERT模型架构的开源金融预训练语言模型F-BERT.F-BERT是一种针对特定领域(金融文本数据)的预训练语言模型,它通过在大型金融语料库上进行无监督训练得到.基于BERT架构,F-BERT可以有效地自动将知识从金融大数据中提取出并记忆在模型中,而无需进行特定于金融任务的模型结构修改,从而可以直接将其应用于下游各种金融领域任务,包括股票涨跌预测、金融情绪分类、金融智能客服等.在金融关系提取、金融情绪分类、金融智能问答任务上的大量实验表明了F-BERT模型的有效性和鲁棒性.同时,F-BERT在这3个有代表性的金融文本挖掘任务上均取得了很高的模型准确率,进一步验证了模型的性能.

关键词

BERT/金融文本挖掘/多任务学习/预训练/迁移学习/金融科技

引用本文复制引用

基金项目

出版年

2021

计算机研究与发展

中国科学院计算技术研究所中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心

影响因子：2.649

ISSN：1000-1239

被引量6

参考文献量29

段落导航