首页|结合财经文本情感分析的股票价格预测研究

结合财经文本情感分析的股票价格预测研究

白欣怡

结合财经文本情感分析的股票价格预测研究

白欣怡1
扫码查看

作者信息

  • 1. 国防科技大学
  • 折叠

摘要

近几年,随着深度学习的发展,利用神经网络模型预测股票未来价格走势成为专业投资机构和金融、计算机学界的研究热点。这些研究通常是基于股票在过去一段时间的历史价格数据,预测未来的涨跌。除股票价格数据外,各大财经网站每天都活跃着股票相关的股评、财经新闻等文本数据。文本信息通常蕴含市场投资者情绪,投资者情绪影响股票价格走势。因此,近年来很多研究将文本特征与价格特征融合,形成融合文本的股票预测模型。然而,目前融合文本的股票预测研究偏个性化和私有化,即针对特定的研究对象构建私有的数据集,且大部分的研究集中在美股市场上。因此要想开启该领域的研究,实现针对任意股票的灵活切换研究,必须完整地实现该领域研究涉及的每个环节。 本文旨在研究融合文本情感的股票价格预测,探索如何挖掘股票相关的文本,如何从文本中提取情绪表示,并在最后应用于股票价格预测中。主要开展以下两个方面的研究。 一、兼容实体的句法结构分析:基于深度学习模型的文本情感分析,关键点在于如何提取出有效的文本表示。本文在长短期记忆网络(LongShortTermMemory,LSTM)、注意力机制加权求和、卷积神经网络(ConvolutionNeuralNetwork,CNN)和递归神经网络(RecursiveNeuralNetwork,RvNN)等模型中选择RvNN。RvNN依托于句子的句法结构分析树,从叶子结点开始,递归向上得到根结点的表示作为句子表示。而本文在实践过程中发现,现有的句法结构分析算法提供的句法解析树存在着与实体结构冲突的问题,出于对使用数据的严谨性要求,本文在股票预测的研究主线中分支出一个研究点:缓解句法结构分析中的实体冲突问题。在该研究中,本文提出了一种基于双仿射机制兼容实体结构的句法结构分析算法。在模型的设计模块,从理论角度阐明了本文提出模型的科学性。通过在三个句法结构分析数据集ONTONOTES、PTB、CTB5.1上的丰富实验,证明本研究提出模型,能有效降低句法结构分析过程中的实体违反率。通过下游任务的实验,证明在句法结构分析中研究实体兼容问题的现实意义。 二、融合文本情感的股票价格预测:本文针对个股隆基股份和沪深300指数两个对象,实现了从股票相关网络文本爬取,到文本情感分析,到最后融合文本情绪的股票价格预测的完整研究。1、基于Scrapy框架编写爬虫系统,在东方财富、雪球网、中证新闻网,以及国外网站StockTwits上爬取特定文本;2、运用研究点一实现的兼容实体的句法结构分析算法提取句子树结构,依托RvNN架构建立树型结构的文本情感分析模型,在FinancialPhraseBank、FIGA-2018两个专业的财经情感分析数据集以及自建数据集StockTwits上进行充分训练,得到针对财经文本的情感分析模型;3、运用第二步训练的情感分析模型,从第一步爬取的文本数据中提取情绪表示,并将其与股票价格特征融合,实现对股票未来走势的预测。最后的实验证明,本文提取的文本情绪表示,相比于只使用股票价格数据或直接对文本进行表示然后与价格特征融合,能实现更高的股票预测准确率。同时也证明了,股票相关的文本确实蕴藏情绪,且有助于股票价格的走势预测。

关键词

股票价格预测/财经文本/情感分析/句法结构分析

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

骆志刚/张翔

学位年度

2022

学位授予单位

国防科技大学

语种

中文

中图分类号

TP
段落导航相关论文