摘要
有效的信息披露是资本市场可持续运行的基石。在IPO市场,招股说明书中的公开信息能否被投资者充分捕捉很大程度上取决于相关信息的质量,信息的质量影响上市首日的收益情况。文本作为一种非结构化数据,最近十年深刻影响会计与金融领域。本文以中国招股说明书文本数据为基础,运用文本分析技术度量文本的情绪(语调特征),通过构建情绪指标,研究会计文本情绪与IPO抑价率之间的关系。 本文以上市时间在2010-2020年的A股上市公司的招股说明书为文本分析对象,改进了中文金融文本词典的构建方法,在通用情绪词典基础上构建出中文金融情绪词典,将词汇层面情绪与文本整体情绪相结合,通过外部市场反馈指标对文本整体语调进行判断,重新调整正负面词汇词频的排序。这样得到的最终中文情感词典,相比于词汇这个颗粒度的单一情绪判断,更加适用于金融领域的复杂语境。 在文本负面语调的度量上,利用文本分析方法对IPO招股说明书所包含的负面语调进行量化,量化方法对现有简单词频统计法进行了改进。在等权重词频统计法的基础上,运用广泛用于文档检索文献的方法,即每个词的权重与该词在文档样本中出现的频率成反比,对正负面词的权重进行了调整。 以上两种改进方法都从一定程度上保证了度量的客观性与全面性。并在此基础上实证分析招股说明书负面语调对IPO初期抑价的影响。结果表明,招股说明书负面语调与IPO初期抑价率呈显著正相关关系。研究结论表明招股说明书语调有较高的有效信息含量,其量化结果对IPO初期表现有一定的解释能力。其结论对于负责政策制定的证券市场相关部门来说具有一定的参考意义。