首页|基于多任务学习的自动人格检测方法研究

基于多任务学习的自动人格检测方法研究

陈杭婷

基于多任务学习的自动人格检测方法研究

陈杭婷1
扫码查看

作者信息

  • 1. 吉林大学
  • 折叠

摘要

近些年来,随着大数据等信息技术的发展,泛在感知数据和图形处理器等计算平台的完善,人工智能技术的发展得以急速推进。人工智能是计算机科学的一个分支,它企图生产出一种和人一样思考并能做出反应的智能机器。 人格是一个人的情感,行为及其动机和其思想模式等特征的结合,它表明个人的偏好,影响着个人的决定。因此针对人格的自动化检测可以视为对人的意识、思维等信息进行模拟,在社交文本挖掘中具有重要意义,并已经逐渐成为人工智能情感计算领域的一个重要的子课题。 自动人格检测是指借助人工智能领域的自然语言处理相关技术,从社交文本中挖掘发帖人的潜在人格特质,其中最为流行的方法是借助外部领域词典提取特征关键词,并借助下游机器学习方法进行人格分类。鉴于在线社交文本的飞速增长,且基于特征的方法需要大量的人工标注、可迁移性较差。所以,基于深度学习的自动人格检测方法具有更广泛的应用前景。 然而,现有的基于深度学习的人格检测模型依旧存在两个局限性。首先,它们只提取了潜在人格对应的关键词,而缺乏对发帖人情绪信息和心理学特质的分析。其次,由于在线社交文本的数量较多,导致文本序列较长,因此一些方法无法建模超长上下文,导致发帖中许多关键语义信息被忽略。为了解决上述问题,本文提出了一种新的结合情感和语义特征的多标签人格检测模型。 本文主要进行了以下研究工作: 1、我们提出了一个结合情感分类与人格检测的多任务框架,通过外部情感分析模型自动对文档进行情感标注,利用情感与人格之间的关联性提升人格检测的效果。该框架基于Longformer预训练语言模型,借助self-attention机制充分捕捉超长文本数据的上下文语言特征。 2、在此基础上,我们利用自动情绪标注的结果对文档数据进行增强。通过将不同发帖的情感程度进行排序,使得Longformer更好地捕捉发帖之间的情感关联,进一步提升了多任务检测的效果。 本文模型可以自动对社交媒体文本进行人格检测,帮助各种社交软件进行用户信息挖掘。本文在两个公开的MBTI和BigFive数据集上进行训练,使用F1作为评价指标,实验结果表明该模型在人格检测方面优于最先进的技术。

关键词

人格检测/文本分类/深度学习/自然语言处理/多任务学习

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

徐昊

学位年度

2022

学位授予单位

吉林大学

语种

中文

中图分类号

TP
段落导航相关论文