基于多任务学习的自动人格检测方法研究

陈杭婷¹

扫码查看

作者信息

1. 吉林大学
折叠

摘要

近些年来，随着大数据等信息技术的发展，泛在感知数据和图形处理器等计算平台的完善，人工智能技术的发展得以急速推进。人工智能是计算机科学的一个分支，它企图生产出一种和人一样思考并能做出反应的智能机器。人格是一个人的情感，行为及其动机和其思想模式等特征的结合，它表明个人的偏好，影响着个人的决定。因此针对人格的自动化检测可以视为对人的意识、思维等信息进行模拟，在社交文本挖掘中具有重要意义，并已经逐渐成为人工智能情感计算领域的一个重要的子课题。自动人格检测是指借助人工智能领域的自然语言处理相关技术，从社交文本中挖掘发帖人的潜在人格特质，其中最为流行的方法是借助外部领域词典提取特征关键词，并借助下游机器学习方法进行人格分类。鉴于在线社交文本的飞速增长，且基于特征的方法需要大量的人工标注、可迁移性较差。所以，基于深度学习的自动人格检测方法具有更广泛的应用前景。然而，现有的基于深度学习的人格检测模型依旧存在两个局限性。首先，它们只提取了潜在人格对应的关键词，而缺乏对发帖人情绪信息和心理学特质的分析。其次，由于在线社交文本的数量较多，导致文本序列较长，因此一些方法无法建模超长上下文，导致发帖中许多关键语义信息被忽略。为了解决上述问题，本文提出了一种新的结合情感和语义特征的多标签人格检测模型。本文主要进行了以下研究工作： 1、我们提出了一个结合情感分类与人格检测的多任务框架，通过外部情感分析模型自动对文档进行情感标注，利用情感与人格之间的关联性提升人格检测的效果。该框架基于Longformer预训练语言模型，借助self-attention机制充分捕捉超长文本数据的上下文语言特征。 2、在此基础上，我们利用自动情绪标注的结果对文档数据进行增强。通过将不同发帖的情感程度进行排序，使得Longformer更好地捕捉发帖之间的情感关联，进一步提升了多任务检测的效果。本文模型可以自动对社交媒体文本进行人格检测，帮助各种社交软件进行用户信息挖掘。本文在两个公开的MBTI和BigFive数据集上进行训练，使用F1作为评价指标，实验结果表明该模型在人格检测方面优于最先进的技术。

关键词

人格检测/文本分类/深度学习/自然语言处理/多任务学习

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

徐昊

学位年度

2022

学位授予单位

吉林大学

语种

中文

中图分类号

段落导航