首页|法律领域的蒙古语问答机器人研究与实现

法律领域的蒙古语问答机器人研究与实现

李雪

法律领域的蒙古语问答机器人研究与实现

李雪1
扫码查看

作者信息

  • 1. 内蒙古大学
  • 折叠

摘要

随着依法治国现代化的全面推进,应用于法律领域的现代化智能应用开发也如火如荼。蒙古族作为重要少数民族之一,有着大面积分布聚居的特征,对于少数民族的法律咨询智能应用需求越来越大。法律领域问答系统能够代替部分人工解决群众繁多重复的法律咨询问题,减轻人工压力,提高办事效率。因此本文对面向法律领域的蒙古语问答机器人进行了研究与实现。主要研究工作如下: (1)构建了面向法律领域的蒙古文问答语料库。目前蒙古文法律领域问答语料资源匮乏,本文通过收集中文法律领域网站以及司法部门提供的相关问答数据,整理出中文法律领域问答语料库,经过机器翻译、校对预处理、人工审核等方式,得到了蒙古文法律领域问答对20万条。另外,对其中高频问答进行筛选校对整理,构建了高频精准法律领域问答语料库,包含了高频蒙古文法律领域精准问答语料7746条。 (2)针对资源稀缺的问题以及法律领域答案精准性严肃性的要求,本文提出融合句向量模型和负样本抽取的SIFNegALBERT关键词抽取方法。首先,该模型对输入文本数据做分词、删除停用词等预处理;其次,利用正则表达式确定关键词抽取候选词短语;再次,通过使用ALBERT词向量预训练模型改进的无监督关键词抽取模型SIFRank获取词向量与句向量,并计算其相似度得到候选关键词;最后,通过远程监督标注语料模型NegSamplingNER结合双向长短期记忆网络(BiLSTM)随机采样负样本,并对正负样本表征进行分类标注后决定最终提取的关键词。实验结果表明,与基线模型SIFRank-NegSamplingNER相比,本文提出的SIFNegALBERT模型在关键词抽取任务中词准确率提升6.23%,在测试集上准确率达到81.65%。 (3)实现了面向法律领域的蒙古语问答系统在机器人上的应用。该系统共包括语音识别、问答匹配、语音合成三个模块,其中语音识别与语音合成模块采用实验室提供蒙古语语音引擎,问答匹配模块运用本文提出的基于SIFNegALBERT关键词抽取的问答匹配方法。最终该系统结合机器人已有日常问答功能,在擎盾小法机器人上予以交互展示应用。

关键词

机器人/双向长短期记忆网络/法律领域/蒙古语问答

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

飞龙

学位年度

2023

学位授予单位

内蒙古大学

语种

中文

中图分类号

TP
段落导航相关论文