摘要
随着知识自动抽取与军事领域训练数据集稀疏的矛盾日益显著,本研究选择知识图谱的知识表示形式,融合LLMs数据增强策略,训练了一种三元组自动抽取模型,解决了数据稀疏的实体关系知识自动抽取问题,并搭建了多关系领域知识图谱自动构建系统原型,验证了军事领域知识图谱动态管理的实效性,具体研究过程概括如下。 (1)针对数据稀疏的军事知识图谱自动构建问题,首先,选择Protégé本体构建工具完成细颗粒军事本体模型,通过人工标注的方式构建训练数据集,经过关系分类和实体对抽取完成了 RRBC三元组抽取基础模型的训练;接着,基于LLMs数据增强策略,结合Prompt提示微调方法,有效扩充了训练数据集,完成了 RRBC三元组抽取模型优化;最后,提出融合领域字典的编辑距离相似度计算方法完成实体对齐。研究实验结果表明:RRBC三元组抽取基础模型的P、R、F1值分别为:77.2%、70.1%、73.5%,RRBC三元组抽取优化模型的P、R、F1 值分别为:78.6%、71.3%、74.8%。 (2)针对军事领域知识图谱自动构建及动态管理需求,选择应用层、业务层、算法层及数据层系统架构,支持领域知识图谱自动构建系统原型的构建,其中,数据层通过Neo4j图数据库完成知识图谱存储;算法层基于上述RRBC三元组抽取模型和实体对齐算法支持知识图谱自动构建;业务层通过本体构建、知识抽取和知识可视化等模块支持应用层的知识库管理、知识更新和知识应用等功能。最后,完成系统原型的功能及性能测试,验证了系统的实效性。