首页|基于动作空间扩充及奖励优化的知识图谱多跳推理

基于动作空间扩充及奖励优化的知识图谱多跳推理

扫码查看
知识图谱的不完备性导致多跳推理在探索路径的过程中会缺失关键节点和关系,从而导致推理失败.针对此问题,文章提出了动作空间扩充及奖励优化模型AsaRo(Action Space Augmentation and Reward Optimization).该模型根据实体的邻域信息寻找其相似实体,并利用相似实体的邻域信息扩充原实体动作空间.在模型优化方面,采用基于带有优势函数的演员评论家A2C(Advantage Actor Critic)算法的强化学习优化路径奖励,并在原有路径奖励的基础上添加状态价值函数以评价策略的好坏,进一步提升了模型效果.在知识图谱数据集UMLS、Kin-ship、WN18RR、NELL-995、FB15K-237上的实验结果表明,该文模型效果优于大部分现有模型.
Multi-hop Knowledge Graph Reasoning with Action Space Augmentation and Reward Optimization

王利琴、宋金晟、董永峰、李英双

展开 >

河北工业大学 人工智能与数据科学学院,天津 300401

河北省大数据计算重点实验室,天津 300401

河北省数据驱动工业智能工程研究中心,天津 300401

河北工业大学 信息安全与技术服务中心,天津 300401

展开 >

知识图谱 多跳推理 强化学习 动作空间

国家自然科学基金河北省高等学校科学技术研究项目河北省高等学校科学技术研究项目河北省自然科学基金

61806072ZD2022082QN2021213F2020202008

2023

山西大学学报(自然科学版)
山西大学

山西大学学报(自然科学版)

CSTPCD北大核心
影响因子:0.287
ISSN:0253-2395
年,卷(期):2023.46(2)
  • 24