首页|基于古村落本体的特征抽取及村落画像研究

基于古村落本体的特征抽取及村落画像研究

刘婷婷

基于古村落本体的特征抽取及村落画像研究

刘婷婷1
扫码查看

作者信息

  • 1. 大连理工大学
  • 折叠

摘要

中国古村落是中华民族悠久历史和优秀传统文化的重要传承载体,是整个中华民族不可再生的文化资源。近年来,古村落保护逐渐受到社会各界的关注,古村落文本、视频、图像等信息资源越来越丰富,这些信息资源对古村落来说是一种重要的数字化资源,因此具有巨大的开采价值和研究价值。 本文以古村落本体为出发点,首先通过已有古村落文献、古村落相关的网络信息以及实际田野调查的结果,从本体的概念、概念间关系以及公理三个方面,构建了一个古村落本体。本体的概念获取来自于田野调查表格项,并且结合网络资源进行扩充;概念间关系利用本体的树形结构结合古村落调查表进行构建,初步形成一个古村落概念的关系网;利用了公理间的关系约束古村落本体的概念和关系。然后利用已经建立好的古村落本体库,提出了一个基于古村落本体的特征加权改进算法,该算法利用词语在本体中的关系,调整原始特征词的特征值,并形成一个基于本体的特征值;利用新特征词以及特征值计算它们在本体中的关联程度,得到了基于本体的关联度,基于本体的关联度可以用来衡量词语在古村落本体中的关系。接着本文提出了一个村落画像的概念,利用改进后的特征值去生成村落画像,使村落画像能够反映古村落文本的重点及词与词之间的关系。最后本文以小洲村为例,在文本分词、获得新词及概念、计算词语间基于本体的特征值及计算关联度的基础上,利用关联度生成了一个小洲村的村落画像。 本文建立了一个古村落本体,基于古村落本体提出了特征抽取改进算法,在原有的算法中加入了本体的知识,使得词与词之间的关系更加密切,同时降低了特征词的维度,加快了特征抽取的速度,也将一些突出的特点但并非高频词的特征表现出来。基于古村落本体的特征抽取方法还将重复的特征合并,突出重要特征,让原本的特征词更有突出性和聚集性,通过村落画像让人更直观的了解古村落的重要特点。

关键词

古村落/特征抽取/村落画像

引用本文复制引用

授予学位

硕士

学科专业

管理科学与工程

导师

郭崇慧

学位年度

2018

学位授予单位

大连理工大学

语种

中文

中图分类号

J2
段落导航相关论文