NSTL
万方数据
融合标签平均划分距离和结构关系的社区可重叠划分方法
陈海波 1马慧芳 邴睿 黄乐乐 赵卫中
作者信息
摘要
本发明涉及一种融合标签平均划分距离和结构关系的社区可重叠划分方法,该方法包括以下步骤:⑴微博数据抓取;⑵核心标签划分:①对标签进行扩充;②定义标签区分度TDi,并获取TDi较大的top?l个标签作为核心标签并用作后续步骤的社区划分;⑶基于平均划分距离的准社区划分;⑷计算准社区结构相异度:a求基于关注关系和节点度的结构相似度;b求结构相异度;c计算准社区结构相异度;⑸社区综合划分:A计算综合划分相异度;B求社区重叠度;⑹执行迭代算法。本发明综合考虑平均划分距离与结构相异度之间的关系,给定参数进行调节,得到综合划分相异度,选取综合划分相异度最小的标签划分形成的簇作为当前社区划分的结果并输出,使得划分合理准确。
申请号
CN201711187974.5公开号
CN108090132B专利类型
发明专利申请日
2017-11-24公开日
2021-05-25IPC分类
G06F16/9536(2019.01)申请人
西北师范大学发明人
陈海波/马慧芳/邴睿/黄乐乐/赵卫中主申请人地址
730070 甘肃省兰州市安宁区安宁东路967号国别省市代码
中国(CN)