首页|大数据相似性连接查询技术研究进展

大数据相似性连接查询技术研究进展

扫码查看
为了深入理解和全面把握大数据相似性连接查询技术的研究进展,更好地促进其在图片聚类、实体解析、相似文档检测、相似轨迹检索等领域的广泛应用,对大数据相似性连接查询技术相关研究工作进行了深入调研和分析.首先对相似性连接查询的基本概念进行了介绍,然后分别对集合、向量、空间数据、概率数据、字符串等不同类型大数据的相似性连接查询相关研究工作进行了深入研究,对其优缺点进行了分析和总结.最后,指出了大数据相似性连接查询面临的若干挑战性问题及未来的研究重点.
Research progress in similarity join query of big data
In order to deeply understand and fully grasp the research progress of similarity join query technology of big data and to promote its wide application in image clustering,entity resolution,similar document detection,similar trajectory retrieval,a comprehensive survey was conducted on similarity join query technology of big data.Firstly,the basic concepts of similarity join query were introduced;then intensive study on the big data similarity join research works for different data types,such as set,vector,spatial data,probabilistic data,string and graph was elaborated,their advantages and disadvantages were analyzed and summarized.Finally,some challenging research problems and future research priorities in big data similarity join query were pointed out.

big datasimilarity join queryMapReduce frameworkK-Nearest Neighbors (KNN)

马友忠、张智辉、林春杰

展开 >

洛阳师范学院信息技术学院,河南洛阳471934

河南省电子商务大数据处理与分析重点实验室(洛阳师范学院),河南洛阳471934

洛阳铁路信息工程学校计算机教研室,河南洛阳471900

大数据 相似性连接查询 MapReduce框架 K最近邻

国家自然科学基金资助项目国家重点研发计划项目河南省科技开放合作项目河南省科技开放合作项目河南省高等学校重点科研项目

616022312016YFE010460017210600007715210600004816A520022

2018

计算机应用
中国科学院成都计算机应用研究所

计算机应用

CSTPCDCSCD北大核心
影响因子:0.892
ISSN:1001-9081
年,卷(期):2018.38(4)
  • 12
  • 10