首页|基于查询特征表示学习的联邦复杂查询基数估计

基于查询特征表示学习的联邦复杂查询基数估计

扫码查看
准确的基数估计是实现最佳查询计划的关键因素,现有方法大多基于深度学习来解决基数估计问题。然而,这种基于RDF图模式的方法专注于具有特定拓扑结构的简单查询,适用范围有限,缺乏对现实场景中频繁使用的复杂类查询的支持。为了解决以上问题,提出一种基于查询特征表示学习的联邦复杂查询基数估计模型。该模型主要处理带有FILTER或DISTINCT关键字的复杂查询,使用新提出的FILTER查询特征化方法将SPARQL查询表示为特征向量,通过模型预测查询基数。同时使用模型预测DISITINCT查询中唯一行比率。在LUBM数据集上的实验表明,与最先进的基数估计方法相比,该模型在估计质量上表现优异,平均估计误差中位数可达1。16,并对多连接查询的基数估计表现出潜力和可扩展性。
Cardinality Estimation of Federated Complex Queries Based on Query Feature Representation Learning
Accurate cardinality estimation is the key factor to realize the best query plan.Most of the existing methods are based on deep learning to solve the base estimation problem.However,this method based on RDF graph pattern focuses on simple queries with specific topological structure,which is limited in application scope,and lacks support for complex queries frequently used in real scenes.In order to solve the above problems,we propose a federated complex query cardinality estimation model based on query feature representation learning.This model mainly deals with complex queries with FILTER or DISTINCT keywords.The SPARQL query is expressed as a feature vector by using the newly proposed FILTER query characterization method,and the query cardinality is predicted by the model.Also the model is used to predict the ratio of unique rows in DISITINCT queries.Experiments on LUBM data sets show that compared with the most advanced cardinality estimation methods,this model performs better in cardinality estimation,with an average median estimation error of 1.16,and shows potential and scalability for the estimation of multi-join queries.

federal systemquery optimizationcomplex querydeep learningcardinality estimation

徐娇、田萍芳、顾进广、徐芳芳

展开 >

武汉科技大学 计算机科学与技术学院,湖北 武汉 430065

湖北省智能信息处理与实时工业系统重点实验室,湖北 武汉 430065

武汉科技大学 大数据科学与工程研究院,湖北 武汉 430065

国家新闻出版署富媒体数字出版内容组织与知识服务重点实验室,北京 100083

展开 >

联邦系统 查询优化 复杂查询 深度学习 基数估计

科技创新2030"新一代人工智能"重大项目国家自然科学基金富媒体数字出版内容组织与知识服务重点实验室开放基金

2020AAA0108500U1836118ZD2021-11/01

2024

计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
年,卷(期):2024.34(2)
  • 27