2月21日,丹苏邱教授在CS杰出学术研讨会上的演讲

标题:基数估计:查询优化器的致命弱点

主讲人:Dan Suciu教授,华盛顿大学

时间:2024年2月21日星期三上午11点地点:CDS 1750

摘要

基数估计是估计查询输出大小的问题,而不是实际评估查询。估计器可以访问数据库上的一些有限的统计信息,例如表基数、不同列中的不同值的数量,有时是直方图,并且需要估计复杂查询的输出大小,通常涉及许多连接和过滤器谓词。基数估计器是任何查询优化器的关键部分,当优化器选择糟糕的计划时,基数估计器通常是罪魁祸首。在这次演讲中,我将简要介绍现有的基数估计方法,讨论它们的优点和缺点,然后我将介绍一种新的方法来解决这个问题,这是基于计算上界而不是估计。上限由数学公式给出,并且可以以令人惊讶的方式使用可用的数据库统计数据。

 

生物

Dan Suciu是华盛顿大学Paul G. Allen计算机科学与工程学院的微软教授。Suciu正在进行数据管理方面的澳门威尼斯人注册网站研究,主题包括查询优化、概率数据、数据定价、并行数据处理、数据安全。他是两本书《网络上的数据:从关系到半结构化数据和XML》(1999年)和《概率数据库》(2011年)的合著者。他曾获得ACM SIGMOD Codd创新奖,多次获得最佳论文奖和时间测试奖,并且是ACM的会员。Suciu目前是美国计算机学会杂志的副主编。Suciu的博士生Gerome Miklau、Christopher Re和Paris Koutris分别于2006年、2010年和2016年获得ACM SIGMOD最佳论文奖,Nilesh Dalvi是2008年的亚军。