记者今日获悉,数据库国际顶会VLDB在加拿大温哥华举行,来自阿里云、达摩院及合作者的论文共入选17篇,其中工业赛道(Industrial Track)收录阿里云7篇文章,均刷新中国企业纪录。在VLDB大会现场,阿里云数据库负责人李飞飞作特邀主旨演讲时表示,随着云计算基础设施的完善和AI技术的发展,云数据库要像乐高积木一样好用。
【资料图】
图说:2023VLDB现场,阿里云李飞飞受特邀发表主旨演讲
VLDB(International Conference on Very Large Data Bases)是数据库三大国际顶级学术会议之一,设有研究(Research Track)、工业(Industrial Track)等方向。每年入选VLDB的成果对于推动数据驱动决策、智能系统演进、应用创新等具有重要意义,在计算机科学和产业实践中均产生了深远影响。
VLDB至今已举办至第49届。今年,清华、北大、MIT、苏黎世联邦理工学院等科研院所,以及阿里、字节、谷歌、AWS等科技公司,均有论文成果入选VLDB。阿里云、达摩院及合作方共有17篇文章入选VLDB,在中国企业中排名第一;其中,全部作者均来自阿里云的7篇论文入选工业赛道,在全球企业中拔得头筹。
图说:李飞飞指出,云数据库要像乐高积木一样好用
大会现场,李飞飞受特邀发表主旨演讲 《Modernization of Databases in the Cloud Era: Building Databases that Run Like Legos》 ,他表示 ,云计算的成熟与AI技术的发展,给数据库架构更新带来了新机遇:“以阿里云瑶池数据库的最佳实践为例,PolarDB通过存储-内存-计算三层解耦,可实现极致Serverless能力,并支持客户按需增加行级多主多写、HTAP、密态计算等多项核心能力,就像搭乐高积木一样方便、高效。同时,AI技术的发展为云原生数据库注入了全新的智能化潜力,可更好满足用户多样化的新需求。”
阿里云论文 《PolarDB-SCC: A Cloud-Native Database Ensuring Low Latency for Strongly Consistent Reads》 入选了本次VLDB工业赛道。实现从库的强一致性,一直以来都是数据库业内难以突破的技术难题。阿里云论文提出了一种全新的数据库架构:利用RDMA的多种算子,全面重构了主-从节间的数据通信模式,并通过追踪细粒度的数据修改以及新的时间戳方案设计,融合基于时间序的新一代事务系统,在业务无感知的情况下实现了高性能全局一致性读。目前,该架构已在PolarDB上线,极大满足客户对于高性能一致性的海量需求。
图说:PolarDB-SCC架构图,业内首次实现高性能全局一致性读
在研究赛道中,阿里云与达摩院合作的论文 《CatSQL: Towards Real World Natural Language to SQL Applications》 ,介绍了自研的自然语句转可执行SQL语句(NL2SQL)技术——CatSQL,帮助非专业人士更好实现数据库的专业应用。CatSQL创新地融合了传统的编译原理技术和最新的深度模型技术,可在理解语义的基础上保障语法的正确性,并通过领域知识配置和高效的微调技术,将专域场景的准确率提升到80%以上。据了解,CatSQL已在阿里云PolarDB等产品中落地使用。
图说:CatSQL架构图
当前,以阿里云为代表的中国科技企业,正在成为引领全球数据库技术创新的中坚力量。过去几年,阿里巴巴有近80篇论文成果被国际数据库顶级会议和期刊收录,研究范围覆盖云原生、智能化、HTAP、安全可信等前沿方向,数量居中国企业第一。今年,阿里云联合浙江大学斩获2023 SIGMOD最佳论文奖,该奖项历史上首次颁给完全来自中国大陆的科研团队,相关成果已率先应用在PolarDB等云原生数据库产品中。