20、关联查询:如何提升多表Join能力

你好,我是王磊,你也可以叫我Ivan。 今天,我们会继续学习查询场景中的处理技术。这一讲的关键词是“多表关联”,也就是数据库中常见的Join操作。无论是单体数据库还是分布式数据库,关联操作的语义始终没有变,一些经典算法也保持了很好的延续性。 关联算法...

分布式数据库30讲

21、查询执行引擎:让聚合计算加速

你好,我是王磊。 在19、20两讲中,我已经介绍了计算引擎在海量数据查询下的一些优化策略,包括计算下推和更复杂的并行执行框架。这些策略对应了从查询请求输入到查询计划这个阶段的工作。那么,整体查询任务的下一个阶段就是查询计划的执行,承担这部分工作的组件...

分布式数据库30讲

22、想要读写快还是存储省

你好,我是王磊。 从第18讲,我们开始介绍查询过程中全部重要节点的相关技术,从并行框架到查询执行引擎,再从关联运算符到行式和列式存储。今天这一讲我们面临最后的一个步骤,直接和磁盘打交道,实现最终的数据存储,这就是存储引擎。 RUM猜想说到数据存储,我...

分布式数据库30讲

23、数据库查询串讲

你好,我是王磊。 这一讲是我们课程的第三个答疑篇,我会和你一起回顾第16讲到22讲的主要内容,这部分内容是围绕着数据库的“查询”展开的。同时,我也会集中解答留给大家思考题,并回复一些大家关注的热点内容。 第16讲:慎用存储过程[第16讲],我首先分享...

分布式数据库30讲

24、全球化部署:永不宕机的数据库

你好,我是王磊,你也可以叫我Ivan。 这一讲我们要聊的是“全球化部署”,其实这个词在我们的课程中已经出现很多次了。我猜说不定你心里一直有个问号:“全球化啊,这么高大上的东西和我有关系吗?”耐心看完这一讲,我相信你会有新的理解。 我们不妨给全球化部署...

分布式数据库30讲

25、容灾与备份:如何设计逃生通道保证业务连续性?

你好,我是王磊,你也可以叫我Ivan。 我们今天的关键词是“逃生通道”。在生活中,我们去任何一个公共场所,比如火车站、商场、写字楼,都能看安全出口或者紧急疏散通道的提示,这就是逃生通道。逃生通道的作用就是人们能够快速脱离危险的地方。而在系统领域,逃生...

分布式数据库30讲

26、容器化:分布式数据库要不要上云

你好,我是王磊,你也可以叫我Ivan。 今天,我想和你分享的话题是分布式数据库的容器化部署。当数据库遇到容器,我知道这一定是个很有争议的话题。但是,在容器化技术大规模落地的背景下,这也是一个无法回避的话题。 容器化技术可以将资源虚拟化,从而更灵活快速...

分布式数据库30讲

27、产品测试:除了性能跑分,还测啥

你好,我是王磊,你也可以叫我Ivan。 这一讲我们的关键词是“测试”。无论是作为程序员还是架构师,我们都不会忽视测试的重要性,它贯穿于软件工程的整个生命周期,是软件质量的重要保障手段。 不过,提到分布式数据库的测试,你也许会有些疑问,我又不是数据库研...

分布式数据库30讲

28、银行是怎么选择分布式数据库的?

你好,我是王磊,你也可以叫我Ivan。 在前面的课程中,我们已经介绍了分布式数据库方方面面的知识。这些知识,我觉得大概会在三个方面帮到你,分别是数据库研发、架构思维提升和产品选型。今天,我会通过几家银行的案例带你了解如何做分布式数据库的选型。 为什么...

分布式数据库30讲

29、哪些分布式数据库值得看

你好,我是王磊,你也可以叫我Ivan。 今天是课程正文的最后一讲,时间过得好快呀。在基础篇和开发篇,课程安排追求的是庖丁解牛那样的风格,按照[第4讲]提到的数据库基本架构,来逐步拆解分布式数据库系统。在介绍每一个关键部件时,我会去关联主流产品的设计,...

分布式数据库30讲