15、Hive:来来去去的DSL,永生不死的SQL你好,我是徐文浩。 通过过去几篇论文的解读,相信现在你已经深入掌握好了大数据系统的基本知识。而在Google的这些论文发表之后,整个工业界也行动起来了。很快,我们就有了开源的GFS和MapReduce的实现Hadoop,以及Bigtable的实现HB...2026-01-25大数据经典论文解读
14、分布式锁Chubby(三) :移形换影保障高可用你好,我是徐文浩。 过去的两讲里,我们都在尝试做一件事情,就是在Master和Backup Master之间保持数据的同步复制。无论是通过分布式事务的两阶段提交算法,还是通过分布式共识的Paxos算法,都是为了做到这一点。 而我们要去保障Master...2026-01-25大数据经典论文解读
13、分布式锁Chubby(二) :众口铄金的真相你好,我是徐文浩。 上一讲里,我为你解析了两阶段提交和三阶段提交是怎么回事儿。相信你和我一样,对这两种解决方案都不太满意。虽然它们可以帮助我们实现一个分布式的事务,但同时也有着很明显的缺陷:这两个都是一个“单点”特别明显的系统,一旦作为单点的“协调者...2026-01-25大数据经典论文解读
12、分布式锁Chubby(一) :交易之前先签合同你好,我是徐文浩。 在过去的十几讲课程里,我带你一起学习完了GFS、MapReduce,以及Bigtable这三篇被称之为Google的“三驾马车”的论文。不知道你有没有发现,这三篇论文有一个共同点,那就是这三个系统都是一个单Master系统。而这就...2026-01-25大数据经典论文解读
11、通过Thrift序列化:我们要预知未来才能向后兼容吗你好,我是徐文浩。 现在,我们已经解读完了GFS、MapReduce以及Bigtable这三篇论文,这三篇论文之所以被称为Google的三驾马车,一方面是因为它们发表得早,分别在2003、2004和2006年就发表了。另一方面,是这三篇论文正好覆盖了...2026-01-25大数据经典论文解读
10、Bigtable(三):SSTable存储引擎详解你好,我是徐文浩。 在上一讲里,我们已经了解了Bigtable的整体架构,知道作为一个分布式数据系统,里面“分布式”的部分是怎么设计的了。那么,今天我就带你一起来详细深入到Bigtable的“数据”部分里,去看看它是怎么回事儿。而且今天的这一讲,我们...2026-01-25大数据经典论文解读