17、分片(一):如何选择最适合的水平分片方式你好,我是陈现麟。 结束了“分布式计算篇”的系列学习,我们掌握了如何解决分布式系统中,无状态节点或服务之间内部的协调问题,利用这些知识和技术原理,你就可以轻松地构建、运维一个大规模无状态的分布式系统了,恭喜你,取得了一个值得庆祝的学习成果。 接下来我...2026-03-01深入浅出分布式技术原理
16、故障(二):变更管理,解决主动故障的高效思维方式你好,我是陈现麟。 通过上一节课的学习,你已经理解了系统故障的评估标准,并且明白了在 SLA 一定的情况下,平均故障恢复的时间越短,对用户体验的影响就越小,所以快速恢复故障是一个非常关键的目标。接着,我们采用分治法,将故障分为被动故障和主动故障,讨论...2026-03-01深入浅出分布式技术原理
15、故障(一):预案管理竟然能让被动故障自动恢复你好,我是陈现麟。 通过学习“监控”与“告警”这两节课的内容,你已经学会如何利用 Metric、Trace 和 Log 搭建一个可观测系统,去监控极客时间这样的分布式系统。并且知道了在系统出现故障时,职责明确的告警机制,可以在第一时间通知到相关的工程...2026-03-01深入浅出分布式技术原理
14、可观测性(二):如何设计一个高效的告警系统你好,我是陈现麟。 通过上节课的学习,我们掌握了在可观测性体系中,监控的位置和重要性,以及设计一个监控系统的基本原则,这样我们就可以为极客时间搭建一个可观测体系,并且设计一个简洁有效的监控系统了。 但是,只有监控还是不够的,因为我们不能一直盯着监控系...2026-03-01深入浅出分布式技术原理
13、可观测性(一):如何监控一个复杂的分布式系统你好,我是陈现麟。 通过学习“雪崩”系列的内容,我们掌握了构建一个稳定的分布式系统所需的四大方法:熔断、限流、降级和扩容,再也不用担心由于一个局部的小问题,导致整个系统出现重大的故障了。 在“雪崩”系列课程中,我们曾经提到需要基于系统内部的运行状态,...2026-03-01深入浅出分布式技术原理
12、雪崩(四):扩容,没有用钱解决不了的问题你好,我是陈现麟。 在降级的学习中,我们掌握了降级机制的应用场景,手动降级和自动降级的实现原理,以及降级机制值得注意的一些关键问题,这样我们就可以引入分级降级策略,来快速降低系统的负载,确保核心服务的可用性了。现在我们已经学习完了分布式系统稳定性的三...2026-03-01深入浅出分布式技术原理