分布式锁

2022年春节，我们优惠券系统出现了超发事故。

开发同学用了 Redis 分布式锁，但锁的 TTL 设置的是 10 秒。优惠券核销需要 15 秒，锁过期后另一个请求进来，两边同时核销，导致优惠券超发了 2000 张。

事后复盘，这个锅不在 Redis 锁本身，而在于开发同学没理解锁的 TTL 和任务执行时间的匹配关系。

【架构权衡】分布式锁的坑，多到可以写一本书。锁的过期时间、续期机制、原子性保证、可重入性、主从切换丢锁......每一个点都是面试官追问的对象。理解这些坑，才能真正用好分布式锁。

一、内容总览

本模块覆盖分布式锁的完整知识体系，从实现原理到工程实践：

1.1 Redis 分布式锁 🔴

文章	核心内容	面试权重
Redis 分布式锁	SETNX + TTL 基本实现	🔴 高频必考
Redis 锁的 lease 机制	看门狗续期原理	🔴 高频必考
RedLock	多节点 Redis 锁	🔴 高频必考
RedLock 的争议与批评	RedLock 的局限性分析	🟡 中频常考

1.2 ZooKeeper 分布式锁 🟡

文章	核心内容	面试权重
ZooKeeper 锁	临时顺序节点实现	🟡 中频常考
选举与锁的关系	Zab 协议与锁选主	🟡 中频常考

1.3 etcd 分布式锁 🟢

文章	核心内容	面试权重
etcd 锁	Raft 协议 + MVCC	🟢 低频了解

1.4 数据库锁 🟡

文章	核心内容	面试权重
数据库乐观锁	版本号/CAS 机制	🔴 高频必考
数据库悲观锁	SELECT FOR UPDATE	🟡 中频常考

1.5 锁的选型与对比 🟡

文章	核心内容	面试权重
分布式锁选型	各方案对比与场景选择	🔴 高频必考
分布式锁对比	Redis/ZK/etcd/数据库	🟡 中频常考

二、学习路径指引

第一阶段：Redis 锁从入门到精通（5-7 天）

先看 Redis 分布式锁理解 SETNX + TTL 的基本实现，理解为什么简单实现有缺陷。然后看 Redis 锁的 lease 机制，理解看门狗（Watchdog）续期原理，这是生产环境必备的能力。

⚠️

Redis 锁最大的坑是：锁的 TTL 和任务执行时间的匹配。如果任务执行时间超过 TTL，锁就会过期，导致其他请求获取到锁，两个任务同时执行。解决方案是用看门狗机制续期，或者根据任务预估时间设置合理的 TTL。

第二阶段：啃透 RedLock（3-5 天）

RedLock 是 Redis 官方提出的分布式锁算法，用多个独立 Redis 节点提高可靠性。但它不是银弹，看 RedLock 的争议与批评理解它的局限性。

【架构权衡】 RedLock 的核心假设是：多个 Redis 节点是独立部署的，不共享时钟。如果你的 Redis 是主从部署，RedLock 反而可能降低可靠性。理解这一点，才能正确选型。

第三阶段：ZooKeeper 与 etcd（3-5 天）

ZooKeeper 锁用临时顺序节点实现锁，不依赖 TTL，锁会自动释放。但 ZooKeeper 的性能不如 Redis，适合对可靠性要求极高的场景。配合选举与锁的关系理解 ZooKeeper 的选主机制。

etcd 锁基于 Raft 协议，有线性一致性保证，适合对一致性要求高的场景。

第四阶段：数据库锁补充（2-3 天）

数据库锁是兜底方案，乐观锁用数据库乐观锁，悲观锁用数据库悲观锁。适合锁要求不高的场景，或者作为其他锁的补充。

三、生产避坑速查

翻车场景	根因	解决方案
Redis 锁过期但任务还在执行	TTL 设置不合理	用看门狗（Redisson）续期
Redis 主从切换丢锁	异步复制导致锁丢失	用 RedLock 或 ZK 锁
锁无法释放	任务异常退出，finally 没执行	用 TTL 兜底 + 监控告警
数据库乐观锁重试风暴	高并发下版本号冲突多	限制重试次数 + 业务拆分
ZooKeeper 锁惊群效应	节点释放锁后通知所有 watcher	临时顺序节点减少通知

四、面试高频考点

第一追问：Redis 分布式锁怎么实现？看门狗机制是什么？

考察候选人对 Redis 锁的掌握深度。必须能说清楚 SETNX + TTL 的基本实现，以及 Redisson 的看门狗续期原理。

第二追问：Redis 锁过期了，任务还没执行完怎么办？

考察候选人的实战经验。必须能说清楚看门狗机制、TTL 设置的权衡、任务执行时间的预估方法。

第三追问：RedLock 有什么问题？为什么有人说它不靠谱？

考察候选人对 RedLock 局限性的理解。必须能说清楚 RedLock 的假设条件、独立时钟问题、以及什么场景下不适合用 RedLock。

【架构权衡】分布式锁的选型没有最优解，只有最适合的解。Redis 锁性能高但有丢锁风险，ZooKeeper 锁可靠但性能低，etcd 锁介于两者之间。选择时必须权衡业务对一致性和可用性的需求。

级别	期望回答	判分标准
P5	能说出 Redis 锁的基本实现	基本概念正确
P6	能分析锁的边界条件和异常场景	能回答追问，理解细节
P7	能为业务场景设计完整的锁方案	有全局视野，能做权衡

五、锁的对比速查

方案	一致性	性能	可靠性	适用场景
Redis 锁	弱一致	高	中	并发控制、性能要求高
RedLock	中等一致	中	高	对可靠性有要求
ZooKeeper 锁	强一致	中	高	可靠性要求极高
etcd 锁	强一致	中	高	需要线性一致性
数据库乐观锁	强一致	低	高	并发度低、数据量小
数据库悲观锁	强一致	低	高	写冲突频繁

本模块覆盖分布式锁从原理到生产的完整链路，每个知识点都来自真实生产事故和踩坑经验。

#分布式锁

#一、内容总览

#1.1 Redis 分布式锁 🔴

#1.2 ZooKeeper 分布式锁 🟡

#1.3 etcd 分布式锁 🟢

#1.4 数据库锁 🟡

#1.5 锁的选型与对比 🟡

#二、学习路径指引

#第一阶段：Redis 锁从入门到精通（5-7 天）

#第二阶段：啃透 RedLock（3-5 天）

#第三阶段：ZooKeeper 与 etcd（3-5 天）

#第四阶段：数据库锁补充（2-3 天）

#三、生产避坑速查

#四、面试高频考点

#五、锁的对比速查