ZK分布式锁的作用和原理
作用
在分布式系统中,多个节点(或进程)需要协调对共享资源的访问时,ZK分布式锁用于实现互斥访问。其核心作用包括:
- 避免资源冲突:确保同一时刻只有一个节点能操作共享资源(如数据库行、文件等)。
- 保证操作原子性:防止并发写入导致数据不一致。
- 高可用性:基于ZK的集群特性,即使部分节点故障,锁服务仍可用。
原理
ZK分布式锁的实现依赖于ZooKeeper的两个关键特性:临时有序节点和监听机制。具体流程如下:
1.获取锁
- 客户端在ZK的锁目录下创建临时有序节点(例如:
/lock/lock_00000001)。 - 检查当前目录下所有子节点,若自身节点序号最小,则成功获取锁。
- 若未获得锁,客户端监听序号紧邻的前一个节点(避免“羊群效应”)。
2.释放锁
- 客户端主动删除自身临时节点。
- 若客户端会话中断(如宕机),ZK自动删除临时节点,锁立即释放(避免死锁)。
3.锁等待
- 当监听的前一个节点被删除时,ZK通知客户端重新检查序号,若此时自身节点序号最小,则获取锁。
数学表示锁获取条件: 设所有子节点序号集合为$S = {n_1, n_2, \dots, n_k}$,客户端节点序号为$n_c$,则需满足: $$ \min(S) = n_c $$
代码示例(简化流程)
from kazoo.client import KazooClient zk = KazooClient(hosts='127.0.0.1:2181') zk.start() def acquire_lock(lock_path): # 创建临时有序节点 path = zk.create(lock_path + "/lock_", ephemeral=True, sequence=True) # 获取当前所有子节点 children = zk.get_children(lock_path) sorted_children = sorted(children) # 判断是否为最小节点 if path.endswith(sorted_children[0]): return True else: # 监听前一个节点 prev_index = sorted_children.index(path.split('/')[-1]) - 1 prev_node = sorted_children[prev_index] zk.get(lock_path + "/" + prev_node, watch=lock_released) return False def lock_released(event): # 重新尝试获取锁 if acquire_lock(lock_path): # 执行业务逻辑 execute_critical_section()注意事项
- 临时节点特性:客户端会话结束时自动删除节点,避免死锁。
- 顺序监听:仅监听前一个节点,减少ZK通知风暴。
- 锁重入:需在客户端维护线程级重入计数(ZK不原生支持)。
适用场景
- 强一致性场景(ZK保证CP)。
- 锁持有时间较短的操作(避免频繁节点监听)。
- 非高频读写场景(ZK写性能有限)。