纵横分布式：雪花算法教你如何斩获唯一ID的终极答案

后端

2022-12-22 17:25:32

雪花算法：分布式ID生成的神兵利器

在现代分布式系统中，生成全局唯一ID是一项至关重要的任务。传统方法，如UUID，虽然能产生唯一ID，但其随机性使得有序存储和范围查询变得困难。

因此，雪花算法 应运而生。它是一种分布式ID生成算法，专为解决分布式系统中唯一ID生成难题而设计。

雪花算法的秘密配方

雪花算法将ID划分为几个部分，每个部分都有其特定含义：

时间戳： 记录ID生成的时间，长度为41位，足以覆盖公元前4712年1月1日到公元2684年12月31日之间的所有时间。
工作节点ID： 区分不同的ID生成节点，长度为10位，可表示1024个节点。
序列号： 区分同一节点在同一时间内生成的ID，长度为12位，可表示4096个序列号。

雪花算法的Java实现

public class SnowflakeIdGenerator {

    private static final long EPOCH = 1420070400000L; // 2015-01-01 00:00:00

    private static final long WORKER_ID_BITS = 10L; // 工作节点ID长度
    private static final long DATACENTER_ID_BITS = 10L; // 数据中心ID长度
    private static final long SEQUENCE_BITS = 12L; // 序列号长度

    private static final long MAX_WORKER_ID = ~(-1L << WORKER_ID_BITS); // 最大工作节点ID
    private static final long MAX_DATACENTER_ID = ~(-1L << DATACENTER_ID_BITS); // 最大数据中心ID
    private static final long MAX_SEQUENCE = ~(-1L << SEQUENCE_BITS); // 最大序列号

    private final long workerId; // 工作节点ID
    private final long datacenterId; // 数据中心ID
    private final AtomicLong sequence = new AtomicLong(0L); // 序列号

    public SnowflakeIdGenerator(long workerId, long datacenterId) {
        if (workerId > MAX_WORKER_ID || workerId < 0) {
            throw new IllegalArgumentException("workerId must be between 0 and " + MAX_WORKER_ID);
        }
        if (datacenterId > MAX_DATACENTER_ID || datacenterId < 0) {
            throw new IllegalArgumentException("datacenterId must be between 0 and " + MAX_DATACENTER_ID);
        }
        this.workerId = workerId;
        this.datacenterId = datacenterId;
    }

    public synchronized long nextId() {
        long timestamp = System.currentTimeMillis() - EPOCH; // 当前时间戳
        long workerIdShift = WORKER_ID_BITS + DATACENTER_ID_BITS; // 工作节点ID和数据中心ID的偏移量
        long sequenceShift = SEQUENCE_BITS; // 序列号的偏移量
        long workerIdBits = (workerId << workerIdShift) & ((1 << workerIdShift) - 1); // 工作节点ID的二进制表示
        long datacenterIdBits = (datacenterId << (workerIdShift - DATACENTER_ID_BITS)) & ((1 << (workerIdShift - DATACENTER_ID_BITS)) - 1); // 数据中心ID的二进制表示
        long sequenceBits = (sequence.incrementAndGet() << sequenceShift) & ((1 << sequenceShift) - 1); // 序列号的二进制表示

        return timestamp | workerIdBits | datacenterIdBits | sequenceBits; // 合并所有部分
    }
}