分布式ID生成器中的瑰宝：雪花算法Snowflake

后端

2024-01-22 20:01:47

分布式ID生成面临的挑战
在介绍雪花算法之前，我们先来看看分布式ID生成面临的挑战。

在分布式系统中，需要为每个实体分配一个唯一的ID。这个ID需要满足以下要求：

唯一性：每个实体的ID必须是唯一的，不能重复。
有序性：ID应该具有某种顺序，以便于排序和查找。
高性能：ID生成的速度必须足够快，以满足业务需求。
可扩展性：ID生成系统必须能够轻松扩展，以应对业务量的增长。

雪花算法的原理

雪花算法是一种高性能分布式唯一ID生成算法，它能够满足上述所有要求。雪花算法的基本原理如下：

将ID划分为几个部分，每部分都有自己的含义。
使用一个单调递增的数字作为ID的一部分，称为时间戳。
使用机器ID或进程ID作为ID的一部分，称为工作ID。
使用一个随机数作为ID的一部分，称为序列号。

雪花算法的实现

雪花算法的实现相对简单，可以很容易地用多种编程语言实现。这里以Java为例，介绍一下雪花算法的实现：

public class SnowflakeIdWorker {
    private static final long EPOCH = 1420041600000L; // 起始时间戳
    private static final long WORKER_ID_BITS = 5L; // 工作ID长度
    private static final long DATACENTER_ID_BITS = 5L; // 数据中心ID长度
    private static final long SEQUENCE_BITS = 12L; // 序列号长度

    private static final long MAX_WORKER_ID = -1L ^ (-1L << WORKER_ID_BITS);
    private static final long MAX_DATACENTER_ID = -1L ^ (-1L << DATACENTER_ID_BITS);

    private static final long WORKER_ID_SHIFT = SEQUENCE_BITS;
    private static final long DATACENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS;
    private static final long TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATACENTER_ID_BITS;

    private static final long SEQUENCE_MASK = -1L ^ (-1L << SEQUENCE_BITS);

    private long workerId;
    private long datacenterId;
    private long sequence = 0L;
    private long lastTimestamp = -1L;

    public SnowflakeIdWorker(long workerId, long datacenterId) {
        if (workerId > MAX_WORKER_ID || workerId < 0) {
            throw new IllegalArgumentException("workerId is invalid: " + workerId);
        }
        if (datacenterId > MAX_DATACENTER_ID || datacenterId < 0) {
            throw new IllegalArgumentException("datacenterId is invalid: " + datacenterId);
        }
        this.workerId = workerId;
        this.datacenterId = datacenterId;
    }

    public synchronized long nextId() {
        long timestamp = timeGen();
        if (timestamp < lastTimestamp) {
            throw new RuntimeException("Clock moved backwards.  Refusing to generate id for " + (lastTimestamp - timestamp) + " milliseconds");
        }
        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & SEQUENCE_MASK;
            if (sequence == 0) {
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            sequence = 0L;
        }

        lastTimestamp = timestamp;

        return ((timestamp - EPOCH) << TIMESTAMP_LEFT_SHIFT) |
                (datacenterId << DATACENTER_ID_SHIFT) |
                (workerId << WORKER_ID_SHIFT) |
                sequence;
    }

    private long tilNextMillis(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = timeGen();
        }
        return timestamp;
    }

    private long timeGen() {
        return System.currentTimeMillis();
    }
}