面試官:分庫分表后如何生成全局 ID?
發(fā)布時間:2024-01-24 14:02:50
1.UUID 作為全局 ID
UUID(Universally Unique Identifier)是一種全局唯一標識符,它保證在空間和時間上的唯一性。通常由 128 位的數(shù)字組成,采用 32 位的十六進制數(shù)表示,格式為 8-4-4-4-12 這樣的 36 個字符(32 個字母數(shù)字字符和 4 個短橫線),例如 550e8400-e29b-41d4-a716-446655440000。UUID 在 Java 中的實現(xiàn)如下:
什么是UUID?UUID全稱:Universally Unique Identifier,即通用唯一識別碼。UUID是由一組32位數(shù)的16進制數(shù)字所構成,是故UUID理論上的總數(shù)為16^32 = 2^128,約等于3.4 x 10^38。也就是說若每納秒產生1兆個UUID,要花100億年才會將所有UUID用完。UUID的標準型式包含32個16進制數(shù)字,以連字號分為五段,形式為8-4-4-4-12的32個字符,如:550e8400-e29b-41d4-a716-446655440000。UUID的作用UUID的是讓分布式系統(tǒng)中的所有元素都能有唯一的辨識信息,而不需要通過中央控制端來做辨識信息的指定。如此一來,每個人都可以創(chuàng)建不與其它人沖突的UUID。在這樣的情況下,就不需考慮數(shù)據(jù)庫創(chuàng)建時的名稱重復問題。目前最廣泛應用的UUID,是微軟公司的全局唯一標識符(GUID),而其他重要的應用,則有Linux ext2/ext3文件系統(tǒng)、LUKS加密分區(qū)、GNOME、KDE、Mac OS X等等。
UUID 存在的問題
雖然 UUID 可以保證全局唯一,但并不推薦使用 UUID 來作為分庫分表后的主鍵 ID,因為 UUID 有兩個問題:
UUID 太長,且生成效率較低。
UUID 沒有任何業(yè)務含義,不連續(xù)且沒有任何順序可言。
UUID的組成UUID是指在一臺機器上生成的數(shù)字,它保證對在同一時空中的所有機器都是唯一的。通常平臺會提供生成的API。按照開放軟件基金會(OSF)制定的標準計算,用到了以太網(wǎng)卡地址、納秒級時間、芯片ID碼和許多可能的數(shù)字。UUID由以下幾部分的組合:當前日期和時間,UUID的第一個部分與時間有關,如果你在生成一個UUID之后,過幾秒又生成一個UUID,則第一個部分不同,其余相同。時鐘序列。全局唯一的IEEE機器識別號,如果有網(wǎng)卡,從網(wǎng)卡MAC地址獲得,沒有網(wǎng)卡以其他方式獲得。UUID的唯一缺陷在于生成的結果串會比較長。關于UUID這個標準使用最普遍的是微軟的GUID(Globals Unique Identifiers)。
2.雪花 ID 作為全局 ID
雪花 ID(Snowflake ID)是一個用于分布式系統(tǒng)中生成唯一 ID 的算法,由 Twitter 公司提出。它的設計目標是在分布式環(huán)境下高效地生成全局唯一的 ID,具有一定的有序性。雪花 ID 的結構如下所示(共 64 位):
這四部分代表的含義:
符號位:最高位是符號位,始終為 0,1 表示負數(shù),0 表示正數(shù),ID 都是正整數(shù),所以固定為 0。
時間戳部分:由 41 位組成,精確到毫秒級。可以使用該 41 位表示的時間戳來表示的時間可以使用 69 年。
節(jié)點 ID 部分:由 10 位組成,用于表示機器節(jié)點的唯一標識符。在同一毫秒內,不同的節(jié)點生成的 ID 會有所不同。
序列號部分:由 12 位組成,用于標識同一毫秒內生成的不同 ID 序列。在同一毫秒內,可以生成 4096 個不同的 ID。
Java 版雪花算法實現(xiàn)
接下來,我們來實現(xiàn)一個 Java 版的雪花算法:
public class SnowflakeIdGenerator {
// 定義雪花 ID 的各部分位數(shù)
private static final long TIMESTAMP_BITS = 41L;
private static final long NODE_ID_BITS = 10L;
private static final long SEQUENCE_BITS = 12L;
// 定義起始時間戳(可根據(jù)實際情況調整)
private static final long EPOCH = 1609459200000L;
// 定義最大取值范圍
private static final long MAX_NODE_ID = (1L << NODE_ID_BITS) - 1;
private static final long MAX_SEQUENCE = (1L << SEQUENCE_BITS) - 1;
// 定義偏移量
private static final long TIMESTAMP_SHIFT = NODE_ID_BITS + SEQUENCE_BITS;
private static final long NODE_ID_SHIFT = SEQUENCE_BITS;
private final long nodeId;
private long lastTimestamp = -1L;
private long sequence = 0L;
public SnowflakeIdGenerator(long nodeId) {
if (nodeId < 0 || nodeId > MAX_NODE_ID) {
throw new IllegalArgumentException("Invalid node ID");
}
this.nodeId = nodeId;
}
public synchronized long generateId() {
long currentTimestamp = timestamp();
if (currentTimestamp < lastTimestamp) {
throw new IllegalStateException("Clock moved backwards");
}
if (currentTimestamp == lastTimestamp) {
sequence = (sequence + 1) & MAX_SEQUENCE;
if (sequence == 0) {
currentTimestamp = untilNextMillis(lastTimestamp);
}
} else {
sequence = 0L;
}
lastTimestamp = currentTimestamp;
return ((currentTimestamp - EPOCH) << TIMESTAMP_SHIFT) |
(nodeId << NODE_ID_SHIFT) |
sequence;
}
private long timestamp() {
return System.currentTimeMillis();
}
private long untilNextMillis(long lastTimestamp) {
long currentTimestamp = timestamp();
while (currentTimestamp <= lastTimestamp) {
currentTimestamp = timestamp();
}
return currentTimestamp;
}
}
調用代碼如下:
public class Main {
public static void main(String[] args) {
// 創(chuàng)建一個雪花 ID 生成器實例,傳入節(jié)點 ID
SnowflakeIdGenerator idGenerator = new SnowflakeIdGenerator(1);
// 生成 ID
long id = idGenerator.generateId();
System.out.println(id);
}
}