当前位置：主页 > 查看内容

什么是雪花ID？

发布时间：2021-05-24 00:00| 有位朋友查看

简介：文章已收录Github精选，欢迎Star： https://github.com/yehongzhi/learningSummary 为什么使用雪花ID 在以前的项目中，最常见的两种主键类型是自增Id和UUID，在比较这两种ID之前首先要搞明白一个问题，就是为什么主键有序比无序查询效率要快，因为自增Id和UU……

文章已收录Github精选，欢迎Star：https://github.com/yehongzhi/learningSummary为什么使用雪花ID

在以前的项目中，最常见的两种主键类型是自增Id和UUID，在比较这两种ID之前首先要搞明白一个问题，就是为什么主键有序比无序查询效率要快，因为自增Id和UUID之间最大的不同点就在于有序性。

我们都知道，当我们定义了主键时，数据库会选择表的主键作为聚集索引(B+Tree)，mysql 在底层是以数据页为单位来存储数据的。

也就是说如果主键为自增 id 的话，mysql 在写满一个数据页的时候，直接申请另一个新数据页接着写就可以了。如果一个数据页存满了，mysql 就会去申请一个新的数据页来存储数据。如果主键是UUID，为了确保索引有序，mysql 就需要将每次插入的数据都放到合适的位置上。这就造成了页分裂，这个大量移动数据的过程是会严重影响插入效率的。

一句话总结就是，InnoDB表的数据写入顺序能和B+树索引的叶子节点顺序一致的话，这时候存取效率是最高的。

但是为什么很多情况又不用自增id作为主键呢？

容易导致主键重复。比如导入旧数据时，线上又有新的数据新增，这时就有可能在导入时发生主键重复的异常。为了避免导入数据时出现主键重复的情况，要选择在应用停业后导入旧数据，导入完成后再启动应用。显然这样会造成不必要的麻烦。而UUID作为主键就不用担心这种情况。不利于数据库的扩展。当采用自增id时，分库分表也会有主键重复的问题。UUID则不用担心这种问题。

那么问题就来了，自增id会担心主键重复，UUID不能保证有序性，有没有一种ID既是有序的，又是唯一的呢？

当然有，就是雪花ID。

什么是雪花ID

snowflake是Twitter开源的分布式ID生成算法，结果是64bit的Long类型的ID，有着全局唯一和有序递增的特点。

最高位是符号位，因为生成的 ID 总是正数，始终为0，不可用。41位的时间序列，精确到毫秒级，41位的长度可以使用69年。时间位还有一个很重要的作用是可以根据时间进行排序。10位的机器标识，10位的长度最多支持部署1024个节点。12位的计数序列号，序列号即一系列的自增ID，可以支持同一节点同一毫秒生成多个ID序号，12位的计数序列号支持每个节点每毫秒产生4096个ID序号。

缺点也是有的，就是强依赖机器时钟，如果机器上时钟回拨，有可能会导致主键重复的问题。

Java实现雪花ID

下面是用Java实现雪花ID的代码，供大家参考一下。

public class SnowflakeIdWorker {
 * 开始时间：2020-01-01 00:00:00
 private final long beginTs = 1577808000000L;
 private final long workerIdBits = 10;
 * 2^10 - 1 = 1023
 private final long maxWorkerId = -1L ^ (-1L workerIdBits);
 private final long sequenceBits = 12;
 * 2^12 - 1 = 4095
 private final long maxSequence = -1L ^ (-1L sequenceBits);
 * 时间戳左移22位
 private final long timestampLeftOffset = workerIdBits + sequenceBits;
 * 业务ID左移12位
 private final long workerIdLeftOffset = sequenceBits;
 * 合并了机器ID和数据标示ID，统称业务ID，10位
 private long workerId;
 * 毫秒内序列，12位，2^12 = 4096个数字
 private long sequence = 0L;
 * 上一次生成的ID的时间戳，同一个worker中
 private long lastTimestamp = -1L;
 public SnowflakeIdWorker(long workerId) {
 if (workerId maxWorkerId || workerId 0) {
 throw new IllegalArgumentException(String.format("WorkerId必须大于或等于0且小于或等于%d", maxWorkerId));
 this.workerId = workerId;
 public synchronized long nextId() {
 long ts = System.currentTimeMillis();
 if (ts lastTimestamp) {
 throw new RuntimeException(String.format("系统时钟回退了%d毫秒", (lastTimestamp - ts)));
 // 同一时间内，则计算序列号
 if (ts == lastTimestamp) {
 // 序列号溢出
 if (++sequence maxSequence) {
 ts = tilNextMillis(lastTimestamp);
 sequence = 0L;
 } else {
 // 时间戳改变，重置序列号
 sequence = 0L;
 lastTimestamp = ts;
 // 0 - 00000000 00000000 00000000 00000000 00000000 0 - 00000000 00 - 00000000 0000
 // 左移后，低位补0，进行按位或运算相当于二进制拼接
 // 本来高位还有个0 63，0与任何数字按位或都是本身，所以写不写效果一样
 return (ts - beginTs) timestampLeftOffset | workerId workerIdLeftOffset | sequence;
 * 阻塞到下一个毫秒
 * @param lastTimestamp
 * @return
 private long tilNextMillis(long lastTimestamp) {
 long ts = System.currentTimeMillis();
 while (ts = lastTimestamp) {
 ts = System.currentTimeMillis();
 return ts;
 public static void main(String[] args) {
 SnowflakeIdWorker snowflakeIdWorker = new SnowflakeIdWorker(7);
 for (int i = 0; i i++) {
 long id = snowflakeIdWorker.nextId();
 System.out.println(id);
}

main方法，测试结果如下：

184309536616640512
184309536616640513
184309536616640514
184309536616640515
184309536616640516
184309536616640517
184309536616640518
184309536616640519
184309536616640520
184309536616640521

总结

在大部分公司的开发项目中里，雪花ID是主流的ID生成策略，除了自己实现之外，目前市场上也有很多开源的实现，比如：

美团开源的Leaf 百度开源的UidGenerator

有兴趣的可以自行观摩一下，那么这篇文章就写到这里了，感谢大家的阅读。

觉得有用就点个赞吧，你的点赞是我创作的最大动力~

我是一个努力让大家记住的程序员。我们下期再见！！！
在这里插入图片描述

能力有限，如果有什么错误或者不当之处，请大家批评指正，一起学习交流！
本文转自网络，原文链接：https://developer.aliyun.com/article/784251
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：云上创新 2021阿里云峰会邀您参加 下一篇：利用NBI大数据可视化工具做RFM模型分析，洞察数据价值，驱动业务

随机推荐

盒子科技

客户简介深圳盒子信息科技有限公司成立于2011年，是国家高新技术企业、深圳市高...
如何修改Windows裸金属服务器网卡的MTU值

最大传输单元（Maximum Transmission Unit，MTU）是指一种通信协议的某一层上所...
新零售行业优质解决方案分享【智能语音点

1、智能语音点餐机解决方案方案架构架构特点基于达摩院特有的多模态交互技术 ...
云计算带来的变革将如何在2021年加速创新

在过去的一年中，云计算已经成为组织应对冠状病毒疫情对其业务不利影响的关键技...
新零售行业优质解决方案分享【商超连锁全

中台有机衔接稳定的后台系统和灵活多变的前端业务场景通过抽取后台系统的数据 ...
自学大数据，给IT新手的7个MongoDB实战项

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供...
怎么防御udp攻击

怎么防御udp攻击？UDP Flood是日渐猖厥的流量型 ddos 攻击。常见的情况是利用大...
阿里云AIoT发布全新工业和农业云端一体机

发布会传送门： https://yqh.aliyun.com/live/aiotfa 近日，阿里云AIoT春季产品...
【活动已结束，获奖人员名单公布】3月Tec

3月Techo Youth高校公开课Demo实操演练【活动已结束】 3月Techo Youth高校公开...
走出实验室: IBM为企业推进人工智能注入

2020年7月9日，2020年世界人工智能大会（the World Artificial Intelligence Con...

什么是雪花ID？

推荐图文

一日一技：在Python里面实现链式调用

百度智能云阿里云和腾讯云的云服务器三者的对比

手把手带你使用uni-admin搭建后台管理系统

Oracle学习(六)：子查询

远程桌面连接（MSTSC方式）_云耀云服务器 HECS_用户

有“车圈”、“车全”等含义：双拼域名chequan.cn在

随机推荐

盒子科技

如何修改Windows裸金属服务器网卡的MTU值

新零售行业优质解决方案分享【智能语音点

云计算带来的变革将如何在2021年加速创新

新零售行业优质解决方案分享【商超连锁全

自学大数据，给IT新手的7个MongoDB实战项

怎么防御udp攻击

阿里云AIoT发布全新工业和农业云端一体机

【活动已结束，获奖人员名单公布】3月Tec

走出实验室: IBM为企业推进人工智能注入

关于我们