为了达到业务的幂等,必须要有这样一个 id 存在,需要满足下面几个条件:
同一业务场景要全局唯一。
该 id 必须是在消息的发送方进行产生发送到 MQ。
消费端根据该 id 进行判断是否重复,确保幂等。
在那里产生,和消费端进行判断等和这个 id 没有关系,这个 id 的要求就是局部唯一或者全局唯一即可,由于这个 id 是唯一的,可以用来当数据库的主键,既然要做主键那么之前刚刚好发过一篇文章:从开发者角度谈 Mysql ( 1 ):主键问题,文章重点提到为什么需要自增、或者趋势自增的好处。(和 Mysql 数据存储做法有关)。
那么该 id 需要有
2 个特性
局部、全局唯一。
趋势递增。
如果有方法可以生成全局唯一(那么在局部也一定唯一了),生成分布式唯一 id 的方法有很多。该算法实现得到的 id 就满足上面提到的 2 点。
snowflake 算法
snowflake 是 Twitter 开源的分布式 ID 生成算法,结果是一个 long 型的 ID。其核心思想是:使用 41bit 作为毫秒数,10bit 作为机器的 ID ( 5 个 bit 是数据中心,5 个 bit 的机器 ID ),12bit 作为毫秒内的流水号(意味着每个节点在每毫秒可以产生 4096 个 ID ),最后还有一个符号位,永远是 0。
1位,不用。二进制中最高位为1的都是负数,但是我们生成的id一般都使用整数,所以这个最高位固定是0
41位,用来记录时间戳(毫秒)。
41位可以表示个数字,
如果只用来表示正整数(计算机中正数包含0),可以表示的数值范围是:0 至 ,减1是因为可表示的数值范围是从0开始算的,而不是1。
也就是说41位可以表示个毫秒的值,转化成单位年则是年
10位,用来记录工作机器id。
可以部署在个节点,包括5位datacenterId和5位workerId
5位(bit)可以表示的最大正整数是,即可以用0、1、2、3、…31这32个数字,来表示不同的datecenterId或workerId
12位,序列号,用来记录同毫秒内产生的不同id。
12位(bit)可以表示的最大正整数是,即可以用0、1、2、3、…4094这4095个数字,来表示同一机器同一时间截(毫秒)内产生的4095个ID序号