一、雪花算法datacenterId重复问题

华为云的服务器的/etc/hosts中都会生成一条 127.0.1.1 hostname的记录 ,导致获取network为null ,datacenterId 会取默认值1,导致重复概率大大增加。

二、idworker 是一个基于zookeeper和snowflake算法的分布式统一ID生成工具

通过zookeeper自动注册机器(最多1024台),无需手动指定workerId和dataCenterId。
通过ZooKeeper持久顺序节点特性,来配置维护节点的编号NODEID。
集群节点命名服务的基本流程是:
(1)启动节点服务,连接ZooKeeper, 检查命名服务根节点根节点是否存在,如果不存在就创建系统根节点。
(2)在根节点下创建一个临时顺序节点,取回顺序号做节点的NODEID。如何临时节点太多,可以根据需要,删除临时节点。

由于是采用zookeeper顺序节点的特性生成datacenterId和workerId,可以天然的保证datacenterId和workerId的唯一性,减少了人工维护的弊端。

三、idworker使用

1、mybatis-plus-boot-starter要升级到3.4.0以上,根据具体项目不同选择合适的版本

<dependency>
    <groupId>com.baomidou</groupId>
    <artifactId>mybatis-plus-boot-starter</artifactId>
    <version>3.4.0</version>
</dependency>

2、增加idworker的1.5.0版本的依赖

<dependency>
    <groupId>com.imadcn.framework</groupId>
    <artifactId>idworker</artifactId>
    <version>1.5.0</version>
</dependency>

3、增加IdAutoConfig.java文件

@Configurationd
public class IdAutoConfig {
    @Value("${mybatis-plus.zookeeper.serverLists:127.0.0.1:2181}")
    private String zkServerLists;

    @Bean
    public IdentifierGenerator idGenerator() {
        return new ImadcnIdentifierGenerator(zkServerLists);
    }
}

或者:

@Configuration
@MapperScan(
        basePackages = "com.script.idworker.mapper",
        sqlSessionFactoryRef = "sqlSessionFactory")
public class DataSourceConfig {
    @Value("${mybatis-plus.zookeeper.serverLists}")
    private String zkServerLists;

    @Bean(name = "dataSource")
    @Primary
    @ConfigurationProperties(prefix = "spring.datasource.druid")
    public DataSource getDataSource() {
        return DruidDataSourceBuilder.create().build();
    }

    @Bean(name = "sqlSessionFactory")
    @Primary
    public SqlSessionFactory sqlSessionFactory(@Qualifier("dataSource") DataSource datasource) throws Exception {
        MybatisSqlSessionFactoryBean sqlSessionFactory = new MybatisSqlSessionFactoryBean();
        sqlSessionFactory.setDataSource(datasource);
        MybatisConfiguration configuration = new MybatisConfiguration();
        // 驼峰转下划线
        configuration.setMapUnderscoreToCamelCase(true);
        sqlSessionFactory.setConfiguration(configuration);
        
        // 设置使用Mybatis的Snowflake算法生成id
        GlobalConfig globalConfig = new GlobalConfig();
        globalConfig.setIdentifierGenerator(new ImadcnIdentifierGenerator(zkServerLists));
        sqlSessionFactory.setGlobalConfig(globalConfig);
        
        return sqlSessionFactory.getObject();
    }
}

4、可能curator版本冲突问题,idworker依赖的curator是4.x版本的,可能和dubbo依赖的curator版本冲突,可能和zookeeper 3.4.x版本不兼容

四、idworker源码分析

1、返回SnowflakeId
Snowflake.java#nextId()

public synchronized long nextId() {
    long timestamp = timeGen();
    // 如果上一个timestamp与新产生的相等,则sequence加一(0-4095循环);
    if (lastTimestamp == timestamp) {
        // 对新的timestamp,sequence从0开始
        sequence = sequence + 1 & sequenceMask;
        // 毫秒内序列溢出
        if (sequence == 0) {
            // 阻塞到下一个毫秒,获得新的时间戳
            sequence = RANDOM.nextInt(100);
            timestamp = tilNextMillis(lastTimestamp);
        }
    } else {
        // 时间戳改变,毫秒内序列重置
        sequence = RANDOM.nextInt(100);
    }
    // 如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
    if (timestamp < lastTimestamp) {
        String message = String.format("Clock moved backwards. Refusing to generate id for %d milliseconds.",
                (lastTimestamp - timestamp));
        logger.error(message);
        throw new RuntimeException(message);
    }
    lastTimestamp = timestamp;
    // 移位并通过或运算拼到一起组成64位的ID
    // 1 + 41 + 10 + 22
    // 0 - 0000000000 0000000000 0000000000 0000000000 0 - 0000000000 - 000000000000
    return timestamp - epoch << timestampLeftShift | workerId << workerIdShift | sequence;
}
  • 1位标识,由于long基本类型在Java中是带符号的,最高位是符号位,正数是0,负数是1,所以id一般是正数,最高位是0
  • 41位时间戳(毫秒级),注意,41位时间戳不是存储当前时间的时间戳,而是存储时间戳的差值(当前时间戳 - 开始时间戳)得到的值),这里的的开始时间戳,一般是我们的id生成器开始使用的时间,由我们程序来指定的(如下下面程序epoch属性)。41位的时间戳,可以使用69年
  • 10位的数据机器位,可以部署在1024个节点,包括5位datacenterId和5位workerId,
  • 12位序列,毫秒内的计数,12位的计数顺序号支持每个节点每毫秒(同一机器,同一时间戳)产生4096个ID序号
  • 加起来刚好64位,为一个Long型。

2、向zookeeper注册workerId,返回workerId
ZookeeperWorkerRegister#register()

public long register() {
    InterProcessMutex lock = null;
    try {
        CuratorFramework client = (CuratorFramework) regCenter.getRawClient();
        lock = new InterProcessMutex(client, nodePath.getGroupPath());
        int numOfChildren = regCenter.getNumChildren(nodePath.getWorkerPath());
        if (numOfChildren < MAX_WORKER_NUM) {
            if (!lock.acquire(MAX_LOCK_WAIT_TIME_MS, TimeUnit.MILLISECONDS)) {
                String message = String.format("acquire lock failed after %s ms.", MAX_LOCK_WAIT_TIME_MS);
                throw new TimeoutException(message);
            }
            NodeInfo localNodeInfo = getLocalNodeInfo();
            List<String> children = regCenter.getChildrenKeys(nodePath.getWorkerPath());
            // 有本地缓存的节点信息,同时ZK也有这条数据
            if (localNodeInfo != null && children.contains(String.valueOf(localNodeInfo.getWorkerId()))) {
                String key = getNodePathKey(nodePath, localNodeInfo.getWorkerId());
                String zkNodeInfoJson = regCenter.get(key);
                NodeInfo zkNodeInfo = createNodeInfoFromJsonStr(zkNodeInfoJson);
                if (checkNodeInfo(localNodeInfo, zkNodeInfo)) {
                    // 更新ZK节点信息,保存本地缓存,开启定时上报任务
                    nodePath.setWorkerId(zkNodeInfo.getWorkerId());
                    zkNodeInfo.setUpdateTime(new Date());
                    updateZookeeperNodeInfo(key, zkNodeInfo);
                    saveLocalNodeInfo(zkNodeInfo);
                    executeUploadNodeInfoTask(key, zkNodeInfo);
                    return zkNodeInfo.getWorkerId();
                }
            }
            // 无本地信息或者缓存数据不匹配,开始向ZK申请节点机器ID
            for (int workerId = 0; workerId < MAX_WORKER_NUM; workerId++) {
                String workerIdStr = String.valueOf(workerId);
                if (!children.contains(workerIdStr)) { // 申请成功
                    NodeInfo applyNodeInfo = createNodeInfo(nodePath.getGroupName(), workerId);
                    nodePath.setWorkerId(applyNodeInfo.getWorkerId());
                    // 保存ZK节点信息,保存本地缓存,开启定时上报任务
                    saveZookeeperNodeInfo(nodePath.getWorkerIdPath(), applyNodeInfo);
                    saveLocalNodeInfo(applyNodeInfo);
                    executeUploadNodeInfoTask(nodePath.getWorkerIdPath(), applyNodeInfo);
                    return applyNodeInfo.getWorkerId();
                }
            }
        }
        throw new RegException("max worker num reached. register failed");
    } catch (RegException e) {
        throw e;
    } catch (Exception e) {
        logger.error("", e);
        throw new IllegalStateException(e.getMessage(), e);
    } finally {
        try {
            if (lock != null) {
                lock.release();
            }
        } catch (Exception ignored) {
            logger.error("", ignored);
        }
    }
}

五、idworker缺点

idworker向zookeeper注册workerId,返回workerId后,会在本地缓存workerId,这样就会导致如果同一台机器部署了多个应用,那么多个应用会共享同一个本地缓存,所以仍有可能造成id重复。