使用规范

不支持:不支持case when,having,union 

可解析至第一个含表的子查询,在下层嵌套再次找到子查询抛错

子查询不支持聚合函数,不支持含shema的SQL:shardingsphere对sql的访问都是在同一个逻辑schema上

分页

完全支持MySQL、PostgreSQL和Oracle的分页查询,SQLServer由于分页查询较为复杂,仅部分支持

性能

编译量过大的分页导致获取数据性能下降

优化

  • 流式处理+归并排序:sql改写占用额外带宽不会导致内存暴涨,结果集有序,shardingsphere每次比较仅获取各分片当前结果集记录,在内存中的记录仅为当前路由到的分片结果集的当前游标指向,对于本身有序的待排序对象,归并排序时间复杂度O(n)
  • shardingsphere对 仅落至单分片的查询 进一步优化,落至单分片查询的请求不需要改成sql也可保证记录正确性:未改写sql

优化实例

LIMIT不能通过索引查询数据,通过连续性ID分页,或上次查询结果最后一条

SELECT * FROM t_order WHERE id > 100000 AND id <= 100010 ORDER BY id
SELECT * FROM t_order WHERE id > 100000 LIMIT 10

分页子查询

oracle,使用rownum分页

SELECT * FROM (SELECT row_.*, rownum rownum_ FROM (SELECT o.order_id as order_id FROM t_order o JOIN t_order_item i ON o.order_id = i.order_id) row_ WHERE rownum <= ?) WHERE rownum > ?

sqlserver,TOP + ROW_NUMBER() OVER

SELECT * FROM (SELECT TOP (?) ROW_NUMBER() OVER (ORDER BY o.order_id DESC) AS rownum, * FROM t_order o) AS temp WHERE temp.rownum > ? ORDER BY temp.order_id

SQL service 2012后的offset fetch
SELECT * FROM t_order o ORDER BY id OFFSET ? ROW FETCH NEXT ? ROWS ONLY
https://www.yiibai.com/sqlserver/sql-server-offset-fetch.html

不支持Wtih *** as (select ……)分页:hibernate自动分页语句使用了,所以不支持基于hibernate的sqlservice 分页

不支持两个top+子查询的分页方式

其他功能

行表达式

实现动机:配置简化和一体化

语法:Groovy

配置中使用${expression}或$—>{expression}标识

目前支持数据节点和分片算法的配置

多个${expression} $—>{expression},结果据每个子表达式结果笛卡尔组合

分布式主键

snowflake

分片规则配置每个表主键生成策略,默认使用雪花算法生成64bit长整型数据

不同进程主键不重复,同一进程主键有序

        同进程中,通过时间位:不重复,时间同序通列位保证不重复

        主键:1bit符号位,41bit时间戳位,10bit工作进程位,12bit序列号位

符号位:预留符号位恒为0

时间戳位:毫秒数:2的41次幂,一年所使用毫秒数 365*24*60*60*1000约等于69.73年,始于2016/11/1/00:00:00

工作进程:java进程内唯一,分布式应用部署应保证每个进程id不同,该值默认为0可设置属性

序列号位:同一毫秒内生成不同ID,如该毫秒生超过4096(2的12次幂),生成器等待下一毫秒

时钟回拨

将导致重复序列,默认分布式主键生成器提供了一个最大容忍的时钟回拨毫秒数:默认0,设置属性

        超过,报错

        范围内,默认会等待时钟同步到最后一次主键生成的时间后再继续工作

leaf

leaf_segment和leaf_snowflake两种方案,目前shardingsphere已实现leaf_segment

shardingsphere如何查询information_schema_sql

强制分片路由

解析sql提取分片键列与值 进行分片,若无分片条件 无法分片 需全路由

使用threadlocal管理分片键值,通编程方式向hintmanager添加分片条件,仅当前线程有效

还计划通过sql中特殊注释引用hint,开发者透明方式使用该功能

指定强制分片路由sql无视原有分片逻辑,直接路由至指定真实数据节点

读写分离

据sql语义分析,读写路由至主从库

概念

主库:增删改操作使用的库,仅支持单主库

从库:查数据操作所使用的库,多从库

主从同步:主库数据异步的同步到从库,由于主从同步的异步性,主从数据短时间内不一致

功能

一主多从读写分离配置,可独立使用,可配合分库分表使用

独立使用读写分离支持sql透传

基于hint强制主库路由

同一线程且同一库连接内,如有写入,以后读均从主库取

不支持

主从数据同步,主从同步延迟导致数据不一致,主库双写或多写

编排治理

配置中心

配置中心在定义的命名空间的config下,以yaml格式存:数据源 数据分片 读写分离 properties配置

数据结构

config
    ├──authentication                            # Sharding-Proxy权限配置
    ├──props                                     # 属性配置
    ├──schema                                    # Schema配置
    ├      ├──sharding_db                        # SchemaName配置
    ├      ├      ├──datasource                  # 数据源配置
    ├      ├      ├──rule                        # 数据分片规则配置
    ├      ├──masterslave_db                     # SchemaName配置
    ├      ├      ├──datasource                  # 数据源配置
    ├      ├      ├──rule                        # 读写分离规则

https://shardingsphere.apache.org/document/current/cn/features/orchestration/config-center/  !!!

编排治理

通注册中心,提供熔断数据库访问程序对数据库访问和禁用从库访问

注册中心数据结构

在命名空间的state下,创建数据库访问对象运行节点,区分不同数据库访问实例:instances 和 datasources

state/instances:数据库访问对象运行实例信息,子节点:当前运行实例标识

        标识由 服务器IP和PID构成,临时节点 实例上线时注册下线时清理

         注册中心监控节点变化治理运行中实例对数据库的访问

state/datasources:治理读写分离从库,动态添加 删除 禁用

操作指南

熔断实例

在IP@-@PID节点写入disabled(忽略大小写):禁用该实例 删除disabled:启用

禁用从库

读写分离(数据分片+读写分离)可在数据源名称子节点中写入disabled:禁用从库数据源,删除disabled或节点:启用

 

注册中心

SPI:service provider interface 为被第三方实现或扩展的api:实现框架扩展或组件替换

zookeeper:

官方使用apache curator(zk的java/jvm客户端)做为zk实现方案

Etcd

官方使用原生etcd做为etcd实现方案

应用性能监控

APM:着眼于分布式系统性能诊断,调用链展示,应用拓扑分析

shardingsphere将sql解析与执行的数据分片最核心的相关信息发送至应用性能监控系统