范式和反范式
  1. 范式和反范式是库表设计过程中的概念
  2. 目前关系数据库有六种范式,越高的范式数据库冗余越小
  3. 范式化可以较少冗余,从而减少了在更新数据时一致性方面的开销
  4. 反范式化由于冗余的数据,在复杂的查询场景下,可以避免联合查询和子查询,提高查询的效率
  5. 根据业务场景,选择合适的范式等级进行库表设计,是日常运维中的第一步
查询优化
  1. 使用索引
  • 索引的使用,遵循最左前缀原则
  • 使用覆盖索引,可以减少反表操作,大大提高效率,order/group by 也可以使用覆盖索引
  • varchar 等字符串类型,可以使用前缀索引提高查询效率
  • like 匹配也遵循最左前缀原则,例如 ‘aaa%’ 格式才能使用索引
  • NULL 类型对索引不友好,字段默认应该设置为 NOT NULL
  • where 字句里面,如果字段标识符使用了函数运算,会导致该字段无法使用索引
  • 避免冗余和重复索引
  1. 多表查询的类型
  • 子查询(exist/in)
  • 内连接(inner join)
  • 外连接(left/right/full join)
  1. 多表查询中的驱动表和被驱动表
情况1: select * from (select id,name from t1 where t1.type=3) as t3, t2 where t2.name = t3.name and t2.age>20;
情况2: select * t1 left join t2 on t1.name=t2.name where t2.age>20 and t1.type=3;
情况3: select * from t1 where t1.tape=3 and t1.name in (select t2.name from t2 where t2.age>20)
上述三种情况中,t1 是驱动表,t2 是被驱动表,查询的步骤是:
    1. 根据筛选条件,获取 t1 表相关的结果集
    2. 使用 t1 中的关联字段,去遍历 t2 表
  1. 多表查询的优化原则
  • 情况 3 中子查询是用不到索引的,优化方式是改为情况 1 的写法,利用联合查询提高效率
  • 小表驱动大表,指的是驱动表要尽量走索引,使结果集尽量小,上面三种情况中要求 t1.type 必须有索引,并且过滤度要高
  • 连接字段索引,被驱动表上的关联字段必须有索引,上面三种情况中要求 t2.name 必须有索引
  1. 可以使用 show profile 查看查询执行时在每个阶段的开销
  2. 可以使用 explain 查看查询的执行路径
  3. 可以使用 hint 强制使用某个索引或者不适用索引
其他优化
  • delete 清理过期数据一定要使用 limit 分片,否则可能导致
  • 锁住很多数据
  • 占满整个事务日志
  • 耗尽系统资源
  • 阻塞重要查询
    -DELETE FROM messages WHERE created < DATE_SUB(NOW(),INTERVAL 3 MONTH) LIMIT 10000;
  • 使用 truncate 清理所有数据的操作可以用下列操作代替,从而做到“灰度”、“可回滚”
  • create table_name_tmp like table_name;
  • rename table_name to test.dbname_tablename_time;
  • rename table_name_tmp to table_name;
  • online ddl, 不锁表的 dd
  • 通过新建一个镜像表,在新表上做 ddl
  • 做 ddl 过程中使用触发器复制数据
  • 最后后,在业务低峰期,使用rename替换掉原来的表
  • 核心思想是,空间换取时间
  • optimize table 优化表空间
  • delete 数据并不会释放表空间
  • 某些表经过长时间的积累,会导致大量的空间浪费
运行状态
  • 查看当前工作线程 show [full] processlist;
  • 全局状态查询 show status;,常用的参考状态如下:
Aborted_clients 由于客户没有正确关闭连接已经死掉,已经放弃的连接数量。 
Aborted_connects 尝试已经失败的MySQL服务器的连接的次数。 
Connections 试图连接MySQL服务器的次数。 
Created_tmp_tables 当执行语句时,已经被创造了的隐含临时表的数量。 
Delayed_insert_threads 正在使用的延迟插入处理器线程的数量。 
Delayed_writes 用INSERT DELAYED写入的行数。 
Delayed_errors 用INSERT DELAYED写入的发生某些错误(可能重复键值)的行数。 
Flush_commands 执行FLUSH命令的次数。 
Handler_delete 请求从一张表中删除行的次数。 
Handler_read_first 请求读入表中第一行的次数。 
Handler_read_key 请求数字基于键读行。 
Handler_read_next 请求读入基于一个键的一行的次数。 
Handler_read_rnd 请求读入基于一个固定位置的一行的次数。 
Handler_update 请求更新表中一行的次数。 
Handler_write 请求向表中插入一行的次数。 
Key_blocks_used 用于关键字缓存的块的数量。 
Key_read_requests 请求从缓存读入一个键值的次数。 
Key_reads 从磁盘物理读入一个键值的次数。 
Key_write_requests 请求将一个关键字块写入缓存次数。 
Key_writes 将一个键值块物理写入磁盘的次数。 
Max_used_connections 同时使用的连接的最大数目。 
Not_flushed_key_blocks 在键缓存中已经改变但是还没被清空到磁盘上的键块。 
Not_flushed_delayed_rows 在INSERT DELAY队列中等待写入的行的数量。 
Open_tables 打开表的数量。 
Open_files 打开文件的数量。 
Open_streams 打开流的数量(主要用于日志记载) 
Opened_tables 已经打开的表的数量。 
Questions 发往服务器的查询的数量。 
Slow_queries 要花超过long_query_time时间的查询数量。 
Threads_connected 当前打开的连接的数量。 
Threads_running 不在睡眠的线程数量。 
Uptime 服务器工作了多少秒。
  • 终止某个线程 kill thread_id;,使用场景有
  • 终止死锁事务
  • 终止慢 SQL
  • 终止长事务导致的长时间锁表
常用日志
  • 错误日志,对应参数log_error,错误日志记录着mysqld启动和停止,以及服务器在运行过程中发生的错误的相关信息。
  • 慢查询日志,相关参数log_slow_queries,记录查询时间大于 long_query_time 设定时间的查询
  • 普通查询日志,对应参数log_output,记录所有查询语句
  • 二进制日志(binlog),相关参数sync_binlog,记录数据的变化
变更守则
  1. 有验证方案,分批次,灰度发布
  2. 发布过程有日志,可监控
  3. 有回滚方案
  4. 选择业务低峰期发布
其他
  • 操作数据时,各个环节的字符集最好保持一致,否则容易出现乱码
  • 数据库访问时 SESSION 的字符集character_set_client/character_set_connection
  • MySQL SERVER 默认字符集character_set_server
  • 数据库的默认字符集create database db_name character set utf8mb4;
  • 数据表的默认字符集
  • 操作系统字符集
  • SSH 客户端字符集
  • mysqldump 时使用 binary 类型或者 utf8mb4 类型,可以兼容所有字符集
  • 操作系统时间和数据库默认时区最好保持一致,否则now()函数容易发生问题