面对问题

插入查询慢、且需要时效性比较强的情况

原因

MYSQL 容量上千万条以上就会很慢。

解决方法

分区

对应用透明,相对操作比较简单。

对主键有要求:所有主键里必须包含分区主键,如果又想用id查,又想用年份查就比较难。查询会受一些影响:批量查时快不了多少,插入可以提速。

分库

比如不同年份可以放在不同主机上,以加快速度。

分表

一般都使用分表策略。

需要看按什么分,比如按用户id分,或者按年份分表。

按时间分:热表 (当前一年数据)、冷表 (往年数据),最后一个年份的冷表可能看需要看是否保存最新数据。需要确定冷热表是否重叠,如果重叠。

如按年份分表,注意按业务时间而不是编辑时间 (这个时间可能变化)

迁移场景

需要定义迁移规则:比如每个月迁一次 (新表、本年表、前一年表),对时间字段建索引。

历史数据迁移:如果表巨大,则不使用查询,从第一条开始向其它表里分流;选改表,再改其上应用。

新表间迁移:假设每月迁一次,每月把这个月数据从热表里迁出来 (同样是分流);也可以双写,即每次写入冷表和热表,定期删热表最后的数据。

补采数据:在修修补补的情况下 (补采数据),又写可能更合适。

数据表结构修改:不分表时操作一次,分表后需要同一操作,执行多次。

  • 注意一:单批次迁移每次1000-10000条,不要太大。
  • 注意二:在复杂的场景下,双写最好。

注意事项

索引

对于在巨大表中可能查询的数据一定要建索引

表碎片清理

热表不断地写入删除,需要定期清理,方法如下:

$ alter table 表名 engine=innodb;