MySQL数据库服务器整体规划(思路与步骤)
参考资料:
http://blog.51cto.com/zhilight/1630611
我们在搭建MySQL数据库服务器的开始阶段就合理的规划,可以避免以后的很多问题的产生,大大节省我们的时间和精力,在一定幅度上降低成本。当然,这会涉及到多方面。比如机器的选型、业务评估和系统规划等。
所有的设计都是跟具体的需求相关的,我们首先要做的就是对业务进行整体评估。我在下面分享一个具体的例子。
一、业务需求
要求 | 指标 |
响应时间 | 查询和操作请求ms级别返回 |
数据总量 | 1年内大约有500G的数据量 |
每秒请求量 | 每秒有3W的请求量 |
读写比 | 读写比是1:1 |
重要程度 | 核心业务,P1级别故障 |
其他说明 | 数据具有时效性,历史数据访问减少,一般处理最近7天内的数据,数据总体长度约为1K |
二、业务评估
步骤 | 结果 | 说明 |
step1 | 1年内数据量大约500G | |
| 结果1 | 每秒产生的数据量为:500*1024*1024(365*24*60*60)=17KB |
step2 | 每秒3W次请求;读写比为1:1 | |
| 结果2 | 每秒的读请求为15000次;每秒的写请求是15000次。 |
step3 | 记录的长度大约为1KB | |
| 结果3 | 根据step1得出的结果,每秒insert的数据写入大约为17KB;根据step2得出的结果,每秒写入的请求为15000次,可得知14083(15000-17)次为update和delete操作之和。由于MySQL写入操作按照页来处理,页大小为16KB,假设每次操作的页都不相同,那么每秒写操作的数据量为16KB*15000=234MB。每秒读操作的数据量为16KB*15000=234MB。 |
step4 | 处理最近7天的数据 | |
| 结果 | 热数据量为:(500/365)*7=21GB |
step5 | 操作ms级别返回 | |
| 结果 | 操作ms级别返回,并且读写基本平衡。需要尽可能多的将数据加载到内存。按照内存命中率接近100%计算的话,那么innodb_buffer大约21G,而其他的则大约需要2-4G,因此按照30%的超配原则,操作系统内存大约需要32G(32.5G)。如果带宽也按照30%的超配原则的话,那么写带宽(wBPS)限制为304MB/s,读带宽(rBPS)限制为304MB/s。 |
三、硬盘选择
HDD类型的硬盘更善于处理一些顺序读写的内容,而SSD硬盘不管是顺序还是随机的性能都远远优于HDD的硬盘,但是SSD的硬盘价格必将昂贵。因此,我们可以通过合理的分配,降低整体拥有的成本。
例如,对于一些日志文件,这些日志文件主要是顺序IO,我们把这些文件放到HDD上,可以考虑使用RAID5S级别,提高日志系统的容错能力。对于数据文件,我们可以考虑放到SSD上,使用RAID10提高容错能力。
四、机型测试
性能对比测试:对于不同硬件设备在压力测试下数据库表现性能指标。对于硬件性能做出整体的评估。
稳定性测试:没有抖动现象,可以持续稳定的提供服务。
掉电保护测试:这个环节最好需要系统工程师配合。
内存异常测试:测试内存是否容易出现问题,能否对业务提供稳定的支持。
此外,还有IO设备和坏盘重构。
经过一系列的测试,我们可以选出2~3中候选机型,我们应当尽量避免应用和设备绑定,防止单个机型缺货,供应不足影响业务。
五、成本评估
通过前面的一些列的准备工作,我们可以选出候选的机型,考虑我们的使用成本。这包括:
设备成本
运维成本
功耗成本
特别注意:我们虽然有的时候单机使用成本会上升,但是整体的使用成本却下降了。这是因为我们提升了单个机器的性能,可以减少机器的数目。降低运维和功耗的成本,甚至也降低了整体设备的成本。
六、文件系统规划
MySQL数据库的特点:
(1) 单数据目录(单个实例不能执行多个数据库)
(2) 混合读写(日志和数据的读写方式是不一样的)
(3) 请求随机
文件系统划分:
/dev/sda1 /boot
/dev/sda2 /
/dev/sda3 /home
/dev/sda4 /tmp
/dev/sdb1 /data
/dev/sdc1 /log
根据使用经验,建议IO调度策略为deadline的方式:
echo deadline > /sys/block/sd{b,c}/queue/scheduler
MySQL数据库日志文件是顺序读写的,建议放在普通的SSD硬盘上。
-- binlog日志文件、error日志文件、slow日志文件可以放在/log日志目录中
-- tmp文件指定为系统的目录/tmp
-- 其他所有的目录指定为数据目录/data
注意:虽然日志文件是随机读写的,但是由于把几个日志文件都放在一个分区,还是可能产生随机读写的现象。
七、其他实例
业务评估需求 指标
相应时间 查询和操作要求ms级别返回
数据总量 1年内大约1T数据
美妙请求量 大约1W次请求
读写比 读写比例 4:1
重要程度 核心系统,p1级别故障,
其他说明 数据具有时效性,历史数据访问较少,一般会处理最近15天内的数据,数据记录总长度大约有1kb
一年产生的数据为1T,每秒产生的数据为
1T*1024*1024*1024/(365*24*3600)=34kB/s
每秒一万次请求 读写比里4:1(qps) 读请求的比较为8000 写请求(tqs) 2000
然后一条数据插入大约有1kb,每秒就应该是34次插入(insert),然后update delete应该该是就是1966次。然后数据库的操作是按照页来处理,页的大小为16KB,假设每次操作的页都是不相同的,那么每 秒要操作16kB×2000=32M/s 每秒的读操作应该是128MB/s。
是一个具有时效性的数据,处理近15天的数据,那么需要就需要1T/365*15=42G。
要求毫秒级返回 需要尽可能的把数据加载到内存中 那么innodb buffer 至少42G,其他大约需要3G。
按照30%的超配原则:内存大约需要60G内存,标准为64G内存的机器;写带宽因该约等于40MB/s(wbps); 读带宽(rbps)应该是166MB/s。