内存
跑程序的地方。
是磁盘存储和CPU之间的一座缓冲区桥梁。现代的PC,内存的大小在一定场景下可以决定计算机的整体能力。
在32位系统中,1.5G的heap区域是比较合适的,因为JVM除了需要这部分空间,还需要很多其他空间,需要为这些开销预留。
随机读写与顺序读写
磁盘每次发生读写操作都要先寻找位置,如果频繁发生磁盘小IO请求,就会频繁寻找位置,即随机读写。
顺序读写是相对于随机读写的,每次读写数据比较大(对于过大的数据块读写,也会拆解为多个小IO进行读写)。简单说,如果找到了位置,那么处理1MB和处理4KB的数据时间是差不多的。
磁盘IO
加载程序也需要从磁盘读取,但是程序占空间小。更多的是对数据的读写,数据读写就是IO——机械硬盘与内存的通信。许多硬件架构的信息还要经过南桥和北桥,传送过程中,通信带宽被大大降低。
更致命的是IOPS,因为机械硬盘读取需要找到磁道,在此之前的时间都是延迟时间,该延迟时间是ms级别的,而内存是ns级别的,差距明显。
常见的磁盘操作,有写日志,再者通过网络IO让数据库访问磁盘。
日志的写工具一般会将日志替换为Buffer的append方式,将日志写入一个缓冲区,由专门程序来实现日志的写操作,或者写的时候发现缓冲区已满,本次写入磁盘。这样一次写入多条数据,每次写入量增大,随机IO变为顺序IO(多次磁盘寻道寻址尽量降为一次)。
Buffer的大小也不能太大,过大的Buffer一次写入磁盘也不是一次性写入的,而且Buffer过大会占据JVM空间,长期占有就会占用Old区空间,导致FullGC。
缓存
只要有接近,就可以理解为缓存。目的都是提高性能和效率,方法都是“就近原则”——使用的数据所在的位置更近一些,延迟就更小一些。
形式多种多样,有CPU的三级缓存结构,有操作系统的OSCache,有数据库的缓存Hibernate或者iBatis,也有memcached和redis这种的分布式缓存。只要通过一定手段使得访问利用率达到要求,都可以理解为缓存。
缓存适用于读多写少的场景,如果写多,每次都要写两遍,可能比直接访问数据库还要慢。读写比例一般差几倍,十几倍或者几十倍。
缓存可以支撑的qps更高的原因,是因为它是基于K-V的,剥离了数据库原本的一些复杂的一致性概念,而且大部分是在内存中完成的,通常就处理简单的存取操作。
如果缓存的命中率打到95%左右说明比较成功的利用了缓存。相反,如果命中率很低,那么可以考虑放弃使用缓存。