1、数据库的索引可大大提升查询速度,目前主要使用MyIASM引擎,当查询大量数据并且有联合查询或其它的约束条件时,查询的时间将会非常长。假设数据库中一个表有106条记录,DBMS的页面大小为4K,并存储100条记录。如果没有索引,查询将对整个表进行扫描,最坏的情况下,如果所有数据页都不在内存,需要读取104个页面,如果这104个页面在磁盘上随机分布,需要进行104次I/O,假设磁盘每次I/O时间为10ms(忽略数据传输时间),则总共需要100s(但实际上要好很多很多)。如果对之建立B-Tree索引,则只需要进行log100(106)=3次页面读取,最坏情况下耗时30ms。
2、硬盘是块设备,一般块的大小从0.5k到4k,即便读取1字节的数据,也要一整块读取。要减少从硬盘中读取的时间,就是要减少读取的次数与寻道的时间
3、B树是一个m阶平衡多叉树,它与二叉查找树的区别在于他的高度很低,分支很多,高度低主要是面向外存这一类IO,高度越低,每次搜索需要的IO次数就大幅降低,达到log级的搜索时间
4、B树的插入
步骤:
1、插入一个元素时,首先在B树中是否存在,如果不存在,即比较大小寻找插入位置,在叶子结点处结束,然后在叶子结点中插入该新的元素
2、如果叶子结点空间足够,这里需要向右移动该叶子结点中大于新插入关键字的元素,如果空间满了以致没有足够的空间去添加新的元素,则将该结点进行“分裂”,将一半数量的关键字元素分裂到新的其相邻右结点中,中间关键字元素上移到父结点中(当然,如果父结点空间满了,也同样需要“分裂”操作)
3、当结点中关键元素向右移动了,相关的指针也需要向右移。如果在根结点插入新元素,空间满了,则进行分裂操作,这样原来的根结点中的中间关键字元素向上移动到新的根结点中,因此导致树的高度增加一层