上面文章已经写得很通俗,也很好理解。现在是通过上面的文章结合自己的理解稍微整理下。
一、Oracle的执行计划
执行计划是一条查询语句在Oracle中的执行过程或访问路径的描述
二、Oracle执行计划显示项设置:
工具 —> 首选项 —> 窗口类型 —> 计划窗口 —> 根据需要配置要显示在执行计划中的列,如下图
执行计划常用列:
基数(Rows):Oracle估计的当前操作的返回结果集行数
字节(Bytes):执行该步骤后返回的字节数
耗费(COST)、CPU耗费:Oracle估计的该步骤的执行成本,用于说明SQL执行的代价,理论上越小越好(该值可能与实际有出入)
时间(Time):Oracle估计的当前操作所需的时间
三、实例分析:
F5
解析执行计划:
1、顺序:
根据Operation缩进来判断,缩进最多的最先执行;
同一级如果某个动作没有子ID就最先执行;同一级的动作执行时遵循最上最右先执行的原则)
I、上图中 INDEX RANGE SCAN 和 INDEX UNIQUE SCAN 两个动作缩进最多,最上面的 INDEX RANGE SCAN 先执行;
II、上图中 TABLE ACCESS BY GLOBAL INDEX ROWID 和 TABLE ACCESS BY INDEX ROWID 两个动作缩进都在同一级,则位于上面的 TABLE ACCESS BY GLOBAL INDEX ROWID 这个动作先执行;这个动作又包含一个子动作 INDEX RANGE SCAN,则位于右边的子动作 INDEX RANGE SCAN 先执行;
III、INDEX RANGE SCAN —> TABLE ACCESS BY GLOBAL INDEX ROWID —> INDEX UNIQUE SCAN —> TABLE ACCESS BY INDEX ROWID —> NESTED LOOPS OUTER —> SORT GROUP BY —> SELECT STATEMENT, GOAL = ALL_ROWS
2、动作:
I、上图中 TABLE ACCESS BY GLOBAL INDEX ROWID(INDEX ROWID)指动作表访问(或者说Oracle访问数据)的方式。
访问方式分类:
● TABLE ACCESS FULL(全表扫描)
数据量太大的表不建议使用全表扫描
- ● TABLE ACCESS BY INDEX SCAN(索引扫描)
- 在索引块中,既存储每个索引的键值,也存储具有该键值的行的ROWID。索引扫描其实分为两步:
- Ⅰ:扫描索引得到对应的ROWID; Ⅱ:通过ROWID定位到具体的行读取数据。
索引扫描分类:
UNIQUE
唯一性索引(UNIQUE INDEX)的扫描,每次至多只返回一条记录,表中某字段存在 UNIQUE、PRIMARY KEY 约束时,Oracle常实现唯一性扫描。
RANGE
使用一个索引存取多行数据,发生索引范围扫描的三种情况:
在唯一索引列上使用了范围操作符(如:> < <> >= <= between)
在组合索引上,只使用部分列进行查询(查询时必须包含前导列,否则会走全表扫描)
对非唯一索引列上进行的任何查询
FULL SCAN(索引全扫描)
进行全索引扫描时,查询出的数据都必须从索引中可以直接得到(注意全索引扫描只有在CBO(基于代价的优化器)模式下才有效)
FAST FULL
扫描索引中的所有的数据块,与 INDEX FULL SCAN 类似,但是一个显著的区别是它不对查询出的数据进行排序(即数据不是以排序顺序被返回)
SKIP
触发索引跳跃扫描情景:表有一个复合索引,且在查询时有除了前导列(索引中第一列)外的其他列作为条件,并且优化器模式为CBO时,当Oracle发现前导列的唯一值个数很少时,会将每个唯一值都作为常规扫描的入口,在此基础上做一次查找,最后合并这些查询。
实例:假设表emp有ename(雇员名称)、job(职位名)、sex(性别)三个字段,并且建立了如 create index idx_emp on emp (sex, ename, job) 的复合索引;
因为性别只有 '男' 和 '女' 两个值,所以为了提高索引的利用率,Oracle可将这个复合索引拆成 ('男', ename, job),('女', ename, job) 这两个复合索引;当查询 select * from emp
where job = 'Programmer' 时,该查询发出后:Oracle先进入sex为'男'的入口,这时候使用到了 ('男', ename, job) 这条复合索引,查找 job = 'Programmer' 的条目;再进入sex
为'女'的入口,这时候使用到了 ('女', ename, job) 这条复合索引,查找 job = 'Programmer' 的条目;
II、NESTED LOOPS 。。。 指表的连接方式。
连接方式
● SORT MERGE JOIN(排序-合并连接)
JOIN 关键字用于将两张表作连接,一次只能连接两张表,JOIN 操作的各步骤一般是串行的(在读取做连接的两张表的数据时可以并行读取),表(row source)
之间的连接顺序对于查询效率有很大的影响,对首先存取的表(驱动表)先应用某些限制条件(Where过滤条件)以得到一个较小的row source,可以使得连接效率提高。
驱动表(Driving Table)与匹配表(Probed Table)
驱动表(Driving Table):表连接时首先存取的表,又称外层表(Outer Table),这个概念用于 NESTED LOOPS(嵌套循环) 与 HASH JOIN(哈希连接)
中,如果驱动表返回较多的行数据,则对所有的后续操作有负面影响,故一般选择小表(应用Where限制条件后返回较少行数的表)作为驱动表。
匹配表(Probed Table):又称为内层表(Inner Table),从驱动表获取一行具体数据后,会到该表中寻找符合连接条件的行。故该表一般为大表(应用Where
限制条件后返回较多行数的表)。
排序-合并连接适用的连接条件有: < <= = > >= ,不适用的连接条件有: <> like
通俗讲:使用join关键字时,为提高sql的执行效率,驱动表优先选择数据较小或者Where条件返回行数较少的表。
● NESTED LOOPS(嵌套循环)
嵌套循环连接有一个其他连接方式没有的好处是:可以先返回已经连接的行,而不必等所有的连接操作处理完才返回数据,这样可以实现快速响应。应尽可能使用限
制条件(Where过滤条件)使驱动表(row source 1)返回的行数尽可能少,同时在匹配表(row source 2)的连接操作关联列上建立唯一索引(UNIQUE INDEX)或是选择性较好
的非唯一索引,此时嵌套循环连接的执行效率会变得很高。
● HASH JOIN(哈希连接)
哈希连接只适用于等值连接(即连接条件为 = )
● CARTESIAN PRODUCT(笛卡尔积)(待更新)
III、图上… OUTER 是指表连接类型;
连接类型:
● INNER JOIN(内连接)
只返回两表中相匹配的记录
● 等值连接(连接条件为 = )
● 非等值连接(连接条件为 非 = ,如 > >= < <= 等)
● OUTER JOIN(外连接)
● LEFT OUTER JOIN(可简写为 LEFT JOIN,左外连接)
返回的结果不仅包含符合连接条件的记录,还包含左边表中的全部记录。(若返回的左表中某行记录在右表中没有匹配项,则右表中的返回列均为空值)
● RIGHT OUTER JOIN( RIGHT JOIN,右外连接)
返回的结果不仅包含符合连接条件的记录,还包含右边表中的全部记录。(若返回的右表中某行记录在左表中没有匹配项,则左表中的返回列均为空值)
● FULL OUTER JOIN( FULL JOIN,全外连接)
返回左右两表的全部记录。(左右两边不匹配的项都以空值代替)