SORT MERGE JOIN指各自访问两侧表的处理范围后逐一扫描排序结果,同时使用连接条件进行合并的方式。通过SORT MERGE JOIN引导调优的情况几乎不存在,但可能对减少RANDOM ACCESS、大容量处理对象集有效。以下将介绍SORT MERGE JOIN的其他特征以及能保证良好性能的情形。通常NESTED LOOP JOIN对待处理数据量较少的在线应用程序更为有效,因此请勿随意使用SORT MERGE JOIN。......
2023-11-01
调优时会遇到很多与索引相关的性能问题,因表和表之间的关系导致性能下降的情况也非常多。通过逻辑组合2个以上的表推导所需数据的方法即为连接。连接是非常有效的方法,但若错误地使用则会严重降低性能,因此应充分理解后再学习后面内容。
在本章节中,将重点放在这两点上来介绍连接。
(1)理解优化器根据连接条件确定连接表的顺序和方法的方式。
(2)理解响应速度根据连接方法和顺序造成工作量的不同而变化的情况。
1)连接和子查询的差别
(1)连接(JOIN):用户所需的数据在2个以上的表中时,通过连接各个表的特定列值相同的表来提取数据的方法。
(2)子查询(SUBQUERY):将当前数据与子查询结果数据进行比较,用于过滤所需对象(简而言之,查询语句中还有一个以上的查询语句)。
2)连接方法
(1)物理分类:NESTED LOOP JOIN; SORT MERGE JOIN; HASH JOIN; STAR JOIN。
(2)逻 辑 分 类 :NORMAL JOIN (EQUAL JOIN) ; OUTER JOIN; SEMI JOIN; ANTI JOIN; CARTESIAN JOIN。
对象表的连接顺序和方法不同是为了加快访问速度。因此即使变更连接方法和顺序,结果值也不能有任何变化。(www.chuimin.cn)
3)连接速度
连接速度与工作量(SCAN数)成反比,工作量根据连接顺序和方法变化。始终最先读取具备执行最少扫描条件的表。如果所有条件连接相同的表,会将FROM子句最右侧的表定为driving表[1],并将左侧定为驱动顺序。连接时表的驱动顺序是性能中的重要组成部分。
4)优化器的连接选择
对于参与连接条件语句的列,索引位置对优化器决定执行计划时的连接顺序和方法有很大影响。
(1)外部连接(OUTER JOIN):连接顺序按没有(+)的表到有(+)的表的顺序进行;否则,执行结果将不同。
(2)连接列只有一侧有索引时,连接顺序按没有索引的表到有索引的表的顺序进行;否则,连接时会出现 FULL SCAN,可能会导致过多的 I/O。
(3)连接列的两侧都有索引时,无法用连接条件判断连接顺序。因此,将剩余条件中具有最小化扫描范围条件的表用作driving表。在索引的同等条件下,unique、nonunique、单个索引、组合索引等也能成为比较对象。unique索引的驱动优先级高于nonunique,组合索引成为驱动表的优先级高于单个索引。如果在此步骤还是无法进行判断,优化器将从后(从最右侧开始)往前(向左侧)构成FROM子句的连接顺序。
(4)连接列的两侧均无索引时,将SORT MERGE JOIN或HASH JOIN用作连接方法。HASH JOIN是最小化SORT MERGE JOIN的I/O的算法。SORT MERGE JOIN在连接中表现性能最差,因此尽量引导为 HASH JOIN。
在连接的表中确定driving表时索引有无非常重要。但请勿混淆,这时不是指表中存在的索引,而是指WHERE子句中使用的列是不是索引。
有关数据库性能管理与调优的文章
SORT MERGE JOIN指各自访问两侧表的处理范围后逐一扫描排序结果,同时使用连接条件进行合并的方式。通过SORT MERGE JOIN引导调优的情况几乎不存在,但可能对减少RANDOM ACCESS、大容量处理对象集有效。以下将介绍SORT MERGE JOIN的其他特征以及能保证良好性能的情形。通常NESTED LOOP JOIN对待处理数据量较少的在线应用程序更为有效,因此请勿随意使用SORT MERGE JOIN。......
2023-11-01
通过持续的调优工作和监测可以找到运行中应用程序的最佳值。此时,UNIX内核的内存不易减少,需要有效地调优数据库内存区域,使用更少内存发挥相同水平的性能。如果内核内存使用约100 MB,并发用户为30名,每个Oracle进程的内存为 10 MB,假定 sort_area_size为 1MB,按以下公式计算出430 MB。100 MB+30×=430 MB因此,物理内存为1 GB的系统,可分配大约600 MB的SGA使用。......
2023-11-01
HASH JOIN是突出SORT MERGE JOIN优点并弥补其缺点的连接方法。该连接是对连接的对象表应用 HASH函数进行合并的方法。其特征是不仅只使用 HASH JOIN,而且提供通过并行处理大容量数据的最佳解决方案。但不建议在OLTP等状况下使用,因为HASH JOIN已为大容量处理进行优化,会占用大量系统资源。不会受JOIN条件(链路)索引有无的影响。2)使用标准由于链路使用HASH Key,因此仅用于EQUI-JOIN。在执行计划中成为HASHING对象的表始终在最前面,但如果是OUTER JOIN则完全相反。......
2023-11-01
实例已启动意味着数据库系统运行所需的后台进程已启动,并且处于“确保内存可用于数据处理”的状态,这种实例的调优将成为DBMS性能调优的重要基础。1) DBMS 内存 区域——SGASGA 是作为实例启动时确保控制器信息保存和数据处理空间的内存区域,存在于实例访问的所有进程共享的内存区域中。SGA相关调优的基准基本以命中率评价为主,通过适当地调整相关参数,将实际运行反映到评价结果中。......
2023-11-01
为根据不同情况使用适当的索引,要学习各种类型的索引。因为只有明确了解表和索引的概念才能轻松解决复杂的内容。创建索引抽屉时,应考虑偶有发生的损益分歧点,考虑是否创建。总体来说,索引是用户使用SQL语句查找时为提高查找速度而创建的对象。但若创建太多索引,购买新书或废弃时,会产生额外的维护费用。这是由于添加或删除书籍时应更新现有的索引抽屉。......
2023-11-01
1)例子(一)正确使用SQL的例子(一)如图5-12所示。因此B.ORDD = : TrDay或B.ORDD = : WorkDay的扫描范围较窄,使用索引时响应速度非常快。在这种情况下,优化器使用OR从内部分为两个SQL语句并各自使用索引,再将执行结果合并为一个结果。图5-13正确使用SQL的例子(二)问题:连接的两个表的条件中决定扫描范围的条件是"AND SUBSTR LIKE : IN_org_cd AND SUBSTR < 600000"。因此可按以下方法变更条件公式并使用相应索引。......
2023-11-01
在制定由优化器执行的SQL语句的执行计划过程中,提示为用户提供了可直接进行介入的方法。提示是用户对优化器下达的指示,但优化器可能会忽略不合理的提示。意味着除了RULE和DRIVING_SITE外的所有提示将选择CBO用作优化器。使用Orange Template Browser查看优化器提示如图2-8所示。图2-8Orange Template Browser查看优化器提示单击方框部分图标()、单击最顶端菜单的[View]—[Template Browser]或按快捷键 Alt+F2则会运行[Template Browser]。......
2023-11-01
统计信息中保存有列选择度、数据量等大量信息,因此基于规则的优化器可以更灵活地创建执行计划。extent是由相关联的数据块构成的逻辑单位。否则,会因表的random access造成表扫描的平均成本增高。排序操作成本并非用于访问对象数据的成本,而是用于排序已提取数据的成本。若使用以特定列为标准排序的索引提取数据时,可以减少额外的排序操作成本。要了解SQL语句实际应访问的对象范围程度才能计算实际成本,这是非常重要的概念。......
2023-11-01
相关推荐