【优化案例】一次笛卡尔乘积的优化

发表: 2015-10-10 浏览: 4204

性能优化

今天一个网友妹子发来一段SQL说执行非常慢，让我看下，其实问题很简单，2分钟搞定，我们平时也会经常遇到，SQL及执行计划如下

--跑了7分钟

SELECT T.*, A.*, B.LOGIN_ID, B.USER_NAME

  FROM MID.T_RPT_RES_PRO_PRE_ALL_LISTTEMP T,

       KPICODE.ODS_CB_ORGAN_GRID_ALL_MV A,

       KPI.PURE_USER B

 WHERE T.FIVE_LEVEL_OWN = B.LOGIN_ID

   AND B.USER_ORG = A.LEVEL_ID;

   

SELECT COUNT(1) FROM MID.T_RPT_RES_PRO_PRE_ALL_LISTTEMP T; --4733

SELECT COUNT(1) FROM KPICODE.ODS_CB_ORGAN_GRID_ALL_MV A; --16719

SELECT COUNT(1) FROM KPI.PURE_USER B; --26497

执行计划

----------------------------------------------------------

Plan hash value: 2012136974

--------------------------------------------------------------------------------

-------------------------------

| Id | Operation | Name | Rows |

Bytes | Cost (%CPU)| Time |

--------------------------------------------------------------------------------

-------------------------------

| 0 | SELECT STATEMENT | | 1 |

 1259 | 144 (1)| 00:00:02 |

| 1 | NESTED LOOPS | | 1 |

 1259 | 144 (1)| 00:00:02 |

| 2 | MERGE JOIN CARTESIAN | | 1 |

 1236 | 144 (1)| 00:00:02 |

| 3 | TABLE ACCESS FULL | T_RPT_RES_PRO_PRE_ALL_LISTTEMP | 1 |

 1138 | 2 (0)| 00:00:01 |

| 4 | BUFFER SORT | | 16690 |

 1597K| 142 (1)| 00:00:02 |

| 5 | MAT_VIEW ACCESS FULL | ODS_CB_ORGAN_GRID_ALL_MV | 16690 |

 1597K| 142 (1)| 00:00:02 |

|* 6 | TABLE ACCESS BY INDEX ROWID| PURE_USER | 1 |

   23 | 0 (0)| 00:00:01 |

|* 7 | INDEX UNIQUE SCAN | UK_PURE_USER_LOGIN_ID | 1 |

      | 0 (0)| 00:00:01 |

--------------------------------------------------------------------------------

-------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   6 - filter("B"."USER_ORG"="A"."LEVEL_ID")

   7 - access("T"."FIVE_LEVEL_OWN"="B"."LOGIN_ID")

统计信息

----------------------------------------------------------

          1 recursive calls

          0 db block gets

  177858134 consistent gets

          0 physical reads

          0 redo size

    1436253 bytes sent via SQL*Net to client

       2157 bytes received via SQL*Net from client

        276 SQL*Net roundtrips to/from client

          1 sorts (memory)

          0 sorts (disk)

       4125 rows processed

可以看到2个表和一个物化视图关联，数据量都不大（几万条数据），却执行了7分钟，1.7亿的逻辑读！！

看下执行计划，ID=2的MERGE JOIN CARTESIAN，

看到这个就基本明白怎么回事了，MERGE JOIN CARTESIAN是笛卡尔乘积的意思，这样的一个SQL里为什么会出现笛卡尔积呢？

看下where条件

  FROM MID.T_RPT_RES_PRO_PRE_ALL_LISTTEMP T,

       KPICODE.ODS_CB_ORGAN_GRID_ALL_MV   A,

       KPI.PURE_USER                      B

 WHERE T.FIVE_LEVEL_OWN = B.LOGIN_ID

   AND B.USER_ORG = A.LEVEL_ID;

3表关联T和B关联，然后B和A关联，没有漏关联条件，而走了笛卡尔积。我们可以看到是T表和A表做了笛卡尔积，再跟B表做了NL

然而关联条件确实T和B关联 B和A关联，T和A并没有直接的关联关系，

所以可以看出这里CBO错误的评估让T和A没有关联关系的表先做了关联，当然产生了笛卡尔积，想解决这个问题也很简单，

加hint让执行计划按照我想要的路径走，use_hash(T,B,A)即可，改后秒出数据。

止于为什么Oracle会选择走这样的执行计划，可以说是Oracle的一个BUG，错误的评估导致了没有关联的表关联了起来。

有人说在10gR2版本此bug已经修复，但是仍旧经常出现这个问题，所以大家如果遇到此问题可以直接指定执行路径即可。

还有人说可以直接修改当前session禁用笛卡尔积，使用/*+ OPT_PARAM('_optimizer_mjc_enabled','false') */，于是我也让妹子试了试发现依旧很慢，

我看了下执行计划，执行计划中虽然去掉了笛卡尔积，但路径没有改变，依旧是T和A先关联，不过使用的是NL关联。所以依旧很慢