我是一个SQL新手,我正在尝试在DB2中编写一个查询。但是我认为这是相当低效的,因为它需要更多的资源。如果有人能提供任何建议,可以使下面的查询更有效,我将非常感激。我知道这将需要知道实际的需求/系统知识,以提供更好的建议,但在第一次看,如果你们认为什么是混乱的,请告诉我。2先谢了。
干杯DK
SELECT LIF.EMPID, LIF.BPA_NR , YEAR(LIF.BEG_DTE) ,MONTH(LIF.BEG_DTE) ,LIF.TFIDZ
, LVA.TRFIDZ, UZA.TRFIDZ, YEAR(LIF.BEG_DTE) - YEAR(KAR.DOB)
, ((YEAR(APK.TERMDT) - YEAR(APK.BEGDAT)) * 12 + MONTH(APK.TERMDT) - MONTH(APK.BEGDAT))
, KAR.DTHSUM, LVA.LVAGELD, UZA.UZAGELD, APK.EMIRKA
, LVA.EMILVA, UZA.EMIUZA , APK.EPROM, LVA.EPROM, UZA.EPROM
, LIF.LOANNR ,LIF.SUMAMT , MONTH(JOU.ZDATE), YEAR(JOU.ZDATE)
, (YEAR(JOU.ZDATE) - YEAR(APK.BEGDAT))*12 + MONTH(JOU.ZDATE) - MONTH(APK.BEGDAT)
, COALESCE(JOU.TYP,'OTH') , COALESCE(PRO1.BOOKEMI,0)
, COALESCE(PRO2.BOOKEMI,0),COALESCE(PRO3.BOOKEMI,0)
FROM DEVDBA.LIFE LIF
LEFT OUTER JOIN (
SELECT ( CASE WHEN JU6.REASN = 'AAA'
AND NOT EXISTS (
SELECT 1 FROM DEVDBA.LOGTBL JU7
WHERE JU7.EMPID=JU6.EMPID
AND JU7.GANID>JU6.GANID
AND JU7.ZDATE=JU6.ZDATE
AND JU7.REASN='BBB'
) THEN 'KRE'
WHEN JU6.REASN IN ('EEE','DDD')
THEN 'SON'
ELSE 'OTH'
END) AS TYP
, JU6.EMPID, JU6.REASN, JU6.ZDATE, JU6.GANID
FROM DEVDBA.LOGTBL JU6
WHERE JU6.REASN IN ('AAA','EEE','DDD')
) JOU
ON LIF.EMPID = JOU.EMPID
AND LIF.ZUNID = JOU.GANID
LEFT OUTER JOIN DEVDBA.LVAGR LVA
ON JOU.EMPID = LVA.EMPID
AND JOU.GANID = LVA.ZUNID
LEFT OUTER JOIN DEVDBA.UZAGR UZA
ON JOU.EMPID = UZA.EMPID
AND JOU.GANID = UZA.ZUNID
LEFT OUTER JOIN DEVDBA.APKGR APK
ON JOU.EMPID = APK.EMPID
AND JOU.GANID = APK.ZUNID
LEFT OUTER JOIN DEVDBA.KARGR KAR
ON JOU.EMPID = KAR.EMPID
AND JOU.GANID = KAR.ZUNID
LEFT OUTER JOIN (
SELECT PR1.EMPID, PR1.GANID, PR1.BOOKEMI
FROM DEVDBA.COMMS PR1, DEVDBA.LOGTBL JU1
WHERE PR1.PROVART IN ('789')
AND PR1.EMPID = JU1.EMPID
AND PR1.GANID = JU1.GANID
) PRO1
ON JOU.EMPID = PRO1.EMPID
AND JOU.GANID = PRO1.GANID
LEFT OUTER JOIN (
SELECT PR3.EMPID, PR3.GANID, PR3.BOOKEMI
FROM DEVDBA.COMMS PR3, DEVDBA.LOGTBL JU3
WHERE PR3.PROVART IN ('123')
AND PR3.EMPID = JU3.EMPID
AND PR3.GANID = JU3.GANID
) PRO2
ON JOU.EMPID = PRO2.EMPID
AND JOU.GANID = PRO2.GANID
LEFT OUTER JOIN (
SELECT PR5.EMPID, PR5.GANID, PR5.BOOKEMI
FROM DEVDBA.COMMS PR5, DEVDBA.LOGTBL JU5
WHERE PR5.PROVART IN ('456')
AND PR5.EMPID = JU5.EMPID
AND PR5.GANID = JU5.GANID
) PRO3
ON JOU.EMPID = PRO3.EMPID
AND JOU.GANID = PRO3.GANID
WHERE LIF.BPA_NR IN ('001','002')
AND JOU.TYP <> 'OTH'
AND LIF.BEG_DTE BETWEEN '01.01.2022' AND '31.12.2099'
ORDER BY LIF.BPA_NR,LIF.EMPID WITH UR;
1条答案
按热度按时间7jmck4yq1#
不是一个答案本身,但它是一个评论,所以我会在这里添加它无论如何。
如果不知道更多的细节,很难说太多。你应该从访问计划开始。我发现db2caem非常好,因为它同时输出每个操作符的估计基数和实际基数。如果一个操作符有很大的不同,它通常是一个提示,告诉你从哪里开始调查。
db2 advis可以给予你一些关于缺少索引的提示,但是不要想当然,它经常建议冗余的索引,所以你必须研究它建议的内容。如果你没有访问db2 advis的权限,你可能想尝试一下:
Index Advisor
这是一个python脚本,它生成与db2 advis相同的索引候选集,然后评估索引组合的幂集及其估计的改进,并挑选最佳的1-index、2-index、...、n-index组合。幂集的基数增长很快,因此可以为要调查的索引组合设置下限和上限。使用风险自担
关于代码本身的一些观察。在过去,我看到过混合“逗号”连接和ansi连接时优化器中的一些神秘效果。我建议您替换如下结构:
与:
您似乎在PRO 1、PRO2和PRO3中重复了相同的联接:
您可能需要研究是否可以将其重新表述为:
然后在select中对PROVART使用case表达式来跟踪结果的来源
有时,使用LATERAL将连接 predicate 手动推入派生表中也会有所帮助
只是一些想法。