--删除的数据量为2万条
--table1 数据量为百万级,table2为时间窗 仅一条记录
DELETE /*+ BYPASS_UJVC*/
FROM (SELECT
A.*
FROM table1 A, table2 B
WHERE A.INSERTDATE >= B.ETLNOWSTATDATE
AND A.INSERTDATE <= B.ETLLASTENDDATE) ;
--执行0.01sdelete from table1 a
where a.INSERTDATE >= (select b.statdate from table2 b)
and a.INSERTDATE <= (select b.enddate from table2 b)
--执行90s如上,执行的时间差距非常大。
但是第一中删除的方法,不能确定删除的是A表还是B表。
在我自己测试的时候,有时候只删除A表,有时候俩个表的数据都被删除了。
delete from table1 a where exists(select 1 from table2 B where A.INSERTDATE >= B.ETLNOWSTATDATE AND A.INSERTDATE <= B.ETLLASTENDDATE)
--对于你第一种方法,我测试了一下
--删除起作用的是右面的表,这种写法删除的是 B表
DELETE /*+ BYPASS_UJVC*/
FROM (SELECT
A.*
FROM table1 A, table2 B
WHERE A.INSERTDATE >= B.ETLNOWSTATDATE
AND A.INSERTDATE <= B.ETLLASTENDDATE) ;--把A和B调换位置,删除的是A表
--没有测试出来两个表数据全部被删除的情况
然后以为就是这样的原理,但是我将它放到etl工具中去调用执行的时候,AB俩张表的记录都被删除了。
我表示,不淡定了。
存储过程封装,让etl 调用存储过程。
如果你担心删除掉B表的数据,在B表上加个触发器,不让ETL删除就是了。
--table1 数据量为百万级,table2为时间窗 仅一条记录
今儿又找了一个环境,在plsql中进行了测试。
测试结果如下:
DELETE /*+ BYPASS_UJVC*/
FROM (SELECT
A.*
FROM table1 A, table2 B
WHERE A.INSERTDATE >= B.ETLNOWSTATDATE
AND A.INSERTDATE <= B.ETLLASTENDDATE) ;
--第一种删除方式,删除AB俩张表的记录;
--~~~~~~~~~~~~~~~~~~~~~~~
DELETE /*+ BYPASS_UJVC*/
FROM (SELECT
A.*
FROM table2 B, table1 A
WHERE A.INSERTDATE >= B.ETLNOWSTATDATE
AND A.INSERTDATE <= B.ETLLASTENDDATE) ;
--调换AB的顺序,只删除了达标A表的记录。