数据量总共70万条..使用csv文件导入到数据库里面,重复的数据就保持不变,若数据库里有,但是文件里没有的数据要删掉,我用  not in 做的,但是这样做据说是数据库会麻痹掉... 有没有什么办法能查出数据库里的多余数据?

解决方案 »

  1.   

    可以将CSV导入到临时表里,然后用MERGE INTO将原表数据和临时表的数据比较,相同留下,不同删除
    这样效率提高了.,就是觉得70W的记录导入到临时表的速度不知道怎样
      

  2.   

    临时表。
    其实最好就是用ETL工具来解决这些问题。。
      

  3.   

    用sqlldr导入到中间表,然后使用minus将目标表中不存在的数据删掉。