我的一个表结构是 id,url,html,content.
数据量有60万,其中url出现了2万多的重复,我想把重复的url去掉,但是数据量太大,大家有什么好的办法么

解决方案 »

  1.   

    delete a from tt a inner join
    (select utl from tt group by url having count(*)>=2) b
    on a.url=b.url
      

  2.   

    掌柜的,你写的这个sql,感觉有点复杂,在速度上如何呢
      

  3.   

    DELETE A
    FROM tb AS A
        JOIN (SELECT URL,MIN(id) AS id 
              FROM tb AS T
              GROUP BY URL
              HAVING COUNT(DISTINCT URL) > 1) AS B
    ON A.URL = B.URL AND A.id > B.id;
      

  4.   

    呵呵,你要删除重复的ID,只能这样,其实不复杂,在URL上建立索引试试,贴你的记录及要求结果出来看看