如何高效的实现100条数据在100万条以上的数据库中查询并返回那些记录不存在 select url from table group by url having count(*) > 1 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 假设要传入url的表名称为ta,已存储100万url的表名称为tb,从ta中查找已经存在于tb中的url:select url from ta as a where exists(select 1 from tb where url = a.url) 按hellowork(一两清风)的做法最糟的情况是,每条url在tb中都不存在比较次数为100 * 100W次=1亿次会超时吗? 这个效率高些:select a.url from ta as a inner join tb as b on a.url = b.url 关注ingby the way hellowork(一两清风) ( ) 信誉:100 Blog 2006-11-03 16:54:00 得分: 0 假设要传入url的表名称为ta,已存储100万url的表名称为tb,从ta中查找已经存在于tb中的url:select url from ta as a where exists(select 1 from tb where url = a.url) select url from ta where url in(select url from tb )有什么区别。 存100万条的表针对存url列做索引. http://community.csdn.net/Expert/topic/5134/5134705.xml?temp=.8497736 select a.url from ta as a inner join tb as b on b.url = a.urltb在前,ta在后tb建聚集索引 数据无重复??LZ不要求一条语句实现吧!给100-200个URL建立个游标declare @t循环做 set @t select @t=1 from tb where tb.url=@url 然后 IF一下!这样最多扫描100-200次表,如果给url建立个聚簇索引,效率快些吧! 因为每天都要插入成千上万条url记录,如果建立聚簇索引,会引起大量的IO磁盘操作,从而造成瓶颈.例外,我想实现对传入的上百条URL筛选后要尽快返回,否则会造成程序等待超时引发异常EmeraldSword(035216):用游标估计不行吧,数据量太大了,浪费资源 求教各位数据高手 如何选出福建省福州市鼓楼区? 查询问题 vc中如何操作SQL2000 在sql server导出数据的时候能不能把结构关系也导出? 简单问题,比较难描述 急啊,在线等!高手们来看看,,,, sql写法 关于“SQL Server 身份验证” sql 查询 关于收缩日志文件的问题,请求各位帮忙,很令我挠头阿!在线等! SQL数据库访问 全角和半角比较问题。(急)
select url from ta as a where exists(select 1 from tb where url = a.url)
最糟的情况是,每条url在tb中都不存在
比较次数为100 * 100W次=1亿次
会超时吗?
select a.url from ta as a inner join tb as b on a.url = b.url
by the way
hellowork(一两清风) ( ) 信誉:100 Blog 2006-11-03 16:54:00 得分: 0
假设要传入url的表名称为ta,已存储100万url的表名称为tb,从ta中查找已经存在于tb中的url:
select url from ta as a where exists(select 1 from tb where url = a.url)
select url from ta where url in(select url from tb )
有什么区别。
tb在前,ta在后
tb建聚集索引
给100-200个URL建立个游标
declare @t
循环做
set @t
select @t=1 from tb where tb.url=@url
然后 IF一下!
这样最多扫描100-200次表,如果给url建立个聚簇索引,效率快些吧!
用游标估计不行吧,数据量太大了,浪费资源