现有二张表:
A
结构 ID INCOME
注释 身份证号 收入
31111 1000.00
32222 2093.00
33333 2321.00B
结构 ID NAME ADDR POSTALCODE
注释 身份证号 姓名 地址 邮编.
31111 张三 吴中路1号 200000
31111 张 三(1)吴中路2号 200000
32222 李四 吴中路2号 200001
33333 王五 吴中路1号 200000
33333 王 五 吴中路1号 200001
现问题是这样的:
A表中,一个ID只有一个收入,也即每人只有一个记录项.
B表中,一个ID有可能对应很多记录,原因是因当时录入时,没有按统一标准录入,如,姓名"张三",后面的人再有人录入为"张 三".这样一来,一个身份证号有很多记录了.
现我的目的是,我要得到每一个人的信息,但如NAME,ADDR,POSTALCODE中(非关键信息),我只要选中找到一个符合的数据即可,也即,如"张三",我没有必要再得到另外一个"张 三".
最后得到的表的样式为:
ID NAME ADDR POSTALCODE INCOME
31111 张三 吴中路1号 200000 1000.00
32222 李四 吴中路2号 200001 2093.00
33333 王五 吴中路1号 200000 2321.00请问这条SQL语句怎么写?我发现如果用A LEFT JOIN B时,会得到重复的数据.(因为SQL版本人少,没多少人气,又急,只能求助于此).
select a.id,b.name,b.addr,b.postalcode,a.income
from a left join b on a.id=b.id
where not exists(select 1 from b bb where id=bb.id and name<bb.name)
create table tbAA
([ID] varchar(20),income numeric(10,2))
insert tbAA
select '31111',1000.00 union all
select '32222',2093.00 union all
select '33333',2321.00create table tbBB
([ID] varchar(20),[name] varchar(20),Addr varchar(100),postalcode varchar(10))
insert tbBB
select '31111','张三','吴中路1号','200000'
union all select '31111','张 三(1)','吴中路1号','200000'
union all select '32222','李四','吴中路2号','200001'
union all select '33333','王五','吴中路1号','200000'
union all select '33333','王 五','吴中路1号','200001'select a.[id],b.[name],b.addr,b.postalcode,a.income
from tbaa a left join tbbb b on a.[id]=b.[id]
where not exists (select 1 from tbbb where [id]=b.[id] and [name]>b.[name])
order by a.[id]drop table tbAA,tbBB/*
(所影响的行数为 3 行)
(所影响的行数为 5 行)id name addr postalcode income
-------------------- -------------------- ---------------------------------------------------------------------------------------------------- ---------- ------------
31111 张三 吴中路1号 200000 1000.00
32222 李四 吴中路2号 200001 2093.00
33333 王五 吴中路1号 200000 2321.00(所影响的行数为 3 行)*/
create table tbAA
([ID] varchar(5),income numeric(10,2))
insert tbAA
select '31111',1000.00 union all
select '32222',2093.00 union all
select '33333',2321.00create table tbBB
([ID] varchar(5),[name] varchar(10),Addr varchar(10),postalcode varchar(10))
insert tbBB
select '31111','张三','吴中路1号','200000'
union all select '31111','张 三(1)','吴中路1号','200000'
union all select '32222','李四','吴中路2号','200001'
union all select '33333','王五','吴中路1号','200000'
union all select '33333','王 五','吴中路1号','200001'select a.[id],b.[name],b.addr,b.postalcode,a.income
from tbaa a left join tbbb b on a.[id]=b.[id]
where not exists (select 1 from tbbb where [id]=b.[id] and [name]>b.[name])
order by a.[id]drop table tbAA,tbBB
/*(所影响的行数为 3 行)
(所影响的行数为 5 行)id name addr postalcode income
----- ---------- ---------- ---------- ------------
31111 张三 吴中路1号 200000 1000.00
32222 李四 吴中路2号 200001 2093.00
33333 王五 吴中路1号 200000 2321.00(所影响的行数为 3 行)
*/
--按某一字段分组取最大(小)值所在行的数据
(爱新觉罗.毓华 2007-10-23于浙江杭州)
/*
数据如下:
name val memo
a 2 a2(a的第二个值)
a 1 a1--a的第一个值
a 3 a3:a的第三个值
b 1 b1--b的第一个值
b 3 b3:b的第三个值
b 2 b2b2b2b2
b 4 b4b4
b 5 b5b5b5b5b5
*/
--创建表并插入数据:
create table tb(name varchar(10),val int,memo varchar(20))
insert into tb values('a', 2, 'a2(a的第二个值)')
insert into tb values('a', 1, 'a1--a的第一个值')
insert into tb values('a', 3, 'a3:a的第三个值')
insert into tb values('b', 1, 'b1--b的第一个值')
insert into tb values('b', 3, 'b3:b的第三个值')
insert into tb values('b', 2, 'b2b2b2b2')
insert into tb values('b', 4, 'b4b4')
insert into tb values('b', 5, 'b5b5b5b5b5')
go--一、按name分组取val最大的值所在行的数据。
--方法1:
select a.* from tb a where val = (select max(val) from tb where name = a.name) order by a.name
--方法2:
select a.* from tb a where not exists(select 1 from tb where name = a.name and val > a.val)
--方法3:
select a.* from tb a,(select name,max(val) val from tb group by name) b where a.name = b.name and a.val = b.val order by a.name
--方法4:
select a.* from tb a inner join (select name , max(val) val from tb group by name) b on a.name = b.name and a.val = b.val order by a.name
--方法5
select a.* from tb a where 1 > (select count(*) from tb where name = a.name and val > a.val ) order by a.name
/*
name val memo
---------- ----------- --------------------
a 3 a3:a的第三个值
b 5 b5b5b5b5b5
*/--二、按name分组取val最小的值所在行的数据。
--方法1:
select a.* from tb a where val = (select min(val) from tb where name = a.name) order by a.name
--方法2:
select a.* from tb a where not exists(select 1 from tb where name = a.name and val < a.val)
--方法3:
select a.* from tb a,(select name,min(val) val from tb group by name) b where a.name = b.name and a.val = b.val order by a.name
--方法4:
select a.* from tb a inner join (select name , min(val) val from tb group by name) b on a.name = b.name and a.val = b.val order by a.name
--方法5
select a.* from tb a where 1 > (select count(*) from tb where name = a.name and val < a.val) order by a.name
/*
name val memo
---------- ----------- --------------------
a 1 a1--a的第一个值
b 1 b1--b的第一个值
*/--三、按name分组取第一次出现的行所在的数据。
select a.* from tb a where val = (select top 1 val from tb where name = a.name) order by a.name
/*
name val memo
---------- ----------- --------------------
a 2 a2(a的第二个值)
b 1 b1--b的第一个值
*/--四、按name分组随机取一条数据。
select a.* from tb a where val = (select top 1 val from tb where name = a.name order by newid()) order by a.name
/*
name val memo
---------- ----------- --------------------
a 1 a1--a的第一个值
b 5 b5b5b5b5b5
*/--五、按name分组取最小的两个(N个)val
select a.* from tb a where 2 > (select count(*) from tb where name = a.name and val < a.val ) order by a.name,a.val
select a.* from tb a where val in (select top 2 val from tb where name=a.name order by val) order by a.name,a.val
select a.* from tb a where exists (select count(*) from tb where name = a.name and val < a.val having Count(*) < 2) order by a.name
/*
name val memo
---------- ----------- --------------------
a 1 a1--a的第一个值
a 2 a2(a的第二个值)
b 1 b1--b的第一个值
b 2 b2b2b2b2
*/--六、按name分组取最大的两个(N个)val
select a.* from tb a where 2 > (select count(*) from tb where name = a.name and val > a.val ) order by a.name,a.val
select a.* from tb a where val in (select top 2 val from tb where name=a.name order by val desc) order by a.name,a.val
select a.* from tb a where exists (select count(*) from tb where name = a.name and val > a.val having Count(*) < 2) order by a.name
/*
name val memo
---------- ----------- --------------------
a 2 a2(a的第二个值)
a 3 a3:a的第三个值
b 4 b4b4
b 5 b5b5b5b5b5
*/
--七,如果整行数据有重复,所有的列都相同。
/*
数据如下:
name val memo
a 2 a2(a的第二个值)
a 1 a1--a的第一个值
a 1 a1--a的第一个值
a 3 a3:a的第三个值
a 3 a3:a的第三个值
b 1 b1--b的第一个值
b 3 b3:b的第三个值
b 2 b2b2b2b2
b 4 b4b4
b 5 b5b5b5b5b5
*/
--在sql server 2000中只能用一个临时表来解决,生成一个自增列,先对val取最大或最小,然后再通过自增列来取数据。
--创建表并插入数据:
create table tb(name varchar(10),val int,memo varchar(20))
insert into tb values('a', 2, 'a2(a的第二个值)')
insert into tb values('a', 1, 'a1--a的第一个值')
insert into tb values('a', 1, 'a1--a的第一个值')
insert into tb values('a', 3, 'a3:a的第三个值')
insert into tb values('a', 3, 'a3:a的第三个值')
insert into tb values('b', 1, 'b1--b的第一个值')
insert into tb values('b', 3, 'b3:b的第三个值')
insert into tb values('b', 2, 'b2b2b2b2')
insert into tb values('b', 4, 'b4b4')
insert into tb values('b', 5, 'b5b5b5b5b5')
goselect * , px = identity(int,1,1) into tmp from tbselect m.name,m.val,m.memo from
(
select t.* from tmp t where val = (select min(val) from tmp where name = t.name)
) m where px = (select min(px) from
(
select t.* from tmp t where val = (select min(val) from tmp where name = t.name)
) n where n.name = m.name)drop table tb,tmp/*
name val memo
---------- ----------- --------------------
a 1 a1--a的第一个值
b 1 b1--b的第一个值(2 行受影响)
*/
--在sql server 2005中可以使用row_number函数,不需要使用临时表。
--创建表并插入数据:
create table tb(name varchar(10),val int,memo varchar(20))
insert into tb values('a', 2, 'a2(a的第二个值)')
insert into tb values('a', 1, 'a1--a的第一个值')
insert into tb values('a', 1, 'a1--a的第一个值')
insert into tb values('a', 3, 'a3:a的第三个值')
insert into tb values('a', 3, 'a3:a的第三个值')
insert into tb values('b', 1, 'b1--b的第一个值')
insert into tb values('b', 3, 'b3:b的第三个值')
insert into tb values('b', 2, 'b2b2b2b2')
insert into tb values('b', 4, 'b4b4')
insert into tb values('b', 5, 'b5b5b5b5b5')
goselect m.name,m.val,m.memo from
(
select * , px = row_number() over(order by name , val) from tb
) m where px = (select min(px) from
(
select * , px = row_number() over(order by name , val) from tb
) n where n.name = m.name)drop table tb/*
name val memo
---------- ----------- --------------------
a 1 a1--a的第一个值
b 1 b1--b的第一个值(2 行受影响)
*/