下面是一个公司内员工打饭记录表,dept为员工部门,lunch是员工要的菜
table lunchjilu
dept lunch
1 茄子◆豆角◆黄瓜
1 黄瓜◆豆角◆茄子
2 西红柿◆豆腐
2 茄子◆黄瓜◆豆角
2 茄子◆黄瓜
。
现在要统计各部门员工点菜偏好
统计结果如下
result:dept 茄子◆豆角◆黄瓜 西红柿◆豆腐 茄子◆黄瓜
1 2 0 0
2 1 1 1
。
问题是 茄子◆豆角◆黄瓜 这样的就有6种排列,但其实是一样的要统计到一块要作处理,我SQL不好只会个简单的GROUP BY,高手显灵吧。
table lunchjilu
dept lunch
1 茄子◆豆角◆黄瓜
1 黄瓜◆豆角◆茄子
2 西红柿◆豆腐
2 茄子◆黄瓜◆豆角
2 茄子◆黄瓜
。
现在要统计各部门员工点菜偏好
统计结果如下
result:dept 茄子◆豆角◆黄瓜 西红柿◆豆腐 茄子◆黄瓜
1 2 0 0
2 1 1 1
。
问题是 茄子◆豆角◆黄瓜 这样的就有6种排列,但其实是一样的要统计到一块要作处理,我SQL不好只会个简单的GROUP BY,高手显灵吧。
insert into tb values(1 ,'茄子◆豆角◆黄瓜')
insert into tb values(1 ,'黄瓜◆豆角◆茄子')
insert into tb values(2 ,'西红柿◆豆腐')
insert into tb values(2 ,'茄子◆黄瓜◆豆角')
goSELECT TOP 8000 id = IDENTITY(int, 1, 1) INTO # FROM syscolumns a, syscolumns b
select dept ,
sum(case lunch when '茄子' then 1 else 0 end) [茄子],
sum(case lunch when '豆角' then 1 else 0 end) [豆角],
sum(case lunch when '黄瓜' then 1 else 0 end) [黄瓜],
sum(case lunch when '西红柿' then 1 else 0 end) [西红柿],
sum(case lunch when '豆腐' then 1 else 0 end) [豆腐]
from
(
SELECT A.dept, lunch = SUBSTRING(A.[lunch], B.id, CHARINDEX('◆', A.[lunch] + '◆', B.id) - B.id)
FROM tb A, # B
WHERE SUBSTRING('◆' + A.[lunch], B.id, 1) = '◆'
) t
group by dept
DROP TABLE #drop table tb /*
dept 茄子 豆角 黄瓜 西红柿 豆腐
----------- ----------- ----------- ----------- ----------- -----------
1 2 2 2 0 0
2 1 1 1 1 1(所影响的行数为 2 行)*/
insert into tb values(1 ,'茄子◆豆角◆黄瓜')
insert into tb values(1 ,'黄瓜◆豆角◆茄子')
insert into tb values(2 ,'西红柿◆豆腐')
insert into tb values(2 ,'茄子◆黄瓜◆豆角')
goSELECT TOP 8000 id = IDENTITY(int, 1, 1) INTO # FROM syscolumns a, syscolumns b
select dept ,
sum(case lunch when '茄子' then 1 else 0 end) [茄子],
sum(case lunch when '豆角' then 1 else 0 end) [豆角],
sum(case lunch when '黄瓜' then 1 else 0 end) [黄瓜],
sum(case lunch when '西红柿' then 1 else 0 end) [西红柿],
sum(case lunch when '豆腐' then 1 else 0 end) [豆腐]
from
(
SELECT A.dept, lunch = SUBSTRING(A.[lunch], B.id, CHARINDEX('◆', A.[lunch] + '◆', B.id) - B.id)
FROM tb A, # B
WHERE SUBSTRING('◆' + A.[lunch], B.id, 1) = '◆'
) t
group by dept
DROP TABLE #drop table tb /*
dept 茄子 豆角 黄瓜 西红柿 豆腐
----------- ----------- ----------- ----------- ----------- -----------
1 2 2 2 0 0
2 1 1 1 1 1(所影响的行数为 2 行)*/
create table tb(dept int, lunch nvarchar(60))
insert into tb values(1 ,N'茄子◆豆角◆黄瓜')
insert into tb values(1 ,N'黄瓜◆豆角◆茄子')
insert into tb values(2 ,N'西红柿◆豆腐')
insert into tb values(2 ,N'茄子◆黄瓜◆豆角')
go
select dept ,
sum(case lunch when N'茄子' then 1 else 0 end) [茄子],
sum(case lunch when N'豆角' then 1 else 0 end) [豆角],
sum(case lunch when N'黄瓜' then 1 else 0 end) [黄瓜],
sum(case lunch when N'西红柿' then 1 else 0 end) [西红柿],
sum(case lunch when N'豆腐' then 1 else 0 end) [豆腐]
from
(
SELECT A.dept, B.lunch
FROM(
SELECT dept, [lunch] = CONVERT(xml,'<root><v>' + REPLACE([lunch], N'◆', '</v><v>') + '</v></root>') FROM tb
)A
OUTER APPLY(
SELECT lunch = N.v.value('.', 'nvarchar(100)') FROM A.[lunch].nodes('/root/v') N(v)
)B
) t
group by deptdrop table tb/*
dept 茄子 豆角 黄瓜 西红柿 豆腐
----------- ----------- ----------- ----------- ----------- -----------
1 2 2 2 0 0
2 1 1 1 1 1(2 行受影响)*/
/*
标题:普通行列转换(version 2.0)
作者:爱新觉罗.毓华(十八年风雨,守得冰山雪莲花开)
时间:2008-03-09
地点:广东深圳
说明:普通行列转换(version 1.0)仅针对sql server 2000提供静态和动态写法,version 2.0增加sql server 2005的有关写法。问题:假设有张学生成绩表(tb)如下:
姓名 课程 分数
张三 语文 74
张三 数学 83
张三 物理 93
李四 语文 74
李四 数学 84
李四 物理 94
想变成(得到如下结果):
姓名 语文 数学 物理
---- ---- ---- ----
李四 74 84 94
张三 74 83 93
-------------------
*/create table tb(姓名 varchar(10) , 课程 varchar(10) , 分数 int)
insert into tb values('张三' , '语文' , 74)
insert into tb values('张三' , '数学' , 83)
insert into tb values('张三' , '物理' , 93)
insert into tb values('李四' , '语文' , 74)
insert into tb values('李四' , '数学' , 84)
insert into tb values('李四' , '物理' , 94)
go--SQL SERVER 2000 静态SQL,指课程只有语文、数学、物理这三门课程。(以下同)
select 姓名 as 姓名 ,
max(case 课程 when '语文' then 分数 else 0 end) 语文,
max(case 课程 when '数学' then 分数 else 0 end) 数学,
max(case 课程 when '物理' then 分数 else 0 end) 物理
from tb
group by 姓名--SQL SERVER 2000 动态SQL,指课程不止语文、数学、物理这三门课程。(以下同)
declare @sql varchar(8000)
set @sql = 'select 姓名 '
select @sql = @sql + ' , max(case 课程 when ''' + 课程 + ''' then 分数 else 0 end) [' + 课程 + ']'
from (select distinct 课程 from tb) as a
set @sql = @sql + ' from tb group by 姓名'
exec(@sql) --SQL SERVER 2005 静态SQL。
select * from (select * from tb) a pivot (max(分数) for 课程 in (语文,数学,物理)) b--SQL SERVER 2005 动态SQL。
declare @sql varchar(8000)
select @sql = isnull(@sql + '],[' , '') + 课程 from tb group by 课程
set @sql = '[' + @sql + ']'
exec ('select * from (select * from tb) a pivot (max(分数) for 课程 in (' + @sql + ')) b')---------------------------------/*
问题:在上述结果的基础上加平均分,总分,得到如下结果:
姓名 语文 数学 物理 平均分 总分
---- ---- ---- ---- ------ ----
李四 74 84 94 84.00 252
张三 74 83 93 83.33 250
*/--SQL SERVER 2000 静态SQL。
select 姓名 姓名,
max(case 课程 when '语文' then 分数 else 0 end) 语文,
max(case 课程 when '数学' then 分数 else 0 end) 数学,
max(case 课程 when '物理' then 分数 else 0 end) 物理,
cast(avg(分数*1.0) as decimal(18,2)) 平均分,
sum(分数) 总分
from tb
group by 姓名--SQL SERVER 2000 动态SQL。
declare @sql varchar(8000)
set @sql = 'select 姓名 '
select @sql = @sql + ' , max(case 课程 when ''' + 课程 + ''' then 分数 else 0 end) [' + 课程 + ']'
from (select distinct 课程 from tb) as a
set @sql = @sql + ' , cast(avg(分数*1.0) as decimal(18,2)) 平均分 , sum(分数) 总分 from tb group by 姓名'
exec(@sql) --SQL SERVER 2005 静态SQL。
select m.* , n.平均分 , n.总分 from
(select * from (select * from tb) a pivot (max(分数) for 课程 in (语文,数学,物理)) b) m,
(select 姓名 , cast(avg(分数*1.0) as decimal(18,2)) 平均分 , sum(分数) 总分 from tb group by 姓名) n
where m.姓名 = n.姓名--SQL SERVER 2005 动态SQL。
declare @sql varchar(8000)
select @sql = isnull(@sql + ',' , '') + 课程 from tb group by 课程
exec ('select m.* , n.平均分 , n.总分 from
(select * from (select * from tb) a pivot (max(分数) for 课程 in (' + @sql + ')) b) m ,
(select 姓名 , cast(avg(分数*1.0) as decimal(18,2)) 平均分 , sum(分数) 总分 from tb group by 姓名) n
where m.姓名 = n.姓名')drop table tb ------------------
------------------/*
问题:如果上述两表互相换一下:即表结构和数据为:
姓名 语文 数学 物理
张三 74 83 93
李四 74 84 94
想变成(得到如下结果):
姓名 课程 分数
---- ---- ----
李四 语文 74
李四 数学 84
李四 物理 94
张三 语文 74
张三 数学 83
张三 物理 93
--------------
*/create table tb(姓名 varchar(10) , 语文 int , 数学 int , 物理 int)
insert into tb values('张三',74,83,93)
insert into tb values('李四',74,84,94)
go--SQL SERVER 2000 静态SQL。
select * from
(
select 姓名 , 课程 = '语文' , 分数 = 语文 from tb
union all
select 姓名 , 课程 = '数学' , 分数 = 数学 from tb
union all
select 姓名 , 课程 = '物理' , 分数 = 物理 from tb
) t
order by 姓名 , case 课程 when '语文' then 1 when '数学' then 2 when '物理' then 3 end--SQL SERVER 2000 动态SQL。
--调用系统表动态生态。
declare @sql varchar(8000)
select @sql = isnull(@sql + ' union all ' , '' ) + ' select 姓名 , [课程] = ' + quotename(Name , '''') + ' , [分数] = ' + quotename(Name) + ' from tb'
from syscolumns
where name! = N'姓名' and ID = object_id('tb') --表名tb,不包含列名为姓名的其它列
order by colid asc
exec(@sql + ' order by 姓名 ')--SQL SERVER 2005 动态SQL。
select 姓名 , 课程 , 分数 from tb unpivot (分数 for 课程 in([语文] , [数学] , [物理])) t--SQL SERVER 2005 动态SQL,同SQL SERVER 2000 动态SQL。--------------------
/*
问题:在上述的结果上加个平均分,总分,得到如下结果:
姓名 课程 分数
---- ------ ------
李四 语文 74.00
李四 数学 84.00
李四 物理 94.00
李四 平均分 84.00
李四 总分 252.00
张三 语文 74.00
张三 数学 83.00
张三 物理 93.00
张三 平均分 83.33
张三 总分 250.00
------------------
*/select * from
(
select 姓名 as 姓名 , 课程 = '语文' , 分数 = 语文 from tb
union all
select 姓名 as 姓名 , 课程 = '数学' , 分数 = 数学 from tb
union all
select 姓名 as 姓名 , 课程 = '物理' , 分数 = 物理 from tb
union all
select 姓名 as 姓名 , 课程 = '平均分' , 分数 = cast((语文 + 数学 + 物理)*1.0/3 as decimal(18,2)) from tb
union all
select 姓名 as 姓名 , 课程 = '总分' , 分数 = 语文 + 数学 + 物理 from tb
) t
order by 姓名 , case 课程 when '语文' then 1 when '数学' then 2 when '物理' then 3 when '平均分' then 4 when '总分' then 5 enddrop table tb
你好,我认真看了你的回复,真的收获很大,按你给的方法,我只能是在菜名顺序一定的情况下统计出来
但现在我的问题是统计员工吃菜偏好 '茄子◆豆角◆黄瓜' 就是一种,但由于程序原因 可能还有员工点了
同样的菜但记录在数据库中的是 '豆角◆茄子◆黄瓜' '黄瓜◆茄子◆豆角'...等,但其实员工吃的是一样的
统计时都要统计成 '茄子◆豆角◆黄瓜' 这个组合下统计结果要是下面这个样子
dept 茄子◆豆角◆黄瓜 西红柿◆豆腐 茄子◆黄瓜
1 2 0 0
2 1 1 1 而不是统计单种的菜,不知道我说明白没有,谢谢你的回复。希望如果可以再帮我看一下这个问题
insert into tb values(1 ,'茄子◆豆角◆黄瓜')
insert into tb values(1 ,'黄瓜◆豆角◆茄子')
insert into tb values(2 ,'西红柿◆豆腐')
insert into tb values(2 ,'茄子◆黄瓜◆豆角')
goSELECT TOP 8000 id = IDENTITY(int, 1, 1) INTO # FROM syscolumns a, syscolumns b
select dept ,
sum(case lunch when '茄子' then 1 else 0 end) [茄子],
sum(case lunch when '豆角' then 1 else 0 end) [豆角],
sum(case when lunch in( N'黄瓜',N'西红柿') then 1 else 0 end) [黄瓜 西红柿],
sum(case lunch when '豆腐' then 1 else 0 end) [豆腐]
from
(
SELECT A.dept, lunch = SUBSTRING(A.[lunch], B.id, CHARINDEX('◆', A.[lunch] + '◆', B.id) - B.id)
FROM tb A, # B
WHERE SUBSTRING('◆' + A.[lunch], B.id, 1) = '◆'
) t
group by dept
DROP TABLE #drop table tb /*
dept 茄子 豆角 黄瓜 西红柿 豆腐
----------- ----------- ----------- ----------- -----------
1 2 2 2 0
2 1 1 2 1(所影响的行数为 2 行)
*/--sql 2005用OUTER APPLY+静态行列转换解决
create table tb(dept int, lunch nvarchar(60))
insert into tb values(1 ,N'茄子◆豆角◆黄瓜')
insert into tb values(1 ,N'黄瓜◆豆角◆茄子')
insert into tb values(2 ,N'西红柿◆豆腐')
insert into tb values(2 ,N'茄子◆黄瓜◆豆角')
go
select dept ,
sum(case lunch when N'茄子' then 1 else 0 end) [茄子],
sum(case lunch when N'豆角' then 1 else 0 end) [豆角],
sum(case when lunch in( N'黄瓜',N'西红柿') then 1 else 0 end) [黄瓜 西红柿],
sum(case lunch when N'豆腐' then 1 else 0 end) [豆腐]
from
(
SELECT A.dept, B.lunch
FROM(
SELECT dept, [lunch] = CONVERT(xml,'<root><v>' + REPLACE([lunch], N'◆', '</v><v>') + '</v></root>') FROM tb
)A
OUTER APPLY(
SELECT lunch = N.v.value('.', 'nvarchar(100)') FROM A.[lunch].nodes('/root/v') N(v)
)B
) t
group by deptdrop table tb/*
dept 茄子 豆角 黄瓜 西红柿 豆腐
----------- ----------- ----------- ----------- -----------
1 2 2 2 0
2 1 1 2 1(2 行受影响)*/
insert into tb values(1 ,N'茄子◆豆角◆黄瓜')
insert into tb values(1 ,N'黄瓜◆豆角◆茄子')
insert into tb values(2 ,N'西红柿◆豆腐')
insert into tb values(2 ,N'茄子◆黄瓜◆豆角')
go
;with t
as
(
SELECT A.dept,a.rowid, B.lunch
FROM(
SELECT dept, rowid,[lunch] = CONVERT(xml,'<root><v>' + REPLACE([lunch], N'◆', '</v><v>') + '</v></root>')
FROM (select rowid = row_number() over (order by dept),* from tb ) tb
)A
OUTER APPLY(
SELECT lunch = N.v.value('.', 'nvarchar(100)') FROM A.[lunch].nodes('/root/v') N(v)
)B
)
,t2
as(
select dept,lunch = stuff(replace(replace((select lunch
from t
where dept=a.dept and rowid = a.rowid order by lunch for xml AUTO),
'"/><t lunch="','◆'),
'"/>',''),1,10,'')
from t as a
group by dept,rowid)
SELECT dept, [豆角◆黄瓜◆茄子] AS [豆角◆黄瓜◆茄子],[豆腐◆西红柿] AS [豆腐◆西红柿]
FROM
(SELECT *
FROM t2) p
PIVOT
(
COUNT (lunch)
FOR lunch IN
( [豆角◆黄瓜◆茄子],[豆腐◆西红柿] )
) AS pvt
ORDER BY dept/*
dept 豆角◆黄瓜◆茄子 豆腐◆西红柿
----------- ----------- -----------
1 2 0
2 1 1*/
drop table tb
这个'茄子◆豆角◆黄瓜' 是由员工点菜生成的,我要统计的就是员工吃的什么,如果拆分后我就不能知道
员工点的什么菜了,也就是'茄子◆豆角◆黄瓜'是一种情况,是不能分割的,但它和'豆角◆茄子◆黄瓜'是同一种
我表述能力不太好,不好意思,8楼的理解是对的,
我去看看8楼
的
14楼
insert into tb values(1 ,N'茄子◆豆角◆黄瓜')
insert into tb values(1 ,N'黄瓜◆豆角◆茄子')
insert into tb values(2 ,N'西红柿◆豆腐')
insert into tb values(2 ,N'茄子◆黄瓜◆豆角')
go
;with t
as
(
SELECT A.dept,a.rowid, B.lunch
FROM(
SELECT dept, rowid,[lunch] = CONVERT(xml,'<root><v>' + REPLACE([lunch], N'◆', '</v><v>') + '</v></root>')
FROM (select rowid = row_number() over (order by dept),* from tb ) tb
)A
OUTER APPLY(
SELECT lunch = N.v.value('.', 'nvarchar(100)') FROM A.[lunch].nodes('/root/v') N(v)
)B
)
,t2
as(
select dept,lunch = stuff(replace(replace((select lunch
from t
where dept=a.dept and rowid = a.rowid order by lunch for xml AUTO),
'"/><t lunch="','◆'),
'"/>',''),1,10,'')
from t as a
group by dept,rowid)select * into tmp from t2
declare @s varchar(max)
select @s = isnull(@s+',','')+'['+lunch+']= sum(case when lunch ='''+lunch+''' then 1 else 0 end)'
from (select distinct lunch from tmp) a
exec('
SELECT dept,'+@s+'
FROM tmp
group by dept
ORDER BY dept')
drop table tmp/*
dept 豆角◆黄瓜◆茄子 豆腐◆西红柿
----------- ----------- -----------
1 2 0
2 1 1*/
drop table tb
insert into tb values(1 ,N'茄子◆豆角◆黄瓜')
insert into tb values(1 ,N'黄瓜◆豆角◆茄子')
insert into tb values(2 ,N'西红柿◆豆腐')
insert into tb values(2 ,N'茄子◆黄瓜◆豆角')
gocreate function f_s( @id int)
returns varchar(8000)
as
begin
declare @s varchar(8000)
select @s =isnull(@s+'◆','')+lunch from tmp where id = @id order by lunch
return @s
end
goSELECT TOP 8000 id = IDENTITY(int, 1, 1) INTO # FROM syscolumns a, syscolumns b
select id=identity(int,1,1),* into #1 from tbselect dept ,lunch ,id into tmp
from
(
SELECT A.dept, a.id,lunch = SUBSTRING(A.[lunch], B.id, CHARINDEX('◆', A.[lunch] + '◆', B.id) - B.id)
FROM #1 A, # B
WHERE SUBSTRING('◆' + A.[lunch], B.id, 1) = '◆'
) t
select dept,dbo.f_s(id) as lunch into tmp2
from tmp
group by dept,id
declare @s varchar(max)
select @s = isnull(@s+',','')+'['+lunch+']= sum(case when lunch ='''+lunch+''' then 1 else 0 end)'
from (select distinct lunch from tmp2) a
exec('
SELECT dept,'+@s+'
FROM tmp2
group by dept
ORDER BY dept')
drop table tmp,tmp2
drop table tb,#,#1
drop function f_s
/*
dept 豆角◆黄瓜◆茄子 豆腐◆西红柿
----------- ----------- -----------
1 2 0
2 1 1*/
create table tb (dept int,lunch nvarchar(20))
insert into tb select 1,'茄子*豆角*黄瓜'
union all select 1,'黄瓜*豆角*茄子'
union all select 2,'西红柿*豆腐'
union all select 2,'茄子*黄瓜*豆角'
----每天的菜不是很多吧都列出来..
select dept ,[茄子*豆角*黄瓜]= sum (case when lunch like '%茄子%' and lunch like '%豆角%' and lunch like '%黄瓜%' then 1 else 0 end),
[西红柿*豆腐]=sum(case when lunch like '%西红柿%' and lunch like '%豆腐%' then 1 else 0 end)
from tb group by deptdrop table tbdept 茄子*豆角*黄瓜 西红柿*豆腐
----------- ----------- -----------
1 2 0
2 1 1(2 行受影响)
即dept 茄子*豆角*黄瓜 西红柿*豆腐
----------- ----------- -----------
1 2 0
2 1 1
这个结果。