有两个基础数据表映射表
ID 映射ID
XXX 111
YYY 222
ZZZ 333详细表
ID name
XXX 鞋子
ABC 衣服
YYY 电脑
ZZZ 书籍每天都有大概非常多条详细表的数据进入到数据库(每天大概有500W条),我需要对详细表做一些清洗做分析用(ID 在映射表中没有的不要),让里面的数据copy到另外一个数据表里面分析表映射ID name
111 鞋子
222 电脑
333 书籍
.....用作业每天晚上执行上面的操作,我想用 insert into select 操作,但是一次插入500W条数据会不会让数据库崩溃,或者说效率低下呢? 这种情况我应该怎么处理?
ID 映射ID
XXX 111
YYY 222
ZZZ 333详细表
ID name
XXX 鞋子
ABC 衣服
YYY 电脑
ZZZ 书籍每天都有大概非常多条详细表的数据进入到数据库(每天大概有500W条),我需要对详细表做一些清洗做分析用(ID 在映射表中没有的不要),让里面的数据copy到另外一个数据表里面分析表映射ID name
111 鞋子
222 电脑
333 书籍
.....用作业每天晚上执行上面的操作,我想用 insert into select 操作,但是一次插入500W条数据会不会让数据库崩溃,或者说效率低下呢? 这种情况我应该怎么处理?
解决方案 »
- 请教一个问题,如何不用distinct,进行分类
- 求一类似交叉表的SQL语句
- 在SQL Server 2005中创建的数据表怎么才能在SQL Server 2000中使用?
- SQL Server能象Excel一样可以处理多元线性回归吗?
- sql语句的优化?
- SQL 2000 升级到 sql 2008R2 64位
- 手动测试触发器可以执行,但是在程序执行中没有反应
- 建立check约束后如何命令修改? 不同数据库的表 可否join 或者outer join ?
- 我想取出不重复的记录,而且要排序, 该怎么写sql语句
- 求sql递归求人员的一级部门信息
- MSSQL LEFT JOIN 如果右边有值取给定字段的最大值
- 一个SQL的写法问题求助:
弱弱的问下,用SQL 作业处理这样的工作和你说的 “SSIS,ETL”有啥区别?
SSIS比较常用的背景是在BI的ETL过程,区别我也一时间说不了,但是BI这种大数据量抽取一般都会选择用SSIS而不用作业。
建议楼主看看相关资料
学习SSIS可以参考<SSIS学习视频(SQL Server 2008)>:
http://www.cnblogs.com/wghao/archive/2013/05/06/3061984.html