千万级数据的插入语查询 sql server多线程大数据 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 这里的ID不是主键,而是一个字段名而已,ID有可能为空的 SQL SERVER有一个导入数据功能,选择“平面文件数据源”,选中文本文件直接导入。或者使用代码导入也行,这是建立数据库的过程,效率不需要太高,慢点都行的。快速查询,最简单的就是给相应字段添加索引。至于是否非空,没有多大关系~~在同一张表中,那可能会出现IO瓶颈,解决的办法就是一张表的记录分开存储在多个磁盘,使用多线程并行查询,再合并得到结果集。 1、如果导入是一次性工作的话直接就用SQL自带的导入工具吧。如果非得用TSQL实现,可以试下BULK INSERT。2、一般针对NAME/ID建索引。2000W条也不算大。(LZ不会是要玩KF查询吧 :D) 多现程不会更快。可以用SqlBulkCopyhttp://msdn.microsoft.com/zh-cn/library/system.data.sqlclient.sqlbulkcopy(v=vs.110).aspxhttp://blog.csdn.net/wxwrui335/article/details/6497413 别问“sp1234”,他会骂人的,他只以专业开发人员为伍,我刚在论坛发了个贴提问,给他说得狗血淋头贴子如下:http://bbs.csdn.net/topics/390874699 还“狗血淋头”。呵呵。如果csdn有个功能可以识别出你的问题来,我自然不会去回答你的问题。但是你有什么权利在现在这种帖子里这样写呢?你以为你龌龊地在我回复的帖子中捣乱,就能改变我能实际回答 lz 的问题和给以分析的文字的价值,以为这样就报了你的什么“仇”似地,那么你也太幼稚了。 就 用SqlBulkCopy,可以设置 每次拷贝的数量,少则几百条,多则上万条。提升查询速度 可以通过创建索引;不要使用in,like等模糊字符查询函数。 千万行的数据算比较小的量基本上SqlBulkCopy就能搞定如果还是觉得磁盘IO不够,可以做成分区表,再加上合理的索引,这样查询/插入的速度都可以保证我们日均千万行的数据也基本上这个思路可以搞定,还有复杂的更新逻辑什么的 1.SqlBulkCopy2.设置索引,当然,也看你那两个字段的数据情况,越是少重复越快。 抱歉,这里的“使用多线程并行查询”可能会引起歧义。我的原意是:客户依然是使用通用的查询语句,但是数据库接收到查询语句并建立一个查询计划后,进行查询优化:这时候使用并行子查询,多个线程查询存储在不同磁盘中的数据库表,每个子查询都获得一个查询结果,最后合并得到一个查询结果集,返回给客户。查询任务结束。就是说,数据库查询过程对于客户是透明的,客户并不知道数据库内部使用的是并行多磁盘查询还是普通查询。我没有搞过高性能数据库,但这是数据库解决IO瓶颈的一个直观的办法,在主流数据库中可能集成了相关模块和工具。多线程解决不了IO瓶颈,你的思路完全错了,主流数据库不会用这样的错误思路。 楼主可以考虑 用微软的 BI开发工具。用 SSIShttp://baike.baidu.com/view/1018273.htm?fr=aladdin 紧急求助一个C#弹出对话框的问题,对话框无法显示内容。 想实现点在线上运动,这段代码出什么问题了【不到30行】 .NET和组态王能否连接?如何连接? 串口问题 C# 使用双缓冲问题 WinForm中 怎么用Tab键在工具栏中切换? 请问unsigned char *pData要怎样Marshal? 窗体的定时载入 窗体初始话的时候怎么让ComboBox 定位在第一项? 帮忙~~~~!用C#语句调用一个.exe文件??? 如何在C#程序中将数据导出为html文件和.txt文件 substring能作用于带通配符的字符串不?
在同一张表中,那可能会出现IO瓶颈,解决的办法就是一张表的记录分开存储在多个磁盘,使用多线程并行查询,再合并得到结果集。
2、一般针对NAME/ID建索引。2000W条也不算大。(LZ不会是要玩KF查询吧 :D)
可以用SqlBulkCopyhttp://msdn.microsoft.com/zh-cn/library/system.data.sqlclient.sqlbulkcopy(v=vs.110).aspx
http://blog.csdn.net/wxwrui335/article/details/6497413
贴子如下:
http://bbs.csdn.net/topics/390874699
基本上SqlBulkCopy就能搞定
如果还是觉得磁盘IO不够,可以做成分区表,再加上合理的索引,这样查询/插入的速度都可以保证我们日均千万行的数据也基本上这个思路可以搞定,还有复杂的更新逻辑什么的
2.设置索引,当然,也看你那两个字段的数据情况,越是少重复越快。
抱歉,这里的“使用多线程并行查询”可能会引起歧义。我的原意是:客户依然是使用通用的查询语句,但是数据库接收到查询语句并建立一个查询计划后,进行查询优化:这时候使用并行子查询,多个线程查询存储在不同磁盘中的数据库表,每个子查询都获得一个查询结果,最后合并得到一个查询结果集,返回给客户。查询任务结束。
就是说,数据库查询过程对于客户是透明的,客户并不知道数据库内部使用的是并行多磁盘查询还是普通查询。
我没有搞过高性能数据库,但这是数据库解决IO瓶颈的一个直观的办法,在主流数据库中可能集成了相关模块和工具。
多线程解决不了IO瓶颈,你的思路完全错了,主流数据库不会用这样的错误思路。
http://baike.baidu.com/view/1018273.htm?fr=aladdin