mysql 中创建索引很慢，怎么解决

如题，我现在有一张表里面的数据大概就是 800w 条左右，当然以后也可能会更多，这个表会频繁的更新！我现在的处理是：每次更新都会先truncate 这张表(因为里面的数据已经不需要了)，然后我会 drop index ！这样之后我会去 insert 数据。(这些数据量有可能过千万。。级别的) ，之后就是为数据建立索引！建立索引的过程很慢800w 数据现在执行了半个小时还没有完成。。建立索引的字段的类型是 varchar(这里只能是varhcar 之前有试过建立多列索引。。那样需要建立 6 列。。耗时大概 1 小时左右！如果数据量更大那么时间会更长) 有没有更好的解决办法。。或者怎么优化一下mysql 数据库。。

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

首先查询字段用char会好些你数据量大，不妨试一下，先建索引，当然insert速度会慢，你把innodb_flush_log_at_trx_commit置为0后进行insert，比较一下速度。
我知道。。我是先 insert 之后才去建立的 index 。你的意思是先建立 index 然后调整 mysql  的  innodb_flush_log_at_trx_commit  这样一来在执行 insert into 数据的操作速度会提高么？
1种方法：用SELECT INTO OUTFILE导出记录，
TRUNCATE 此TABLE，建立索引，用LOAD DATA INIFILE再导入
我现在就是这么做的。into file 导入数据不慢，也就是三四分钟的事情。。问题在于我导入之后要执行一些查询和统计，这个过程很忙！！我要优化的就是查询和统计。。为了解决这个问题。。我想到的就是去建立索引！但是为800w 条数据建立索引是个很慢的过程  ，希望能在建立索引的时候提高速度和效率！
我现在就是这么做的：
你的步骤是这样？先建立索引
RUNCATE 此TABLE，建立索引，用LOAD DATA INIFILE再导入
问题就是建立索引：再问一次，你是在导入数据前建立的索引还是导入后建立的，仔细看看我的建议用SELECT INTO OUTFILE导出记录，TRUNCATE 此TABLE，建立索引，用LOAD DATA INIFILE再导入
你的索引是什么？贴一下你的create table 和 create index
我是 truncate  table 之后就 load data inifile  然后 create index  。。你的意思是让我的 create  index 在 load data inifile 之前？  。。好吧我去试试。。看看效果如何。。现在按照我之前的做法。。index 还没有建立完全
。你的意思是让我的 create index 在 load data inifile 之前？
对，3楼就建议了，要仔细看看别人的回复哦
create table insert_database (red_ball varchar(50));create index redball_insertdatabase on insert_database (red_ball);
我需要设置 innodb_flush_log_at_trx_commit  么？？
数据量大概就是 800w 条数据文件时一个txt 文件。。大概 140M 左右。。当然有可能以后的文件。会更大！！
要设置 innodb_flush_log_at_trx_commit   。。这个参数么？？怎么设置呢？在哪里设置？配置文件？？
这样做。。导入的时候速度很慢！！！ (前提是我没有设置 innodb_flush_log_at_trx_commit  不知道设置之后会不会有提高？)
create table insert_database (red_ball varchar(50));create index redball_insertdatabase on insert_database (red_ball); ..这是建立表的   语句和。。创建索引的语句
load data local infile 'XX.txt' into table Insert_database fields terminated by '\t' lines terminated by '\r\n'这是导入文件的语句现在按照  15  楼说的导入速度很慢我用navicat  工具导入。。他的速度是这样的。。200 秒执行了当然文件的 4% ！！！速度缓慢啊。。(我没有设置 innodb_flush_log_at_trx_commit   不知道如果设置了会是什么结果)我之前是先导入文件在创建索引四分钟左右搞定！！！但是这样。。创建索引的时候很慢
先建索引，再执行set GLOBAL innodb_flush_log_at_trx_commit = 0;再倒入数据；
我现在是按照。。这种方式搞的。貌似速度也是和 innodb_flush_log_at_trx_commit 默认设置没有太大的差别如果设置。。innodb_flush_log_at_trx_commit  = 2；倒是速度上有了一点点提高。。但是提高也不大！！！
我刚才测试的结果
innodb_flush_log_at_trx_commit   = 1 耗时 200 秒插入了整个文件的 4% 左右！！innodb_flush_log_at_trx_commit   = 0 耗时 200 秒插入了整个文件的 5% 左右！！innodb_flush_log_at_trx_commit   = 2 耗时 200 秒插入了整个文件的 11% 左右！！
这不可能吧，你是用的innodb吗？
你说的是。。数据库类型么？我不太清楚。。我对mysql 不太熟悉怎么看数据库类型呢？或者表类型呢？
我刚才查看了一下。。表的结构。。是 innodb  类型的。。
直接在用MYSQL -uroot -p<123.sql 导入试试
mysql -u root -p root XXX.txt ..我的数据是纯数据没有sql 语句 txt 里面全部是纯数据！！！能这样导入么？
索引创建慢，主要跟磁盘IO有关系。
你把varchar(N)换成char(N)，应该会快些。另外，调大key-buffer之类的参数试试。
哦，你是用SELECT INTO OUTFILE
只能用LOAD DATA INIFILE才行，你在命令行下执行LOAD DATA INIFILE试试
key-buffer
这个参数应该在哪里调整？？？mysql.ini? 还是？？。
我现在执行导入的步骤是这样的：
先建立了表   create table insert_database（red_ball char(50）);
然后设置 innodb_flush_log_at_trx_commit  = 0;
然后建立index  create index redball_insertdatabase on insert_database(red_ball);
然后执行导入:load data local infile 'XXX.txt' into table Insert_database fields terminated by '\t' lines terminated by '\r\n'（我是从 9:42分执行的导入操作）到现在为止还在执行。。
正如我所说先建立索引  设置  innodb_flush_log_at_trx_commit = 0; 然后执行导入:load data local infile 'XXX.txt' into table Insert_database fields terminated by '\t' lines terminated by '\r\n'这个过程很慢至少是从 10：12 到现在为止一直在执行（我在mysql 控制台也看不到进度！！）
然而如果我们不建立索引设置  innodb_flush_log_at_trx_commit = 0; 然后执行导入:load data local infile 'XXX.txt' into table Insert_database fields terminated by '\t' lines terminated by '\r\n'
也就三四分钟的事情！！貌似设不设置 innodb_flush_log_at_trx_commit  没有太大的关系！！！但是我知道如果先导入了数据在建立索引这个过程很耗时！！！前面那种方式我知道是在导入数据的时候就添加好索引！！！(但是第一种方式我也看不到执行进度，在mysql 控制台黑屏。。看不到如果用navicat  这个工具来执行导入貌似不管执行哪种方式的导入速度都很慢！！！)顺便说一下我的目的吧。。我是想把数据导入之后做一个统计查询！！！就这样。。如果不建立索引我知道查询速度很慢！！！但是建立索引又是一个很耗时的过程有没有一种方式不建立索引也能提高查询和统计的速度的。目前的统计语句是这样的第一个sql ：统计总的记录条数(用于分页) select count(*) from (select rb.red_ball,count(1) from insert_database rb group by rb.red_ball having count(1)=1) as temp
第二个 sql:就是查询语句在分页上面使用 select rb.red_ball,count(1) from insert_database rb group by rb.red_ball having count(1)=1 limit x,x还有一个导出的：
select * from (select rb.red_ball,count(1) from insert_database rb group by rb.red_ball having count(1)=1) as temp into outfile 'xxx.txt' fields terminated by '\t' lines terminated by '\r\n'
又没办法实现不是建立索引能提高查询和统计速度的方式。。？期待大牛出现！
1 我不了解你表里的业务逻辑，red_ball是什么值，如果可以的话，是否能通过小表用编号维护red_ball，这样实际数据就可以编号，这样效率会提高很多，一般情况下，我们不应该在字符串上建索引，实在没办法，也只能用char类型，而不是varchar2 关于innodb_flush_log_at_trx_commit，我不知道你的实际环境，你不妨做个实验，一个简单的循环insert百万数据量，innodb_flush_log_at_trx_commit不同的设置，执行时间上差别很大，是几十分钟和几十秒的区别
不知道楼主用的MySQL版本如何？我建议最好升级MySQL到最新的5.5.x，实践证明5.5.x在索引的处理上跟5.1.x 5.0.x比，那就是火箭跟乌龟的区别！！！
好吧。。我下载个。。5.5试试。。但是我之前安装5.5的时候。。貌似执行不了。truncate table table_name 的操作
我明白你的意思：你第一条件建议就是建议我按照数据库范式来做！现在我的 red_ball 类型已经是char 了。。关于第二条件建议我还真没有使用循环一个 insert 来做！！！因为我现在导入数据是使用load data local infile  在mysql 控制台我也看不到速度！！！只能通过navicat 这样的恐惧来导入。。通过相同的时间来比较文件导入的进度！！！不过很感谢你的建议！不知道有没有更好的办法。。比如像 33 楼所说。
关于innodb_flush_log_at_trx_commit的试验你不妨做一下（限麻烦的话，可以联系我给你测试代码）
因为innodb_flush_log_at_trx_commit的效果太明显，我也想知道你的环境到底有什么问题。
如果想用insert语句的话，你可以用mysqldump把表的insert语句导出来执行。不过我个人觉得文件导入的话，最终也是应该生成insert语句，而且是支持批处理的，就是insert *** values (),(),()...；理论上效率应该更高。
也许你需要为我做一下测试了！！！我这个文件是 104M  数据量大概800w 。我昨天又测试了一个24M 的文件大概数据时 130w 左右我分别问他们这两个文件导入和建立索引！导入就是使用的load data local infile 'XXX.txt' into table Insert_database fields terminated by '\t' lines terminated by '\r\n'  这种方式然后我推测了一下
mysql 版本 5.5
24M   130w 导入耗时将近 1 分钟建立索引耗时 1分钟多些140M  800w 导入耗时将近 8 分钟建立索引耗时 8分钟左右(都是在公司做的测试)(以上的测试结果只是我自己得到的结果，但是我回到家用自己的电脑测得时候导入的时间耗时都差不多但是建立索引的时候竟然耗时 27分钟。我那个时候让他建立者索引。自己在玩dota 是不是 cpu 的占用和内存的使用也会影响建立索引的速度呢？)麻烦你一下能给个邮箱么？我把那个文件发给你帮我看一下到目前为止我所能做的提高建立索引的速度和导入的速度也只有这么多。想不到其他的办法了。也许你说的innodb_flush_log_at_trx_commit  = 0 会有效果，但是我这边貌似和他没有什么关系对了表结构是 innodb 的
上传到www.access911.net/csdn
，用WINRAR压缩
大数据量，处理，mysql 不行的，特别是插入删除什么的。如果你的系统是mysql的，那就没办了，如果你只是用mysql 来处理一下数据，或分析得到结果什么的，你可以换用mssql处理很快的。800万数据，导入，索引几分钟搞定。我刚转过来。
试试在varchar(50)字段的前面几位建立索引，50的长度没必要~

mysql 中 创建索引很慢，怎么解决

解决方案 »

mysql 中创建索引很慢，怎么解决