一张表里面, 有五六千万行数据。用的myisam这个表主要用来查询,不过时不时地也会往这个表里面插入数据。
而且基本都是一次性插入几十万几百万行的。。
我在几个查询经常要用到的列上面加了索引,但是加了索引以后,插入数据时的速度十分的慢。。
所以在插数据的时候我只能把索引删掉, 数据插完后再重新创建索引,但重新创建索引的过程更是慢的受不了啊。。有啥办法啊。。
谢谢。。

解决方案 »

  1.   


    1、取消索引,批量插入数据后再重建索引,总时间一定会比不取消索引花得多。
    2、可以使用LOAD DATA 来进行批量数据加载,速度比INSERT快。
    MySQL官方文档 http://dev.mysql.com/doc/refman/5.1/zh/index.html
      

  2.   

    索引是双刃剑,插入记录时更新索引,用LOAD DATA快一些,重新建立索引得不偿失
      

  3.   

    插入一个记录需要的时间由下列因素组成,其中的数字表示大约比例:连接:(3) 
    发送查询给服务器:(2) 
    分析查询:(2) 
    插入记录:(1x记录大小) 
    插入索引:(1x索引) 
    关闭:(1) 
    加快插入的一些方法:·         如果同时从同一个客户端插入很多行,使用含多个VALUE的INSERT语句同时插入几行。这比使用单行INSERT语句快(在某些情况下快几倍)。如果你正向一个非空表添加数据,可以调节bulk_insert_buffer_size变量,使数据插入更快。参见5.3.3节,“服务器系统变量”。·         如果你从不同的客户端插入很多行,能通过INSERT DELAYED语句加快速度。参见13.2.4节,“INSERT语法”。·         用MyISAM,如果在表中没有删除的行,能在SELECT语句正在运行的同时插入行。·         当从一个文本文件装载一个表时,使用LOAD DATA INFILE。这通常比使用很多INSERT语句快20倍。参见13.2.5节,“LOAD DATA INFILE语法”。·         当表有很多索引时,有可能要多做些工作使得LOAD DATA INFILE更快些。使用下列过程:有选择地用CREATE TABLE创建表。 
    执行FLUSH TABLES语句或命令mysqladmin flush-tables。 
    使用myisamchk --keys-used=0 -rq /path/to/db/tbl_name。这将从表中取消所有索引的使用。 
    用LOAD DATA INFILE把数据插入到表中,因为不更新任何索引,因此很快。 
    如果只想在以后读取表,使用myisampack压缩它。参见15.1.3.3节,“压缩表特性”。 
    用myisamchk -r -q /path/to/db/tbl_name重新创建索引。这将在写入磁盘前在内存中创建索引树,并且它更快,因为避免了大量磁盘搜索。结果索引树也被完美地平衡。 
    执行FLUSH TABLES语句或mysqladmin flush-tables命令。 
    请注意如果插入一个空MyISAM表,LOAD DATA INFILE也可以执行前面的优化;主要不同处是可以让myisamchk为创建索引分配更多的临时内存,比执行LOAD DATA INFILE语句时为服务器重新创建索引分配得要多。也可以使用ALTER TABLE tbl_name DISABLE KEYS代替myisamchk --keys-used=0 -rq /path/to/db/tbl_name,使用ALTER TABLE tbl_name ENABLE KEYS代替myisamchk -r -q /path/to/db/tbl_name。使用这种方式,还可以跳过FLUSH TABLES。·         锁定表可以加速用多个语句执行的INSERT操作:LOCK TABLES a WRITE; 
    INSERT INTO a VALUES (1,23),(2,34),(4,33); 
    INSERT INTO a VALUES (8,26),(6,29); 
    UNLOCK TABLES; 
    这样性能会提高,因为索引缓存区仅在所有INSERT语句完成后刷新到磁盘上一次。一般有多少INSERT语句即有多少索引缓存区刷新。如果能用一个语句插入所有的行,就不需要锁定。对于事务表,应使用BEGIN和COMMIT代替LOCK TABLES来加快插入。锁定也将降低多连接测试的整体时间,尽管因为它们等候锁定最大等待时间将上升。例如:Connection 1 does 1000 insertsConnections 2, 3, and 4 do 1 insertConnection 5 does 1000 inserts如果不使用锁定,2、3和4将在1和5前完成。如果使用锁定,2、3和4将可能不在1或5前完成,但是整体时间应该快大约40%。INSERT、UPDATE和DELETE操作在MySQL中是很快的,通过为在一行中多于大约5次连续不断地插入或更新的操作加锁,可以获得更好的整体性能。如果在一行中进行多次插入,可以执行LOCK TABLES,随后立即执行UNLOCK TABLES(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。
      

  4.   


    当然有。思路是:
    不改变目前已有的索引,
    停止索引更新和维护,插入数据完毕,重新启用索引,它会导致后续数据索引更新即每次你要插入大量数据时:
    alter table <tab> disable keys;
    batch insert .....;
    alter table <tab> enable keys;这样只会更新增量的部分数据的索引但是它也有一个限制,即是针对非unique index。你的表里头相信有主键,对吗?它对主键不能disable,
    主键或unique index只能drop再create。你可以隔一段时间重建一次主键。
      

  5.   

    导入数据的时候,数据源是一个SQL文件。 里面全是SQL 语句,所以不能用LOAD DATA INFILE呃。。
      

  6.   

    MySQL官方文档 http://dev.mysql.com/doc/refman/5.1/zh/index.html