[Q]怎样监控无用的索引 [A]Oracle 9i以上,可以监控索引的使用情况,如果一段时间内没有使用的索引,一般就是无用的索引 语法为: 开始监控:alter index index_name monitoring usage; 检查使用状态:select * from v$object_usage; 停止监控:alter index index_name nomonitoring usage; 当然,如果想监控整个用户下的索引,可以采用如下的脚本: set heading off set echo off set feedback off set pages 10000 spool start_index_monitor.sql SELECT 'alter index '||owner||'.'||index_name||' monitoring usage;' FROM dba_indexes WHERE owner = USER; spool off set heading on set echo on set feedback on ------------------------------------------------ set heading off set echo off set feedback off set pages 10000 spool stop_index_monitor.sql SELECT 'alter index '||owner||'.'||index_name||' nomonitoring usage;' FROM dba_indexes WHERE owner = USER; spool off set heading on set echo on set feedback on
索引( Index )是常见的数Database 的性能。虽然有许多,还是有不少的人对它存在误解Oracle 8.1.7 OPS on HP N se使用不同的方法后,数据的比较明白事情的关键。 据库对象,它的设置好坏、使用是否资料讲索引的用法, DBA 和 Develo,因此针对使用中的常见问题,讲三ries ,示例全部是真实数据,读者不。本文所讲基本都是陈词滥调,但是 得当,极大地影响数据库应用程序和per 们也经常与它打交道,但笔者发现个问题。此文所有示例所用的数据库是需要注意具体的数据大小,而应注意在笔者试图通过实际的例子,来真正让您
第一讲、索引并非总是最佳选择
如果发现Oracle 在有索引,Oracle 确实会选择全表扫描 的情况下,没有使用索引,这并不是(Full Table Scan),而非索引扫描 Oracle 的优化器出错。在有些情况下(Index Scan)。这些情况通常有:
1. 表未做statistics, 或 者 statistics 陈旧,导致 Oracle 判断失误。
2. 根据该表拥有的记录数和数据块数,实际上全表扫描要比索引扫描更快。
对第1种情况,最常见的例子,是以下这句sql 语句:
select count(*) from mytable;
在未作statistics 之前,它使用全表扫描,statistics 之后,使用的是 INDEX (FAST FULL S得不好,也会导致Oracle 不使用索引。 需要读取6000多个数据块(一个数据块是8k), 做了CAN) ,只需要读取450个数据块。但是,statistics 做
第2种情况就要复杂得多。一般概念上都认为扫描快。为了讲清楚这个问题,这里先介绍一下Or:CF(Clustering factor) 和 FF(Filtering fact 索引比表快,比较难以理解什么情况下全表扫描要比索引acle 在评估使用索引的代价(cost)时两个重要的数据or).
CF: 所谓 CF, 通俗地讲,就是每读入一个索引块,要对应读入多少个数据块。
FF: 所谓 FF, 就是该sql 语句所选择的结果集,占总的数据量的百分比。
大约的计算公式是:FF * (要读入的数据块块数。需要读入全表扫描需要读入的数据块数等 CF + 索引块个数) ,由此估计出,的数据块越多,则 cost 越大,Orac于该表的实际数据块数) 一个查询, 如果使用某个索引,会需le 也就越可能不选择使用 index. (
其核心就是, CF 可能会比实际的数据块数量建立时,索引中的记录与表中的记录有良好的对应对应关系越来越乱,CF 也越来越大。此时需要 DB 大。CF 受到索引中数据的排列方式影响,通常在索引刚关系,CF 都很小;在表经过大量的插入、修改后,这种A 重新建立或者组织该索引。
如果某个sql 语句以前一直重新整理该索引了。 使用某索引,较长时间后不再使用, 一种可能就是 CF 已经变得太大,需要
FF 则是Oracle 根据 stati,最大值是409654,考虑以下sq stics 所做的估计。比如, mytablesl 语句: 表有32万行,其主键myid的最小值是1
Select * from mytables where myid>=1; 和
Select * from mytables where myid>=400000
这两句看似差不多的 sql 者的 FF 可能只有 1%。如果它实际上,在我们的数据库上的测 语句,对Oracle 而言,却有巨大的的CF 大于实际的数据块数,则Oracl试验证了我们的预测. 以下是在HP 差别。因为前者的 FF 是100%, 而后e 可能会选择完全不同的优化方式。而第二讲、索引也有好坏 索引有 B tree 索引, Bit全称是Balanced , 其意义是,有一个字段(Single column),Function-based index. 许多de map 索引, Reverse b tree 索引,从 tree 的 root 到任何一个leaf 也可以有多个字段(Composite),veloper 都倾向于使用单列B 树索引 等。最常用的是 B tree 索引。 B 的,要经过同样多的 level. 索引可以只最多32个字段,8I 还支持 。 所谓索引的好坏是指: 1,索引不是越多越好。特别是大量从来或者个索引即会降低性能,而且在一个sql 中, Oracl 几乎不用的索引,对系统只有损害。OLTP系统每表超过5e 从不能使用超过 5个索引。 2,很多时候,单列索引不如复合索引有效率。 3,用于多表连结的字段,加上索引会很有作用。 那么,在什么情况下单列索所查询的列,全部都出现在复合使用多个单列索引要快得多。( 引不如复合索引有效率呢?有一种情索引中时,此时由于 Oracle 只需要此时,这种优化方式被称为 Index o 况是显而易见的,那就是,当sql 语句查询索引块即可获得所有数据,当然比nly access path)
第三讲、索引再好,不用也是白搭
抛开前面所说的,假设你设不用,那么,需要做的第一件事 置了一个非常好的索引,任何傻瓜都情,是审视你的 sql 语句。 知道应该使用它,但是Oracle 却偏偏
Oracle 要使用一个索引,有一些最基本的条件:
1, where 子句中的这个字段,必须是复合索引的第一个字段;
2, where 子句中的这个字段,不应该参与任何形式的计算
具体来讲,假设一个索引是按 f1, f2, f3的= : var2, 则因为 f2 不是索引的第1个字段,无 次序建立的,现在有一个 sql 语句, where 子句是 f2 法使用该索引。
第2个问题,则在我们之中非常严重。以下是从 实际系统上面抓到的几个例子:
Select jobid from mytabs where isReq='0' and to_date (updatedate) >= to_Date ( '2001-7-18', 'YYYY-MM-DD');
以上的例子能很容易地进行和 内存资源。 改进。请注意这样的语句每天都在我 们的系统中运行,消耗我们有限的cpu
除了1,2这两个我们必须牢记于心的原则外,。这里我只讲哪些操作或者操作符会显式(explic 还应尽量熟悉各种操作符对 Oracle 是否使用索引的影响itly)地阻止 Oracle 使用索引。以下是一些基本规则:
1, 如果 f1 和 f2 是同一个表的两个字段,则 f1>f2, f1>=f2, f1
2, f1 is null, f1 is no t null, f1 not in, f1 !=, f1 lik e ‘%pattern%’;
3, Not exist
4, 某些情况下,f1 in 也会不用索引;
对于这些操作,别无办法,许可以将 in 操作改成 比较操 只有尽量避免。比如,如果发现你的作 + union all。笔者在实践中发现 sql 中的 in 操作没有使用索引,也很多时候这很有效。
但是,Oracle 是否真正使用索引,使用索引,对所写的复杂的 sql, 在将它写入应用程序之前Oracle 对该 sql 的解析(plan),可以明确地看是否真正有效,还是必须进行实地的测验。合理的做法是,先在产品数据库上做一次explain . explain 会获得到 Oracle 是如何优化该 sql 的。
如果经常做 explain, 就会划往往不尽如人意。事实上,将然这已经是题外话了。发现,喜爱写复杂的 sql 并不是个复杂的 sql 拆开,有时候会极大地好习惯,因为过分复杂的sql 其解析计提高效率,因为能获得很好的优化。当
---- 1、碎片是如何产生的
---- 当生成一个数据库时,它会分成称为表空间(Tablespace)的多个逻辑段(Segment),如系统(System)表空间,临时(Temporary)表空间等。一个表空间可以包含多个数据范围(Extent)和一个或多个自由范围块,即自由空间(Free Space)。
---- 表空间、段、范围、自由空间的逻辑关系如下: ---- 当表空间中生成一个段时,将从表空间有效自由空间中为这个段的初始范围分配空间。在这些初始范围充满数据时,段会请求增加另一个范围。这样的扩展过程会一直继续下去,直到达到最大的范围值,或者在表空间中已经没有自由空间用于下一个范围。最理想的状态就是一个段的数据可被存在单一的一个范围中。这样,所有的数据存储时靠近段内其它数据,并且寻找数据可少用一些指针。但是一个段包含多个范围的情况是大量存在的,没有任何措施可以保证这些范围是相邻存储的,如图〈1〉。当要满足一个空间要求时,数据库不再合并相邻的自由范围(除非别无选择), 而是寻找表空间中最大的自由范围来使用。这样将逐渐形成越来越多的离散的、分隔的、较小的自由空间,即碎片。例如: ---- 2、碎片对系统的影响
---- 随着时间推移,基于数据库的应用系统的广泛使用,产生的碎片会越来越多,将对数据库有以下两点主要影响:
---- (1)导致系统性能减弱
---- 如上所述,当要满足一个空间要求时,数据库将首先查找当前最大的自由范围,而"最大"自由范围逐渐变小,要找到一个足够大的自由范围已变得越来越困难,从而导致表空间中的速度障碍,使数据库的空间分配愈发远离理想状态;
---- (2)浪费大量的表空间
---- 尽管有一部分自由范围(如表空间的pctincrease为非0)将会被SMON(系统监控)后台进程周期性地合并,但始终有一部分自由范围无法得以自动合并,浪费了大量的表空间。
---- 3、自由范围的碎片计算
---- 由于自由空间碎片是由几部分组成,如范围数量、最大范围尺寸等,我们可用FSFI--Free Space Fragmentation Index(自由空间碎片索引)值来直观体现:
FSFI=100*SQRT(max(extent)/sum(extents))*1/SQRT(SQRT(count(extents)))
---- 可以看出,FSFI的最大可能值为100(一个理想的单文件表空间)。随着范围的增加,FSFI值缓慢下降,而随着最大范围尺寸的减少,FSFI值会迅速下降。
---- 下面的脚本可以用来计算FSFI值:
rem FSFI Value Compute
rem fsfi.sql
column FSFI format 999,99
select tablespace_name,sqrt(max(blocks)/sum(blocks))*
(100/sqrt(sqrt(count(blocks)))) FSFI
from dba_free_space
group by tablespace_name order by 1;
spool fsfi.rep;
/
spool off;
---- 比如,在某数据库运行脚本fsfi.sql,得到以下FSFI值:
TABLESPACE_NAME FSFI
------------------------------ -------
RBS 74.06
SYSTEM 100.00
TEMP 22.82
TOOLS 75.79
USERS 100.00
USER_TOOLS 100.00
YDCX_DATA 47.34
YDCX_IDX 57.19
YDJF_DATA 33.80
YDJF_IDX 75.55
---- 统计出了数据库的FSFI值,就可以把它作为一个可比参数。在一个有着足够有效自由空间,且FSFI值超过30的表空间中,很少会遇见有效自由空间的问题。当一个空间将要接近可比参数时,就需要做碎片整理了。
---- 4、自由范围的碎片整理
---- (1)表空间的pctincrease值为非0
---- 可以将表空间的缺省存储参数pctincrease改为非0。一般将其设为1,如:
alter tablespace temp
default storage(pctincrease 1);
---- 这样SMON便会将自由范围自动合并。也可以手工合并自由范围:
alter tablespace temp coalesce;
---- 5、段的碎片整理
---- 我们知道,段由范围组成。在有些情况下,有必要对段的碎片进行整理。要查看段的有关信息,可查看数据字典dba_segments,范围的信息可查看数据字典dba_extents。如果段的碎片过多, 将其数据压缩到一个范围的最简单方法便是用正确的存储参数将这个段重建,然后将旧表中的数据插入到新表,同时删除旧表。这个过程可以用Import/Export(输入/输出)工具来完成。
---- Export()命令有一个(压缩)标志,这个标志在读表时会引发Export确定该表所分配的物理空间量,它会向输出转储文件写入一个新的初始化存储参数--等于全部所分配空间。若这个表关闭, 则使用Import()工具重新生成。这样,它的数据会放入一个新的、较大的初始段中。例如:
exp user/password file=exp.dmp compress=Y grants=Y indexes=Y
tables=(table1,table2);
---- 若输出成功,则从库中删除已输出的表,然后从输出转储文件中输入表:
imp user/password file=exp.dmp commit=Y buffer=64000 full=Y
---- 这种方法可用于整个数据库。
---- 以上简单分析了Oracle数据库碎片的产生、计算方法及整理,仅供参考。数据库的性能优化是一项技术含量高,同时又需要有足够耐心、认真细致的工作。 对数据库碎片的一点探讨,
---- 如果能起到抛砖引玉,对大家有所启发的话,便是作者最大的心愿。
[A]Oracle 9i以上,可以监控索引的使用情况,如果一段时间内没有使用的索引,一般就是无用的索引
语法为:
开始监控:alter index index_name monitoring usage;
检查使用状态:select * from v$object_usage;
停止监控:alter index index_name nomonitoring usage;
当然,如果想监控整个用户下的索引,可以采用如下的脚本:
set heading off
set echo off
set feedback off
set pages 10000
spool start_index_monitor.sql
SELECT 'alter index '||owner||'.'||index_name||' monitoring usage;'
FROM dba_indexes
WHERE owner = USER;
spool off
set heading on
set echo on
set feedback on
------------------------------------------------
set heading off
set echo off
set feedback off
set pages 10000
spool stop_index_monitor.sql
SELECT 'alter index '||owner||'.'||index_name||' nomonitoring usage;'
FROM dba_indexes
WHERE owner = USER;
spool off
set heading on
set echo on
set feedback on