我有三个程序,程序算是同一个EXE,某些端口不同而已。
每个程序分别创建了一个SOCKET监听,也创建了一个到ORACLE的连接。SOCKET接受数据,处理后填入ORACLE,填写是用存储过程来实现的,操作的表也是一样的。
现在问题是,我的第二个程序总是会在大概第三天断开连接,而且与ORACLE的连接也不活动,ORACLE占用CPU骤升到60%,此时另外两个程序仍在正常运行,一小时后CPU升到100%。
我在操作系统中杀掉第二个进程,在ORACLE中KILL第二个连接,CPU仍不下降。查了v$locked_object也没有死锁,问题(1):我想知道ORACLE的60%CPU它到底在干什么?有什么办法?
还有,我重新运行第二个程序,居然socket.bind失败,用netstat并没看到有那个端口,问题(2):有没有办法不用注销/不用重启就能解决bind失败问题的?
我观察了一个月了,也还是黔驴技穷,只得到上面的信息。它为什么偏偏每次都是第二个程序在三天后出这种莫名其秒的事情,望各位高手各抒已见。我的最终目的,就是要让系统在无人干预的情况下长久稳定的运行,无论采用什么手段都行。
我也试过另做一个监控程序,发现系统异常时就重启电脑,但也很麻烦,因为老是重启不成功,导致系统更糟问题(3):谁有比较历害的重启电脑函数,只要保证操作系统不坏,ORACLE数据库不坏(因为此时ORACLE处于异常状态),又能保证重启成功的(因为CPU很高,经常有些东西会弹出立即结束那种对话框,不是随便搞个给权限再ExitWindow就可以搞定的)。
谢谢!!
每个程序分别创建了一个SOCKET监听,也创建了一个到ORACLE的连接。SOCKET接受数据,处理后填入ORACLE,填写是用存储过程来实现的,操作的表也是一样的。
现在问题是,我的第二个程序总是会在大概第三天断开连接,而且与ORACLE的连接也不活动,ORACLE占用CPU骤升到60%,此时另外两个程序仍在正常运行,一小时后CPU升到100%。
我在操作系统中杀掉第二个进程,在ORACLE中KILL第二个连接,CPU仍不下降。查了v$locked_object也没有死锁,问题(1):我想知道ORACLE的60%CPU它到底在干什么?有什么办法?
还有,我重新运行第二个程序,居然socket.bind失败,用netstat并没看到有那个端口,问题(2):有没有办法不用注销/不用重启就能解决bind失败问题的?
我观察了一个月了,也还是黔驴技穷,只得到上面的信息。它为什么偏偏每次都是第二个程序在三天后出这种莫名其秒的事情,望各位高手各抒已见。我的最终目的,就是要让系统在无人干预的情况下长久稳定的运行,无论采用什么手段都行。
我也试过另做一个监控程序,发现系统异常时就重启电脑,但也很麻烦,因为老是重启不成功,导致系统更糟问题(3):谁有比较历害的重启电脑函数,只要保证操作系统不坏,ORACLE数据库不坏(因为此时ORACLE处于异常状态),又能保证重启成功的(因为CPU很高,经常有些东西会弹出立即结束那种对话框,不是随便搞个给权限再ExitWindow就可以搞定的)。
谢谢!!
查看这个数据字典,看会话的情况。
sum(decode(wait_Time,0,1,0)) "Curr",count(*) "Tot"
from v$session_Wait
group by event order by 4; 2. 回滚段的争用情况 select name, waits, gets, waits/gets "Ratio"
from v$rollstat a, v$rollname b
where a.usn = b.usn; 3. 监控表空间的 I/O 比例 select df.tablespace_name name,df.file_name "file",f.phyrds pyr,
f.phyblkrd pbr,f.phywrts pyw, f.phyblkwrt pbw
from v$filestat f, dba_data_files df
where f.file# = df.file_id
order by df.tablespace_name; 4. 监控文件系统的 I/O 比例 select substr(a.file#,1,2) "#", substr(a.name,1,30) "Name",
a.status, a.bytes, b.phyrds, b.phywrts
from v$datafile a, v$filestat b
where a.file# = b.file#; 5.在某个用户下找所有的索引 select user_indexes.table_name, user_indexes.index_name,uniqueness, column_name
from user_ind_columns, user_indexes
where user_ind_columns.index_name = user_indexes.index_name
and user_ind_columns.table_name = user_indexes.table_name
order by user_indexes.table_type, user_indexes.table_name,
user_indexes.index_name, column_position; 6. 监控 SGA 的命中率 select a.value + b.value "logical_reads", c.value "phys_reads",
round(100 * ((a.value+b.value)-c.value) / (a.value+b.value)) "BUFFER HIT RATIO"
from v$sysstat a, v$sysstat b, v$sysstat c
where a.statistic# = 38 and b.statistic# = 39
and c.statistic# = 40; 7. 监控 SGA 中字典缓冲区的命中率 select parameter, gets,Getmisses , getmisses/(gets+getmisses)*100 "miss ratio",
(1-(sum(getmisses)/ (sum(gets)+sum(getmisses))))*100 "Hit ratio"
from v$rowcache
where gets+getmisses <>0
group by parameter, gets, getmisses; 8. 监控 SGA 中共享缓存区的命中率,应该小于1% select sum(pins) "Total Pins", sum(reloads) "Total Reloads",
sum(reloads)/sum(pins) *100 libcache
from v$librarycache; select sum(pinhits-reloads)/sum(pins) "hit radio",sum(reloads)/sum(pins) "reload percent"
from v$librarycache; 9. 显示所有数据库对象的类别和大小 select count(name) num_instances ,type ,sum(source_size) source_size ,
sum(parsed_size) parsed_size ,sum(code_size) code_size ,sum(error_size) error_size,
sum(source_size) +sum(parsed_size) +sum(code_size) +sum(error_size) size_required
from dba_object_size
group by type order by 2; 10. 监控 SGA 中重做日志缓存区的命中率,应该小于1% SELECT name, gets, misses, immediate_gets, immediate_misses,
Decode(gets,0,0,misses/gets*100) ratio1,
Decode(immediate_gets+immediate_misses,0,0,
immediate_misses/(immediate_gets+immediate_misses)*100) ratio2
FROM v$latch WHERE name IN ('redo allocation', 'redo copy'); 11. 监控内存和硬盘的排序比率,最好使它小于 .10,增加 sort_area_size SELECT name, value FROM v$sysstat WHERE name IN ('sorts (memory)', 'sorts (disk)');
12. 监控当前数据库谁在运行什么SQL语句 SELECT osuser, username, sql_text from v$session a, v$sqltext b
where a.sql_address =b.address order by address, piece; 13. 监控字典缓冲区 SELECT (SUM(PINS - RELOADS)) / SUM(PINS) "LIB CACHE" FROM V$LIBRARYCACHE;
SELECT (SUM(GETS - GETMISSES - USAGE - FIXED)) / SUM(GETS) "ROW CACHE" FROM V$ROWCACHE;
SELECT SUM(PINS) "EXECUTIONS", SUM(RELOADS) "CACHE MISSES WHILE EXECUTING" FROM V$LIBRARYCACHE; 后者除以前者,此比率小于1%,接近0%为好。 SELECT SUM(GETS) "DICTIONARY GETS",SUM(GETMISSES) "DICTIONARY CACHE GET MISSES"
FROM V$ROWCACHE 14. 找ORACLE字符集 select * from sys.props$ where name='NLS_CHARACTERSET'; 15. 监控 MTS select busy/(busy+idle) "shared servers busy" from v$dispatcher; 此值大于0.5时,参数需加大 select sum(wait)/sum(totalq) "dispatcher waits" from v$queue where type='dispatcher';
select count(*) from v$dispatcher;
select servers_highwater from v$mts; servers_highwater接近mts_max_servers时,参数需加大 16. 碎片程度 select tablespace_name,count(tablespace_name) from dba_free_space group by tablespace_name
having count(tablespace_name)>10; alter tablespace name coalesce;
alter table name deallocate unused; create or replace view ts_blocks_v as
select tablespace_name,block_id,bytes,blocks,'free space' segment_name from dba_free_space
union all
select tablespace_name,block_id,bytes,blocks,segment_name from dba_extents; select * from ts_blocks_v; select tablespace_name,sum(bytes),max(bytes),count(block_id) from dba_free_space
group by tablespace_name; 查看碎片程度高的表 SELECT segment_name table_name , COUNT(*) extents
FROM dba_segments WHERE owner NOT IN ('SYS', 'SYSTEM') GROUP BY segment_name
HAVING COUNT(*) = (SELECT MAX( COUNT(*) ) FROM dba_segments GROUP BY segment_name); 17. 表、索引的存储情况检查 select segment_name,sum(bytes),count(*) ext_quan from dba_extents where
tablespace_name='&tablespace_name' and segment_type='TABLE' group by tablespace_name,segment_name; select segment_name,count(*) from dba_extents where segment_type='INDEX' and owner='&owner'
group by segment_name; 18、找使用CPU多的用户session 12是cpu used by this session select a.sid,spid,status,substr(a.program,1,40) prog,a.terminal,osuser,value/60/100 value
from v$session a,v$process b,v$sesstat c
where c.statistic#=12 and c.sid=a.sid and a.paddr=b.addr order by value desc;
这在9I中更加突出,这也是ORACLE公司的说明
除非非你把它shutdown