我有三个程序,程序算是同一个EXE,某些端口不同而已。
每个程序分别创建了一个SOCKET监听,也创建了一个到ORACLE的连接。SOCKET接受数据,处理后填入ORACLE,填写是用存储过程来实现的,操作的表也是一样的。
现在问题是,我的第二个程序总是会在大概第三天断开连接,而且与ORACLE的连接也不活动,ORACLE占用CPU骤升到60%,此时另外两个程序仍在正常运行,一小时后CPU升到100%。
我在操作系统中杀掉第二个进程,在ORACLE中KILL第二个连接,CPU仍不下降。查了v$locked_object也没有死锁,问题(1):我想知道ORACLE的60%CPU它到底在干什么?有什么办法?
还有,我重新运行第二个程序,居然socket.bind失败,用netstat并没看到有那个端口,问题(2):有没有办法不用注销/不用重启就能解决bind失败问题的?
我观察了一个月了,也还是黔驴技穷,只得到上面的信息。它为什么偏偏每次都是第二个程序在三天后出这种莫名其秒的事情,望各位高手各抒已见。我的最终目的,就是要让系统在无人干预的情况下长久稳定的运行,无论采用什么手段都行。
我也试过另做一个监控程序,发现系统异常时就重启电脑,但也很麻烦,因为老是重启不成功,导致系统更糟问题(3):谁有比较历害的重启电脑函数,只要保证操作系统不坏,ORACLE数据库不坏(因为此时ORACLE处于异常状态),又能保证重启成功的(因为CPU很高,经常有些东西会弹出立即结束那种对话框,不是随便搞个给权限再ExitWindow就可以搞定的)。
谢谢!!

解决方案 »

  1.   

    还有,我把我的应用全部都关掉了,ORACLE的CPU还是60%,ORACLE的会话还剩一个关不掉它,用alter system kill session,用orakill全都不行,它到底在干什么呀??
      

  2.   

    select * from session;
    查看这个数据字典,看会话的情况。
      

  3.   

    论坛中有位老兄贴的,忘了是谁了~1. 监控事例的等待 select event,sum(decode(wait_Time,0,0,1)) "Prev", 
    sum(decode(wait_Time,0,1,0)) "Curr",count(*) "Tot" 
    from v$session_Wait 
    group by event order by 4; 2. 回滚段的争用情况 select name, waits, gets, waits/gets "Ratio" 
    from v$rollstat a, v$rollname b 
    where a.usn = b.usn; 3. 监控表空间的 I/O 比例 select df.tablespace_name name,df.file_name "file",f.phyrds pyr, 
    f.phyblkrd pbr,f.phywrts pyw, f.phyblkwrt pbw 
    from v$filestat f, dba_data_files df 
    where f.file# = df.file_id 
    order by df.tablespace_name; 4. 监控文件系统的 I/O 比例 select substr(a.file#,1,2) "#", substr(a.name,1,30) "Name", 
    a.status, a.bytes, b.phyrds, b.phywrts 
    from v$datafile a, v$filestat b 
    where a.file# = b.file#; 5.在某个用户下找所有的索引 select user_indexes.table_name, user_indexes.index_name,uniqueness, column_name 
    from user_ind_columns, user_indexes 
    where user_ind_columns.index_name = user_indexes.index_name 
    and user_ind_columns.table_name = user_indexes.table_name 
    order by user_indexes.table_type, user_indexes.table_name, 
    user_indexes.index_name, column_position; 6. 监控 SGA 的命中率 select a.value + b.value "logical_reads", c.value "phys_reads", 
    round(100 * ((a.value+b.value)-c.value) / (a.value+b.value)) "BUFFER HIT RATIO" 
    from v$sysstat a, v$sysstat b, v$sysstat c 
    where a.statistic# = 38 and b.statistic# = 39 
    and c.statistic# = 40; 7. 监控 SGA 中字典缓冲区的命中率 select parameter, gets,Getmisses , getmisses/(gets+getmisses)*100 "miss ratio", 
    (1-(sum(getmisses)/ (sum(gets)+sum(getmisses))))*100 "Hit ratio" 
    from v$rowcache 
    where gets+getmisses <>0 
    group by parameter, gets, getmisses; 8. 监控 SGA 中共享缓存区的命中率,应该小于1% select sum(pins) "Total Pins", sum(reloads) "Total Reloads", 
    sum(reloads)/sum(pins) *100 libcache 
    from v$librarycache; select sum(pinhits-reloads)/sum(pins) "hit radio",sum(reloads)/sum(pins) "reload percent" 
    from v$librarycache; 9. 显示所有数据库对象的类别和大小 select count(name) num_instances ,type ,sum(source_size) source_size , 
    sum(parsed_size) parsed_size ,sum(code_size) code_size ,sum(error_size) error_size, 
    sum(source_size) +sum(parsed_size) +sum(code_size) +sum(error_size) size_required 
    from dba_object_size 
    group by type order by 2; 10. 监控 SGA 中重做日志缓存区的命中率,应该小于1% SELECT name, gets, misses, immediate_gets, immediate_misses, 
    Decode(gets,0,0,misses/gets*100) ratio1, 
    Decode(immediate_gets+immediate_misses,0,0, 
    immediate_misses/(immediate_gets+immediate_misses)*100) ratio2 
    FROM v$latch WHERE name IN ('redo allocation', 'redo copy'); 11. 监控内存和硬盘的排序比率,最好使它小于 .10,增加 sort_area_size SELECT name, value FROM v$sysstat WHERE name IN ('sorts (memory)', 'sorts (disk)'); 
    12. 监控当前数据库谁在运行什么SQL语句 SELECT osuser, username, sql_text from v$session a, v$sqltext b 
    where a.sql_address =b.address order by address, piece; 13. 监控字典缓冲区 SELECT (SUM(PINS - RELOADS)) / SUM(PINS) "LIB CACHE" FROM V$LIBRARYCACHE; 
    SELECT (SUM(GETS - GETMISSES - USAGE - FIXED)) / SUM(GETS) "ROW CACHE" FROM V$ROWCACHE; 
    SELECT SUM(PINS) "EXECUTIONS", SUM(RELOADS) "CACHE MISSES WHILE EXECUTING" FROM V$LIBRARYCACHE; 后者除以前者,此比率小于1%,接近0%为好。 SELECT SUM(GETS) "DICTIONARY GETS",SUM(GETMISSES) "DICTIONARY CACHE GET MISSES" 
    FROM V$ROWCACHE 14. 找ORACLE字符集 select * from sys.props$ where name='NLS_CHARACTERSET'; 15. 监控 MTS select busy/(busy+idle) "shared servers busy" from v$dispatcher; 此值大于0.5时,参数需加大 select sum(wait)/sum(totalq) "dispatcher waits" from v$queue where type='dispatcher'; 
    select count(*) from v$dispatcher; 
    select servers_highwater from v$mts; servers_highwater接近mts_max_servers时,参数需加大 16. 碎片程度 select tablespace_name,count(tablespace_name) from dba_free_space group by tablespace_name 
    having count(tablespace_name)>10; alter tablespace name coalesce; 
    alter table name deallocate unused; create or replace view ts_blocks_v as 
    select tablespace_name,block_id,bytes,blocks,'free space' segment_name from dba_free_space 
    union all 
    select tablespace_name,block_id,bytes,blocks,segment_name from dba_extents; select * from ts_blocks_v; select tablespace_name,sum(bytes),max(bytes),count(block_id) from dba_free_space 
    group by tablespace_name; 查看碎片程度高的表 SELECT segment_name table_name , COUNT(*) extents 
    FROM dba_segments WHERE owner NOT IN ('SYS', 'SYSTEM') GROUP BY segment_name 
    HAVING COUNT(*) = (SELECT MAX( COUNT(*) ) FROM dba_segments GROUP BY segment_name); 17. 表、索引的存储情况检查 select segment_name,sum(bytes),count(*) ext_quan from dba_extents where 
    tablespace_name='&tablespace_name' and segment_type='TABLE' group by tablespace_name,segment_name; select segment_name,count(*) from dba_extents where segment_type='INDEX' and owner='&owner' 
    group by segment_name; 18、找使用CPU多的用户session 12是cpu used by this session select a.sid,spid,status,substr(a.program,1,40) prog,a.terminal,osuser,value/60/100 value 
    from v$session a,v$process b,v$sesstat c 
    where c.statistic#=12 and c.sid=a.sid and a.paddr=b.addr order by value desc;
      

  4.   

    存储过程中没有循环,只有if...else..我把服务器做成天天晚上自动重启了,这些天都没什么问题,实在不想再折腾那个死锁问题了。
      

  5.   

    这是很正常的,一般情况下每个数据占系统可用内存的55%-57%
    这在9I中更加突出,这也是ORACLE公司的说明
    除非非你把它shutdown