最近生产上有个系统服务进程总是会莫名其妙的消失。
监控了各种日志,没有发现oom kill,或者outofmemory等情况的。
求各路大神指教!
服务器情况:
1.做了RW的负载均衡,共2台服务器
2.做了集群部署,2台服务器共用一个weblogic域。
3.每台服务器都启动了4个进程。问题描述:
      1.进程消失发生的时间是在业务高发时期,服务器上4个进程中,只死掉1个进程,而且每次都是同一个。
2.根据日志记录,每次消失之前都在做数据的excel导出操作,但是不是每次导出都会挂掉。
3.导出的实现方法也询问了公司的各位大牛,都看不出有什么问题。以下是服务挂掉之前的日志片段
 [GC 1074337K->242500K(2599936K), 0.0116850 secs]
2018-11-21 16:44:05,553 [[ACTIVE] ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)' - ynbtG09SRvDF] INFO  c.h.s.c.ScubeClientCaller - 远程服务请求完成 >>> RequestId:[rpc-2cb09f91-72e1-4c42-9b94-0ab623ea972b], 服务:[com.huateng.nbms.htes.api.busi.service.ExtIDpcQueryService->queryAmountForExport], 耗时: 704 ms
16:44:06.180 INFO  193 receive - ShcpeMQClient->receive QUEUE_TYPE = RQ_600_NAME...
16:44:06.180 DEBUG 254 receive - [_DMQS] Use existing consumer for destination QOUT.M388100000.000 selector 
[GC 306622K->242703K(2601472K), 0.0082280 secs]
[Full GC 242703K->216296K(2601472K), 1.0792790 secs]
[Dynamic-linking native method sun.awt.X11GraphicsEnvironment.getNumScreens ... JNI]
[Dynamic-linking native method sun.awt.X11GraphicsDevice.initIDs ... JNI]
[Dynamic-linking native method sun.awt.X11GraphicsEnvironment.getDefaultScreenNum ... JNI]
[Dynamic-linking native method sun.awt.X11GraphicsDevice.getConfigVisualId ... JNI]
p1= nbms-htesprdserver0231
p2= http://10.20.156.32:15120
LD_LIBRARY_PATH=/wls11/bea1036/wlserver_10.3/server/native/linux/x86_64:/wls11/bea1036/wlserver_10.3/server/native/linux/x86_64/oci816_8