Board logo

标题: [其他] Windows批处理BAT脚本监控WebLogic的运行状态、健康状态、打开的套接字数 [打印本页]

作者: HAT    时间: 2014-9-10 12:54     标题: Windows批处理BAT脚本监控WebLogic的运行状态、健康状态、打开的套接字数

经常看到有人通过检查 PID 或者端口号是否存在来判断 WebLogic 实例是否正常。

其实那种方法是不好的。因为在实际的线上环境里面,WebLogic 实例会因为很多种原因出现异常,比如内存溢出、过载、死锁等,这个时候它的 PID 或端口都没有问题,但实际上它已经无法正常工作了,需要通过重启 WebLogic 实例才能恢复正常。

一个更加靠谱的监控方法是,在脚本里面调用 WebLogic 的命令 weblogic.Admin 来判断实例的状态。希望本文的脚本对大家有所帮助。

操作系统版本:
C:\>systeminfo | findstr /c:"OS Name"
OS Name:                   Microsoft(R) Windows(R) Server 2003 Enterprise x64 Edition


WebLogic 版本:
C:\>java weblogic.version | findstr "WebLogic"
WebLogic Server 10.3.6.0  Tue Nov 15 08:52:36 PST 2011 1441050


代码:
  1. @echo off
  2. set "CLASSPATH=D:\WebLogic\Middleware\wlserver_10.3\server\lib\weblogic.jar;%CLASSPATH%"
  3. set "PATH=D:\WebLogic\Middleware\jrockit_160_29_D1.2.0-10\bin;%PATH%"
  4. set "URL=10.135.8.188:7001"
  5. set "USER_NAME=weblogic"
  6. set "PASS_WORD=welcome1"
  7. set "DOMAIN_NAME=wl_server"
  8. set "SERVER_NAME=examplesServer"
  9. set "SERVER_INFO=%DOMAIN_NAME%:%SERVER_NAME%"
  10. set CMD_WLS_ADMIN=java weblogic.Admin -url %URL% -username %USER_NAME% -password %PASS_WORD% get -pretty -mbean "%DOMAIN_NAME%:Location=%SERVER_NAME%,Name=%SERVER_NAME%,Type=ServerRuntime"
  11. set "STATE_FILE=WLS_STATE.log"
  12. %CMD_WLS_ADMIN% | more > "%STATE_FILE%" 2>&1
  13. REM Check WebLogic instance running status
  14. findstr /c:"State: RUNNING" "%STATE_FILE%" >nul 2>&1
  15. if errorlevel 1 (
  16.     echo %URL% %DOMAIN_NAME% %SERVER_NAME% running status is not OK
  17. ) else (
  18.     echo %URL% %DOMAIN_NAME% %SERVER_NAME% running status is OK
  19. )
  20. REM Check WebLogic server health status
  21. findstr /c:"State:HEALTH_OK" "%STATE_FILE%" >nul 2>&1
  22. if errorlevel 1 (
  23.     echo %URL% %DOMAIN_NAME% %SERVER_NAME% health status is not OK
  24. ) else (
  25.     echo %URL% %DOMAIN_NAME% %SERVER_NAME% health status is OK
  26. )
  27. REM Check WebLogic open sockets number
  28. set "SOCKET_MAX=200"
  29. for /f "tokens=2" %%i in ('findstr "OpenSocketsCurrentCount" "%STATE_FILE%"') do (
  30.     set "SOCKET_NOW=%%i"
  31. )
  32. if "x%SOCKET_NOW%" equ "x" (
  33.     echo %URL% %DOMAIN_NAME% %SERVER_NAME% open sockets number is not OK: fail to get
  34. ) else (
  35.     if %SOCKET_NOW% gtr %SOCKET_MAX% (
  36.         echo %URL% %DOMAIN_NAME% %SERVER_NAME% health status is not OK: %SOCKET_NOW% greater than %SOCKET_MAX%
  37.     ) else (
  38.         echo %URL% %DOMAIN_NAME% %SERVER_NAME% health status is OK: %SOCKET_NOW% not greater than %SOCKET_MAX%
  39.     )
  40. )
  41. pause
复制代码

作者: 踏沙行    时间: 2018-6-11 08:44

回复 1# HAT
我们单位用的weblogic,就是经常出故障,每天都要挂起好几次,不知道怎么处理。
请具体指点下吗?感谢了!
作者: Batcher    时间: 2018-6-11 10:50

回复 2# 踏沙行


    估计是内存溢出,你百度一下 WebLogic OutOfMemory
作者: 踏沙行    时间: 2018-6-11 19:02

谢谢,有3点不明确
1、只用来检测内存是否溢出,参照你的代码,这样改对不?
  1. REM Check WebLogic server health status
  2. findstr /c:"OutOfMemory" "%STATE_FILE%" >nul 2>&1
  3. if errorlevel 1 (
  4.     echo %URL% %DOMAIN_NAME% %SERVER_NAME% 内存溢出
  5. ) else (
  6.     echo %URL% %DOMAIN_NAME% %SERVER_NAME% 内存正常
  7. )
复制代码
2、有时候,不显示内存溢出字样,面是屏幕不再滚动显示执行结果,最后一行显示为weblogic所在的路径,而cmd窗口是静止的。
请问,这时候怎么检测啊?
3、为什么weblogic官方不推荐使用admin呢?使用它有什么坑吗?
作者: Batcher    时间: 2018-6-11 21:50

回复 4# 踏沙行


1、不对。%STATE_FILE%是顶楼脚本自定义的一个临时日志文件名称,你需要查看的是WebLogic自己的日志文件。

2、具体原因需要查看WebLogic日志。

3、有个不完全相同但类似的例子:现在微软官方不推荐你使用XP系统(虽然还有不少人在使用)




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2