不管后台服务程序写的多么健壮,还是可能会出现core dump等程序异常退出的情况,但是一般情况下需要在无
岱岳ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景,ssl证书未来市场广阔!成为成都创新互联的ssl证书销售渠道,可以享受市场价格4-6折优惠!如果有意向欢迎电话联系或者加微信:028-86922220(备注:SSL证书合作)期待与您的合作!人为干预情况下,能够自动重新启动,保证服务进程能够服务用户。这时就需要一个监控程序来实现能够让服务进程自动重新启动。查阅相关资料及尝试一些方法之后,总结linux系统监控重要进程的实现方法:脚本检测和子进程替换。
1、脚本检测
(1) 基本思路: 通过shell命令(ps -e | grep "$1" | grep -v "grep" | wc -l) 获取 $1 ($1 代表进程的名字)的进程数,脚本根据进程数来决定下一步的操作。通过一个死循环,每隔几秒检查一次系统中的指定程序的进程数,这里也可使用crontab来实现。
(2) 具体实现过程的代码如下: [ supervisor.sh ]
#! /bin/sh # supervisor process LOG_FILE=/var/log/supervisor_sh.log # log function function log() { local t=$(date +"%F %X") echo "[ $t ] $0 : $1 " >> ${LOG_FILE} } # check process number # $1 : process name function check_process() { if [ -z $1 ]; then log "Input parameter is empty." return 0 fi p_num=$(ps -e | grep "$1" | grep -v "grep" | wc -l) log "p_num = $p_num" echo $p_num } # supervisor process while [ 1 ] do declare -i ch_num p_name="apache2" ch_num=$(check_process $p_name) if [ $ch_num -eq 0 ]; then killall $p_name service $p_name start fi sleep 3 done