プロセス管理ツールの比較

OJT中にhsbtさんに口頭で説明して頂いた、
プロセス管理ツールについての説明をメモします。

解釈ミスにより私が間違って理解しているところがある可能性があるため
何か間違っている、もしくは足りない所があれば、指摘して頂けるととても嬉しいです。

プロセス管理ツールとは

通常、プログラムは1度走り切ると終了してしまいます。
(デーモン化もしていないのに終了しないプログラムは無限ループしていると言えます)

また、長い間走らせることを想定しているプログラムも
何かの異常が起きた場合に、望まぬ終了をしてしまう場合があります。

プロセス管理ツールは、主に上記のような問題を解決します。
つまり

  • プログラムをデーモン化し、持続して実行させる
  • 何かの異常でプログラムが落ちてしまった時に、必要であれば再起動させる

という機能を持ちます。

その他、ログを取ったり、プログラムのステータスを確認することができたりします。

また、プロセス管理ツールによって管理されているプログラムをサービスと呼びます。

daemon tools, monit, supervisord

標準でOSに付属していない、yum等で入れるプロセス管理ツールです。

標準でOSに付いてきたsysVinitはシェルスクリプトを書く必要がありましたが、
これらはその欠点を補うように、設定ファイルの記述のみでサービスを管理することができます。

ただし、CentOS7から標準で付属するsystemctlは
シェルスクリプトを書く必要が無い上に、インストールの手間もありません。

sysVinit

CentOS6以前に、OSに標準で付属していたプロセス管理ツールです。

サービスごとにランレベルというものを決めることができます。
ランレベルは以下の6種類が存在します。

  • level 0
    • シャットダウン状態
  • level 1
    • シングルユーザーモード (セーフモード)
  • level 2
    • ネットワーク機能の無いCUIマルチユーザモード
  • level 3
    • ネットワーク機能有りのCUIマルチユーザモード
  • level 4
    • カスタムモード
  • level 5
    • ネットワーク機能有りのGUIマルチユーザモード
  • level 6
    • 再起動時の状態

ランレベルを決めるということは、そのレベルで起動している際に、そのサービスを起動させるかどうかをしていするということです。
つまり、

  • ON
    • level 2
    • level 3
    • level 4
    • level 5
  • OFF
    • level 0
    • level 1
    • level 6

としている場合は、通常起動時にはそのサービスを起動し
シャットダウン・再起動・セーフモードとして起動時は、そのサービスを起動しないという設定になります。

サービスを管理させる場合は、シェルスクリプトを書く必要があります。
このシェルスクリプトは、initスクリプトと呼ばれます。

例えば、 /etc/init.d に配置されるnginxは、以下の様なinitスクリプトになっています。

nginx
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106

(略)

start() {
[ -x $nginx ] || exit 5
[ -f $NGINX_CONF_FILE ] || exit 6
echo -n $"Starting $prog: "
daemon $nginx -c $NGINX_CONF_FILE
retval=$?
echo
[ $retval -eq 0 ] && touch $lockfile
return $retval
}

stop() {
echo -n $"Stopping $prog: "
killproc $prog
retval=$?
echo
[ $retval -eq 0 ] && rm -f $lockfile
return $retval
}

restart() {
configtest_q || configtest || return 6
stop
start
}

reload() {
configtest_q || configtest || return 6
echo -n $"Reloading $prog: "
killproc $nginx -HUP
echo
}

configtest() {
$nginx -t -c $NGINX_CONF_FILE
}

configtest_q() {
configtest >/dev/null 2>&1
}

rh_status() {
status $prog
}

rh_status_q() {
rh_status >/dev/null 2>&1
}

# Upgrade the binary with no downtime.
upgrade() {
local pidfile="/var/run/${prog}.pid"
local oldbin_pidfile="${pidfile}.oldbin"

configtest_q || configtest || return 6
echo -n $"Staring new master $prog: "
killproc $nginx -USR2
retval=$?
echo
sleep 1
if [[ -f ${oldbin_pidfile} && -f ${pidfile} ]]; then
echo -n $"Graceful shutdown of old $prog: "
killproc -p ${oldbin_pidfile} -QUIT
retval=$?
echo
return 0
else
echo $"Something bad happened, manual intervention required, maybe restart?"
return 1
fi
}

case "$1" in
start)
rh_status_q && exit 0
$1
;;
stop)
rh_status_q || exit 0
$1
;;
restart|configtest)
$1
;;
force-reload|upgrade)
rh_status_q || exit 7
upgrade
;;
reload)
rh_status_q || exit 7
$1
;;
status|status_q)
rh_$1
;;
condrestart|try-restart)
rh_status_q || exit 7
restart
;;
*)
echo $"Usage: $0 {start|stop|reload|configtest|status|force-reload|upgrade|restart}"
exit 2
esac

これを見て分かる通り、 service nginx start/etc/init.d/nginx start とすることは
このinitスクリプトの start() を実行しているということと同じ意味になります。

そのため、自作のサービスを登録する際は、このinitスクリプトを書く必要があります。

systemd

CentOS7以降に、OSに標準で付属するようになったプロセス管理ツールです。
sysVinitのようにinitスクリプトを書く必要がなく、設定ファイルのみの用意でサービスを管理することができます。

sysVinitでは、サービスをスクリプト単位で管理していましたが
systemdではUnitと呼ばれる単位で管理します。

systemdはsysVinitの機能に加え、様々な機能が備わっています。
以下、その機能の例です。

  • サービス間の関係を定義することができる
    • このサービスが起動する際はこのサービスも一緒に起動する、ということが指定可能
    • サービスの起動順序も定義可能
  • 複数のUnitを1つのUnitとしてまとめることができる
    • target Unitと呼ばれる

sysVinitと互換性があり、systemdの systemctl コマンドを利用した際は、以下のように処理されます。

  1. systemd管理下のサービスの中に、指定されたサービスが存在するかを調べる
  2. systemd管理下に存在していれば systemctl コマンドで指定された挙動を行う (終了)
  3. systemd管理下に存在しなければ、sysVinit管理下のサービスの中に、指定されたサービスが存在するかを調べる
  4. sysVinit管理下に存在していれば、 systemctl で指定されたコマンドを chkconfig 等のコマンドに置き換え、指定された挙動を行う (終了)
  5. sysVinit管理下に存在しなければ、存在しないサービスであると判定する (終了)