Sun Apr 03, 2005 [長年日記]

#1 [nadare.net] white その後...

いろいろと苦労した後、RAID1 への移行が完了した white でありますが、今度はマルチユーザモードで動かすと、あれこれ動かないサービスがあるという現象が発生しました。

調べたところ、利用者を切り替えて起動するサービスがことごとくダメということが判り、これは su が上手く動作していないのだろうということで、su コマンドの strace を取って調査開始。どうも PAM のモジュールを読み込んだ後、その後のファイルアクセスがことごとく EACCES となるようで、PAM モジュールが壊れたか、ファイルの権限設定に間違ったところがあるのか、その辺りだろうということで引き続き調査。

同じ distro を使っている powder と PAM モジュールを比較。サイズ、md5sum とも同じ値。では su が使いそうなファイルシステムかということで、/etc 周りのファイルをチェック。これも異常無し。

過去にマウントディレクトリのマウントする前の権限が問題で、ファイルが作れなかったことがあったので、/home や /var といったマウントディレクトリの権限を調べることにし、再び Fedora のインストールCDで起動。既存システム検索のところまで進めて ALT+F2 でコンソールに切り替え、RAID1 のルートデバイスをマウントして、各種マウントディレクトリの権限を調査。これも問題無し。

RAID のファイルシステムを全てマウントした後、chroot で RAID のルートデバイスに移り、su コマンドを実行してみると、やっぱりダメ。うーん何故だろう... と暫く思考。で、気付いた。一つ調べていないディレクトリがあったことを。早速調べてみたところ、そのディレクトリのパーミッションは 700 (rwx------)でありました。そう。ルートデバイスの / が 700 だったのです。こいつを 755 に変更した後 exit し、RAID 上のファイルシステムを全て umount して Ctrl+Alt+Del で再起動。

これで全てのサービスが起動できるようになりました(本当は /tmp が 755 になってて postgresql の起動失敗があったけど、すぐ気付いたから無かったことにします :-p)

#2 [nadare.net] white 復活

えー、報告を書く前にツッコミ入れられちゃってますが、午前1時半頃、サーバールームに white を戻し、再起動して、サービスを再開しました。1日で作業が終わる予定だったのが、予期せぬトラブルにより2日掛かってしまいましたが、なんとか復旧しました。

データは全て写し、問題なくサービスできるようにしたつもりですが、完全かどうか解りませんので、何か不都合がありましたら、御報告よろしくお願いいたします。

本日のツッコミ(全3件) [ツッコミを入れる]
1 SAYAKA (Mon Apr 04, 2005 01:58)

さきほど、日記を更新させていただきました。ありがとうございました。あんど、お疲れ様でした。<br>なんか、前よりもさくさくっと表示されて快適です。

2 あきし〜 (Mon Apr 04, 2005 06:17)

おつかれさまでした。確かに以前よりさくっと表示されますね。

3 8 (Mon Apr 04, 2005 07:40)

ここは特定の個人の膨大な時間と労力の賜で動いていることを忘れず感謝しながら楽しませてもらいます。ありがとう。

[]

«前の日記(Thu Mar 31, 2005) 最新 次の日記(Sun May 01, 2005)»