サーバートラブル発生
先々週の金曜日早朝、サーバートラブルが発生した。 普通はサーバーの再起動をかければ、復旧するのだが、、この日は再起動をかけるも復旧しなかった。。
サーバー管理会社にも調査を依頼して解析するもなかなか原因が特定できず。 最終的には新しい筐体に移転することになった。 金曜日の夜になって、なぜか復旧し、サイトの閲覧、メールの送受信などができるようになった。 復旧した理由もよくわからず。。
実は昨年末も(今回ほど深刻ではなかったが)同じような事象が発生し、サーバー交換も考えたが、とりあえず復旧したのでそのまま放置状態となっていた。。
トラブルの「前兆」
どんなトラブルでもそうだが、だいたい「前兆」がある。 その段階で適切な処置をとっておけば良いのだが、それを怠ると重傷になる。。 病気と似ている。。
で、先々週のトラブル発生以来、土日も含めて急ピッチで移転作業を行った。 メールが止まってしまったことで、お客様にご迷惑をおかけしてしまったことが何より申し訳なく 改めてサーバーというインフラを扱っていることの重大性を認識し、再発防止に努めなくてはならない。 先週一週間は、全社一丸となってその復旧(移転)作業に費やした。
サーバー障害によるダメージは多々あるが、前向きに考えると その中でも得たものはたくさんあった。
まず、ツキがある、と思ったのが、金曜日の夜にサーバーが復旧したこと。 金曜日の夜から土日は、サーバー管理会社と電話連絡もとれず、新サーバーに移行したとしても「切り替え」手続きが行えない。 そのまま復旧しなければ月曜日までサービスが止まったままになるところだった。 土日も深夜まで復旧作業を行ったが、たとえ危うい状態でもなんとか運用できている状態と、サーバーが完全に止まっている状態とでは、プレッシャーが天と地ほど違う。。 これは本当に運が良かった。
また、スタッフも本当によく対応してくれた。 サーバーまわりに詳しい者はサーバー側の復旧作業を、、その他の者はお客様対応や確認など、、手分けをして連日深夜まで対応してくれた。 本当にありがたいことで、スタッフにも毎日感謝の気持ちでいっぱいだった。 思い起こせばちょうど二年前、、似たようなことがあった、、 グアムの社員旅行から帰ってきたその日に、、サーバートラブルでサーバーを切り離す、、とのメールがサーバー管理会社から届いた。 翌日から徹夜で対応に追われ、、今では「グアムの悲劇」として(!?)語り継がれている。。(^^;
今回も多くの方に助けていただいて、、本当に感謝です。