Zenlogic サーバー高負荷障害

Zenlogicの一部サーバーにて6月19日の夕方から高負荷障害が発生しており、半月経った今も現在進行中のようです。サーバーを運用管理しているエンジニアとしては他人事とは思えず(対岸の火事とは思っていない。明日は我が身なのだから。)、早急に事態が収束することを願うばかりです。

企業の本質は障害発生時の対応でよく判る

とは言え今回の障害で、かなりの数のユーザーが他社サービスに移行していくのが目に見えます。Twitterではハッシュタグ #Zenlogicでユーザーの困惑している様子がわかります。障害への対応力と言いますか、「障害が発生することが前提」と「障害が発生しないことが前提」ではサーバーの運用管理はかなり違うものになります。

  • いつ発生するか判らない障害というものへの備えとして時間と労力を費やせるか
  • 安定稼働しているのは偶然ではなく、エンジニアの努力の賜物という必然である

何事もなく動くのが当たり前で、障害が発生するとお客様だけでなく身内の営業からまで「何やってんだ!」と怒鳴られるエンジニアは理不尽な職種だと思いますよ、はい。それも相応の給料を貰っているエンジニアなら我慢できるかもしれませんが、薄給だったら嫌になって辞めてしまうだろうなぁ。