真ん中が一番いい

行雲流水が好き

システム障害が起こってしまったときのモチベーションの保ち方について

TL;DR

障害は悪だが、障害発生時には「障害は悪」という姿勢を一旦払拭すること。

導入

システム障害なんて、誰もが避けたいはず。
システムを利用しているユーザはもちろん、システムを提供しているベンダーは利用者への謝罪、即時復旧、即時復旧後も原因の追求であったり、恒久対策の検討、実施、その後も定期的な予後観察・・・
こんなの絶対関わりたくないと思っていても、エンジニアとして働いていれば必ず一度は直面することになる。
そういった状況下でのモチベーションの保ち方を考えてみた。 

障害が発生した時のモチベーションの保ち方3つ

重く受け取りすぎない

対応時には、とんでもない障害が発生してしまった・・・と感じることでも、後々振り返ってみると、そうでもなかった、なんてことはザラにある。
おそらく、障害って基本的には突然やってくるものだから、その通常時との落差が錯覚させて何事も重く受け止めてしまうのだと思う。
重く受け取りすぎず、一旦深呼吸をして、脳内を下記のモードにスイッチしよう。

「貴重な経験だ」と考える

障害対応って、基本的にはイレギュラーなことなのだから、ある意味貴重な経験であることは間違いない。
自分をドラクエの主人公だと例えると、障害対応ははぐれメタルとの遭遇に似ている。
なかなか遭遇しないぶん、たおすとたくさん経験値がもらえる。
対応中は積極的に関わって、自分自身のエンジニア経験値の肥やしにしてやる、位の気概で取り組むことができれば、今後のためにもなりそう。

なお、一部始終を後々振り返られるように、何が原因で、どういう対応をしたか。また、こうしておけばもっと良かった、などは自分自身でちゃんと記録しておくべき。(対外向けの報告書とは別に、自分の言葉で書くのが大事。)

一体感を楽しむ

これの現象は人によるかもしれないが、
障害が発生したとき、チーム全体が「障害を解消する」という共通の目的意識を持つようになり、チームに一体感が生まれることがある。
こうなると、復旧対応や、嫌な顧客対応もなぜか楽しくなってくることがある。 こうなるともう無敵だと思う。

なお、この「一体化現象」はいつも発生するわけではなく、もともとのチームの文化に依存する。 普段からコミュニケーションが活発なチームほど、このパターンになりやすいと感じる。 チームのコミュニケーションの重要さは、普段の開発フェーズはもちろん、こういったところにも影響するのだと思う。  

最後に

システムを提供する立場として、障害は悪であることに変わりはないし、普段からそういう気持ちで業務に臨む必要がある。
しかし、障害が起きないシステムなんて聞いたことはない。
障害が発生してしまったときは、上記の「障害は悪」モードを持ち続けるのではなく頭をスイッチして取り組むことが大事。