QUICKGUARD ホームページ >

AWS大規模障害について

2019.08.24

代表取締役の栗原です。

昨日発生したAWS大規模障害は、弊社のお客様でも広範囲にわたり影響があり、復旧支援と障害アラートの対応で深夜まで対応に追われました。
全部で約1万近いアラートを実際に影響があるかないかなど確認をしていき、サービスの復旧処理を手伝いつつ、お客様に情報共有をする作業など優先順位をどんどん入れ替えしながらの作業は、初めて経験するスタッフには良い経験になったかもしれません。

私達が提供しているサービスは、お客様サービスを継続させていくお手伝いですので、何よりも復旧を優先に考えて行動しつつ、不安を取り除く難しい裏方の仕事です。

遅くまで作業に当たってくれたスタッフにも感謝、サービス切り替えと動作検証を一緒に取り組んでくれたお客様にも感謝。そしてインフラは止めないように運用を考えて設計しないとダメだという事を改めて考えるきっかけになったと思います。

AWS内部のスタッフの方々も大変だったと思いますが「1日以内での復旧はさすがだな」と、同じ業種にいる人間として思った1日でした。