こんにちは、Daniel (@daniel__blog) です。
2021年2月19日23時50分頃から2月20日朝にかけて、AWSで以下の障害が発生しました。
米アマゾン・ウェブ・サービス(Amazon Web Services、AWS)が提供するクラウドサービスで発生したシステム障害は2021年2月20日朝までに大部分が復旧した。原因は東京リージョンのアベイラビリティーゾーン内にある冷却システムの電力喪失にある。暗号資産(仮想通貨)のビットコインの価格が上昇するなか、仮想通貨交換業のコインチェックは全サービス停止に追い込まれた。
日経クロステック『AWS障害は冷却システムの電力喪失が原因、コインチェックは全サービス停止』
原因は「東京リージョンのアベイラビリティーゾーン内にある冷却システムの電力喪失」とのことでした。5時間ほどで復旧したそうですが、複数のソーシャルゲームなど多くの業務システムにも影響が出ました。
このようなAWS障害が発生した場合、最新の情報収集はどこから行えばよいのでしょうか?
結論から言うと、僕はAWS公式の「サービスヘルスダッシュボード」を確認しています。
この記事では、この「サービスヘルスダッシュボード」についてご紹介し、その他の情報源についても触れます。
- ・AWS障害時の最新情報は何を見ればよいのか?
- ・AWSのサービスヘルスダッシュボードとは?
- ・東京リージョンの現在のステータスの確認方法
Contents
AWS障害時に役立つ、サービスヘルスダッシュボードとは?
サービスヘルスダッシュボードとは、AWS上で稼働するサービスの可用性に関して最新情報を表にして公開しているAWS公式のページです。
つまり、AWS公式上の最新の一次情報はこちらを確認すれば良いというわけです。
参考 Service Health Dashboardhttps://status.aws.amazon.com
表は各リージョンごとに分かれてます。各リージョンが所属する地域のタブを選択することで、それぞれ現在のステータス情報を取得できます。
また、日付と時刻はすべて太平洋標準時(PST / PDT)で表示されます。
東京リージョンのステータス確認方法
まず、前述の以下サイトに接続します。
参考 Service Health Dashboardhttps://status.aws.amazon.com
「Asia Pacific」タブをクリックします。(⬇)
香港、シンガポールなど、アジア太平洋地域の各リージョンの項目が並んでいます。どこかで障害が起きていれば、一番上の「Recent Events」にその情報が表示されます。
確認した時点では、全て正常に稼働していたので「✅ No recent events.」と表示されていました。(⬇)
AWS障害時、ダッシュボードはどんな表示になるの?(実際の画面)
スマホで開いてみると、以下の通り表示されます。
「Recent Events」内に「Amazon Elastic Compute Cloud (Tokyo)」と表示されており、この時、東京リージョンのEC2サービスにて障害が発生していることが分かります。(⬇)
情報は適宜アップデートされていきます。以下の画面では、「7:09 AM PST(日本時刻 2021年02月20日(土) 00:09)」の情報の後に「7:58 AM PST(日本時刻 2021年02月20日(土) 00:58)」が追加されていることが分かります。(⬇)
なお、日付と時刻はすべて太平洋標準時(PST / PDT)で表示されるので、日本時刻との時差は17時間です。
以下の画面は「8:40 AM PST(日本時刻 2021年02月20日(土) 01:40)」の更新内容。
「温度の上昇は、当該セクション内の冷却システムへの電力の損失によって発生」した旨、「電源の回復に取り組んでおりこれまでに冷却システムの1つを正常に復旧させた」旨が書かれています。
以下の画面は「9:43 AM PST(日本時刻 2021年02月20日(土) 02:43)」の更新内容。
「当該セクション内のいくつかの冷却ユニットの電力はすでに復元しており、温度が低下し始めていることを確認」している旨、「引き続き作業を続け、温度を通常レベルに戻し」ている旨が書かれています。
AWS障害時のその他の情報源
ツイッター
ハッシュタグ「#AWS障害」 を検索する
AWS障害発生時には多くの方がツイートされます。中には、投稿者の意図とは無関係に不確かな情報が発信されていることもあるので、扱いには注意が必要です。
今回は以上です!
最後までお読み頂きありがとうございました。