大規模なインターネットアクセス障害

昨日の午後は一部のインターネットサイトへアクセス出来なくなる障害が発生しました。最初に障害に気が付いたのは、DNSの名前解決が出来なくなったことでした。DNSサーバはGoogle Public DNSを利用していたのですが、障害の切り分けでGoogle Public DNSへ問い合わせをしてもまったく応答がないことがわかりました。ただし、Pingに対しては応答があったので、

Google Public DNSがサービスダウンしているのだろう

と簡単に考えていました。ルーターのDNS設定をGoogle Public DNSからインターネット接続(PPPoE接続)で割り当てられるDNSサーバに切り替えてみると、名前解決は問題なく出来ましたから。このとき、このサイトも新規で投稿した記事のサムネイルが表示されない問題が発生しました。サムネイルの再作成なども行ってみましたが、解決できず。プラグインJetpackで何か問題が発生しているのなら、そのうち解決するだろうと思って放置しました(笑)。


勤務している会社が絡む問題としては、さくらインターネット上に構築したメールサーバにて、「451 DNS temporary failure」エラーが発生してメールが送信できないとの苦情が入りました。たった1件のユーザーだけでしたけど。

Google Public DNS以外でもDNSの名前解決に問題が発生しており(MXレコードが引けないと、メールを送信できない)、エラーが発生しているのが原因でした。全部のメールを送信できないわけではなく、その多くはGmail宛のメールだったり、DNSキャッシュが切れたドメインのメールでした。

この障害の原因はOCNやKDDIの設備ではなく、[続報]OCNの通信障害、米グーグルによる誤った経路情報の大量送信が原因かという情報があります。日本国内でも経路情報による大規模障害としてはNTT東日本のルータ2000台が3秒でダウン 「フレッツ」「ひかり電話」大規模障害がありました。文中にある「ルート情報」は「経路情報」と同じ意味です。もうあれから10年が経つのですねぇ。あのときは今回のときよりも障害の度合いが酷かった気がする。。。フレッツ網が使えないので、ISDNのダイアルアップでインターネットに接続したような。。。

これって上位キャリアに悪意を持った技術者がいると、一瞬でインターネットをダウンさせられるんだよね。。。

ネットワークをダウンさせるには凶器もケーブルを抜く必要はなく。狂気を持って誤った経路情報を流せば一発よ!