BlogCEOブログ書いてます
2024/07/22

「経済と健康に打撃を与えたプログラム」

青い画面、いわゆるブルースクリーンを見ると、業界の人は青ざめます。OSに不具合が起きたときに表示されるこの画面は、システムが動いていないことを瞬時に理解させてくれます。

7月19日、世界中でブルースクリーンが発生するという前代未聞の大規模障害が発生しました。ネットワークに繋がることが当たり前の時代には、障害もネットワーク化するのですね。

これはクラウドストライクというセキュリティ会社が引き起こした障害です。クラウドストライクは端末側でセキュリティ脅威を発見する(EPP)もしくは発見+対応する(EDR)機能を提供しています。この会社の商品はPCやサーバだけでなく、ルーターやIoTディバイスにも利用されているのが特徴です。

クラウドストライク社のサービスは、178カ国18000社以上の企業が利用しており、日本でも多くの行政や大手通信事業者が採用しています。今回の障害発生が大規模に広がった原因はカーネルと呼ばれる基本レイヤードライバーのバグが強制的に全端末に自動アップデート配信されたことが原因です。

システムにトラブルはつきものですが、今回の修理対応はやばい。現地対応が必要で、セーフモードでWindowsを立ち上げて特定のファイルを削除してから再起動するという作業を全端末で行わなければなりません。ATMや電子看板はエアコンが効いているかもしれませんが、屋外の電柱に設置された監視用センサーや山奥のダムの制御装置などはどうするのでしょうか。季節がら、まさにクラウド「ストライク」という感じです。

システムのファイル更新は慎重に判断する必要があります。複数の試験端末でアップデートファイルをテストして問題ないことを確認してからリリースするべきです。ネットワーク越しの自動制御は便利ですが、その危険性も理解しておく必要があります。

一筆啓上いたします。
「いまやシステム障害は、災害になる時代です」

“The Program That Struck Both Economy and Health”
Photo: An overview of endpoint security (courtesy of EXO Security)

Seeing a blue screen, known as the “blue screen of death,” makes industry professionals pale. This screen appears when there’s a malfunction in the OS, indicating a severe problem with the computer.

On July 19, an unprecedented global blue screen crisis occurred, affecting systems worldwide. In an era where network connectivity is the norm, even network disruptions become widespread.

This crisis was caused by CrowdStrike, a security company. CrowdStrike provides endpoint protection (EPP) to detect security threats on devices, and endpoint detection and response (EDR) to detect and respond to threats. Their products are used not only on PCs and servers but also on routers and IoT devices.

CrowdStrike’s services are used by over 18,000 companies in 178 countries, including many government agencies and major telecom operators in Japan. The root cause of this incident was a bug in the kernel, a core component of the OS, which was triggered by a forced automatic update.

While system troubles are inevitable, the repair response this time was overwhelming. It required on-site intervention, where every device had to be booted in safe mode, specific files deleted, and then restarted. This task was daunting for every device. While ATMs and electronic billboards might have air conditioning, what about surveillance sensors on outdoor poles or control devices in remote mountain dams?

Updating system files requires careful consideration. Updates should only be released after testing them on multiple test terminals to ensure there are no issues. Network control is convenient, but we must understand its dangers to avoid such crises.

Signing off with today’s final stroke of the brush:
“System failures can now become disasters.”

Archive

「デール・カーネギーに学ぶチームづくり」

「AIが使えないプログラマーは、かなりヤバいことになる。」

孫子の開発指南(5):戦わずして勝つ。(保守篇)

「変わったなぁ、日本 〜コンビニでの気づき〜」

孫子の開発指南(4):兵は拙速を尊ぶ。(納品篇)

Monthly archive

野口 高志 株式会社ダックビル / CEO

ダックビルCEOです。若かった時に放漫経営で上場目指していた会社を倒産させてしまいました。皆さんのお情けをいただいて、もういちど頑張ってやり直してきました。懺悔の気持ちと感謝の思いを込めて社会課題を今後もコツコツと解決していくなかで社会に少しでも多く貢献していきたいな、と願っています。

記事一覧に戻る記事一覧に戻る