頻発する大企業のシステム切り替えトラブルに想う
最近、大手企業のシステムトラブルを多く聞きます。大好きなプリンの出荷が長期にわたって止まったり、メガネの出荷ができなくなったり‥。この内、後者についてはどうやらサイバー攻撃の被害にあった様なので、少し毛色は違いますが、前者は新しいシステムへの切り替えでトラブルが発生し、それによって長期間出荷ができない状況に至った模様です。
そもそも、大企業のシステムは中小に比べれば圧倒的に大きな予算規模で、関わっている人員も多く、時には優秀なITコンサルも加わった大規模プロジェクトでシステム化に取り組んでいるので、どうして出荷が長期間止まるようなトラブルが、しかも一番大人数が関与しているはずのシステム切替時に起きたのか、にわかには理解できませんね。
詳しい原因が発表されているわけではありませんので、あくまでも推測となりますが、ここまで長期間のトラブルが発生しているということは、原因は一つではなく複数が複雑に絡んでいると思われます。例えば、以下のような要素がいくつか同時発生した、などでしょう。
複数に分割されていたシステムを一度に統合しようとしたが、データ処理の順番やロジックに誤りがあり、矛盾を起こした。単一システムへの統合だったため、それが全体に波及して稼働できなくなった。
新システムが前提としていた業務プロセスが、実際の現場では回せないことが判明した。
旧システムから移行したデータが誤っていた・新システムが前提とするデータになっていなかった。
アドオン開発した部分に深刻なバグが残存しており、それを改修するまで全体を止めざるを得なくなった。または、アドオン開発機能が多かったり機能同士が階層化している為、一つのバグ(機能変更の必要性)がアドオン全体に影響してしまった。
他にも要因がありそうですが、だいたいこんなところでしょう。
それにしても、「手作業でも出荷を再開できない」ということは、この会社はもはやシステム無しで業務を流すことができない状態であったことを意味します。デジタル化時代ではありがちなことではありますが、それでもグループ会社全体が影響を受けているということを考えると、事業継続性の観点で言えば脆弱すぎると言わざるを得ません。
当然のことながら、「システムが停止した時の措置」を考えていたと思いますが、今回はシステム切替時のトラブルなので、この措置を発動することができなかった可能性もあります。なにしろ、新システムでまともに稼働していませんので、信頼できるデータもデータベースに入っていなかったのでしょう。システムトラブル時には、トラブル直前のデータを使って人力で業務を回すことが基本なので、その直前のデータ無しの状態では仕事を回すことができなかった可能性があると思います。
これら「致し方のない要素」が複数発生し、会社全体が影響を受ける、というリスクはなかなか避けることができないとは思います。しかし、どうしても引っかかることが2つ残ります。それは・・・
(1)新システムへの移行手順とその移行訓練について、リスク対処計画が不足していたとしか思えない
(2)リスクが顕在化した時の、旧システムへの切り戻し計画が考慮不十分だったとしか思えない
という点です。(1)はシステムが大きいほどその計画や準備は大変ですが、これは「これでもか!」と言わんばかりの注意が必要で、企業やシステムの大小の問題ではありません。中小企業でもシステムの切り替え時には、「どんなことが発生しうるのか?」を細かく抽出し、それが発生した時の行動計画を立案し、更に事前訓練も済ませておかねばならないのです。今回、結果的にそれが不十分であった、と言わざるを得ないでしょう。
(2)については、今回のような大規模切り替え(またの名をビッグバン方式と呼びます)だった場合、なかなか計画できることではなかったのかもしれませんが、少なくとも全社が一斉に停止してしまうことが無いようにする対策は計画できたはずです。その点も考慮が不足していた、と言われても仕方のないことだと思います。
いずれにしても、システム切り替えのときには、十分なリスク分析と対策計画の立案が必要で、これは企業規模の大小には関係ありません。業務が止まればお客様にもご迷惑をおかけし、信用も失い、業績も悪化します。まさに会社が傾きかけない事態に陥るので、絶対に被害を小さくする計画が必要なのです。今回の事例はまさにその必要性を暗示していると思いますが、皆さんはどう思われるでしょうか?
コラムの更新をお知らせします!
コラムはいかがでしたか? 下記よりメールアドレスをご登録いただくと、更新時にご案内をお届けします(解除は随時可能です)。ぜひ、ご登録ください。