原因の切り分けは大事

最近、暑くなったり涼しくなったり気温が安定しませんね。
あまり寒暖差が大きいと、バテる原因にもなるので厄介ですが、
ここから暑くなっていくことを考えると…もう少し涼しいままでいてほしいものです。

さて表題の件ですが、
先日、現場にて機器の遠隔アップデートが失敗するという問題が発生しました。
その調査を行うにあたり、原因の切り分けは大事だよなぁと実感したので
それについて書いてみたいと思います。

まず、アップデートの失敗と一口に言っても、アップデートファイルのダウンロード時、
ファイルの展開時などタイミングは色々考えられます。
これについては動作ログが残っており、ファイルのダウンロードに失敗したことが分かりました。

では何故ダウンロード出来なかったのか。最初は、アップデートファイルを配置してある
サーバーの不調を疑いましたが、そちらについては問題が見つかりませんでした。

では機器に問題があったとみてそちらを調査開始。
結果、機器のストレージに空き容量が無くなっており、ダウンロードファイルを
配置出来なくなっていたことが判明。ここまでで、遠隔アップデート失敗の原因は分かりました。

この後は「何故ストレージ容量を食いつぶしているのか」の調査へと移行していくことになります。

今回、調査は以下のように進行していきました。
・アップデート出来なかったのは何故? ⇒ ファイルがダウンロード出来なかったから
・ダウンロード出来なかったのは何故? ⇒ 書き込みするための容量が確保されていなかったから
・容量が確保できなかったのは何故? ⇒ 調査中…

それぞれ「何故?」に対して原因が複数考えられる中、正しく動作している部分を除外していき
原因を特定していく流れはとても大事ですね。焦らず進めていければなお良いかと思います。

以上