Failure Sharing

Bootup your energy with sharing failure.

久しぶりのトラブル

このブログの目的は、僕がした失敗を記録しといて、それが再発するのを防ぐことです。 最近は個人的にすごくうまくいってて、しばらくこういう話題で書くことがなかったのですが、 今日やがてトラブルが発生してしまいました。

正確にいうと、僕が起こしたトラブルではないですが、僕の属しているチームのトラブルであるのと、 僕が作業した人ではないが、最近力を入れているテスト自動化アプリケーションで もう少し油断せずにサポートできたら、十分防げたんじゃないかなと思います。

実はトラブった内容が検知できる仕組みを用意はしていましたが、 それをコメントアウトしていたのです。コメントアウトした理由はいくつかあるのはありますが、 ま、今それを言っても言い訳にしかならないでしょう。

トラブルはすでに発生し、復旧もできたので今はもっと前を見るべきです。 再発防止ってか。


なぜ武器を持ってたものの使わなかったのか。

「実はトラブった内容が検知できる仕組みを用意はしていましたが」と言ったのですが、 その根拠としては、最終的にパイプラインに乗せるのがゴールだったので、 その仕組みができるまで待ってたということです。

でもアホだったんですね。トラブルは予測のできないタチ悪いお客さんなので いつでも対応できる準備をしとかないとダメでした。

実はすごく悔しいです。

どうするか。

一応パイプライン化ではなくても、パイプラインっぽい仕組みでも代わりに用意しようと思います。 パイプラインって言っても、どうせどこかのバッチサーバなので、クラウドとかなんとか ものはいっぱいです。

具体的な対策についてはもうちょっと考えたいです。 最終的じゃなくても、ある程度は完璧に見えるように。