ご安全に!まんぬです👷♂️⚡
今回のテーマは、原因不明の故障とその後の対応についてです。
故障報告書の「原因:不明」で閉じたファイル、どの工場にもあります。
ワイの引き出しにも何枚か眠っています😇
問題は、原因不明を一括りにしてそのまま放置していることです。
実は原因不明には3種類あって、分類するだけで次にやることが変わります。
A:調査しきれなかった(時間や手段の制約で追えなかった)
B:再現しない(条件が揃わないと出ない。再発したときしか追えない)
C:本当に断定できない(調べた。でも確定できない。推定止まり)
この3つ、やるべきことが全然違います。
「原因不明」と書く前に「どの原因不明か」を分けるだけで、報告書の質が変わります。
エピソード1:通信エラーの犯人が別の盤にいた話
ある設備で、三菱イーサネットユニットからネットワーク通信エラーが出ていました。
中央監視にエラーが上がってくるので、最初は三菱側のユニットを疑いました。
イーサネットユニットを交換。 ……直りません。
ちょwww交換したのに直らんのwwwwww
分析を進めましたが、三菱側のハードウェアには異常が見つからず、時間的な制約もあって結局「根本原因不明」として閉じました。
典型的な追いきれなかったパターンです。
後になって分かったのですが、原因は相手側のバーナーコントローラーの通信ユニットでした。こいつが熱で故障していたのです。
で、突き詰めると盤メーカーの設計に問題があることがわかりました。(当時の弊社担当の管理不足でもありますが)
通信ユニットの排気口のすぐ上に配線ダクトが配置されていて、排熱の逃げ場がない。盤クーラーの冷気も届かない構造でした。
設計した人、排熱の概念どこに置いてきたんや・・・
実際、同じ盤の中で複数のバーナーコントローラーユニットが熱で故障していた実績がありました。 盤内の熱による故障の典型例です。
盤内の熱で壊れやすい部品と、壊れる前に出るサインでも書きましたが、排熱設計がまずい盤は中の部品を道連れにします。
しかもこの故障、一瞬で復旧するタイプでした。
正確に言うと、三菱の通信エラー以外のエラーがすぐに正常復帰するため、何が悪さをしているか特定できない状態でした。
さらに中央監視のネットワーク通信エラーが先に目に入るので、そっちばかりフォーカスしてしまう。
通信エラーの切り分けについては通信エラーが出たとき、現場で最初に確認する4つのポイントも参考になります。
つまり「症状が出る場所」と「原因がある場所」が離れていたのです。
三菱側をいくら見ても、犯人は別の盤にいました。
これは分類Aのパターンです。
「調査しきれなかった」というより「見る場所が違った」が正確な表現ですね。
教訓として1つ。
交換しても直らない場合は、原因が別の場所にある場合が多いです。
交換対象を疑うのではなく、その先にいる相手を疑うべきかと思います。
エピソード2:メーカーも「コンデンサが壊れてる」しか言わない話
インバータが故障しました。
現場で分解して内部の故障原因を分析する……なんてことは当然できません。
メーカーに送って調査を依頼しました。
数週間後、メーカーから返ってきた見解がこちらです。
「コンデンサ素子が損傷しています」
……ありがとうございます。でもなぜ壊れたのかが知りたいんですよ。。。
でもメーカーの報告書にはそれ以上の情報がありませんでした。まぁしょうがないです。神様じゃありませんから。
気を取り直して消去法で考えました。
運転条件は正常範囲内。過負荷や過電流のトリップ履歴もない。使用年数から見れば経年劣化として処理するのが妥当
……なのですが、1つ引っかかることがありました。
このインバータが設置されている電気室のエアコンが、一時期壊れていたのです。
室温が上がっていた期間がありました。
コンデンサは熱に弱い部品です。 エアコン故障による室温上昇が寿命を縮めた可能性は十分にあります。 ……ただし、断定はできません。
これが分類Cの現実です。
「調べた。でも確定できない。推定止まり。」
推定原因が複数あるとき(今回なら「経年劣化」と「環境温度」)、確からしい順に全部対策を打たなきゃいけません。
これ全部やんの???
はい、全部やります。
エアコンの保守強化、電気室の温度監視、インバータの更新計画の前倒し検討。
1つじゃ済まないんです。
断定できないからこそ、網を広く張るしかない。
工数もコストもかかりますが、それが「確定できない」ときの現実的な対応です。
分類ごとの「次の一手」
3つの分類それぞれで、やるべきことが違います。
ここを整理しておくだけで、「原因不明」のまま放置される案件が減ります。
A:調査しきれなかった場合
次に同じ現象が出たときの確認項目を、先に決めておきます。
「どこを見るか」「何を測るか」「何を記録するか」を書いておくのです。
再発したら即データを取る段取りを先に組んでおきます。
故障してから「何測ろう?」と考え始めるのでは遅い。発生した瞬間に動ける準備が必要です。
エピソード1のように「見る場所が違った」というパターンもあります。
交換しても直らなかったら、相手側を疑うことはチェック項目に入れておいてください。
未来の自分が助かります👍
B:再現しない場合
保全で一番もどかしいやつです。
「あの現象もう1回出して」と言われても、出せるなら苦労しません。
まず発生条件を絞ります。
運転フェーズ、環境条件(温度・湿度)、時間帯、頻度。
「いつ出るか分からない」を「こういう条件のときに出やすい」まで持っていくのが目標です。
エピソード1の通信エラーも「一瞬で復旧する」タイプだったので、Bの性質を併せ持っていました。
こういう故障は、監視ポイントを仕掛けて、再発時にデータが自動で取れるようにするのが鉄則です。
PLCのデータロギングでもいいし、温度ロガーの設置でもいい。
「再発するまで追えない」は仕方ありません。
ただし「再発したときに追える状態」を作っておくのが保全の仕事です。 罠を仕掛けて待つ。
狩猟みたいなものですね🏹
C:本当に断定できない場合
推定原因を確からしい順に並べます。そして上から順に対策を打ちます。
1つで済むことは少ないです。
エピソード2のように、経年劣化と環境要因が併存するケースでは、両方に手を打つ必要があります。
財布が泣きます💸
断定できなくても「何をやって、何が残っているか」を記録に残してください。
エピソード2のように、環境要因(エアコン故障)を含めて横に広く見る視点が大事です。
対策の優先順位づけには再発防止策の引き出しを整理する:4分類と暫定・恒久の使い分けの考え方が使えます。
「原因不明」の記録で最低限残すべき4項目
原因不明であっても、次に繋がる記録は残せます。
最低限、以下の4項目を書いてください。
① 何を調べたか(測定・交換・確認した内容)
② 何が分かったか(正常だった箇所も含めて)
③ 何が分からなかったか(特定できなかった範囲)
④ 次に再発したら何を確認するか(次の担当者への申し送り)
この4項目が残っていれば、原因不明のままでも次の担当者が引き継げます。
逆にこれが無い原因不明は、ただの放置です。
引き継ぎゼロの原因不明ファイル、開いたときの絶望感やばいですよね😨
特に④が重要です。
次に何を確認すべきかが書いてあるだけで、再発時の初動が全然違います。
前任者がゼロから積み上げた知見を、次の担当者がゼロからやり直す。
これが一番もったいない。
故障記録のフォーマット自体を見直したい場合は、Excelの故障記録を”分析できる形”に変えるも読んでみてください。
原因不明の記録も、分析できる形で残しておけば、蓄積したときにパターンが見えてきます。
そしてこの記録は、設備更新の判断材料にもなります。
「原因不明の故障が3年で5回起きている」というデータがあれば、上司や経営層への説明に使えます。
「原因は特定できていませんが、再発頻度と復旧コストから見て更新した方が安い」という話ができる。
現場の悔しさを、予算を動かす数字に変えるための第一歩が、この記録です。
「原因不明」は悔しいです。ワイも何度も経験しています。
でも「分からなかった」で終わりにするのと、「分からなかったけど、ここまでは調べた。次はここを見てほしい」と残すのでは、組織としての保全力が全然違います。
断定できなくても、分類して、記録して、次の一手を決める。
大変ですけど、それが保全です💪
次に読む記事
故障の再発防止策を「暫定」と「恒久」で整理する考え方はこちら。
👇
再発防止策の引き出しを整理する:4分類と暫定・恒久の使い分け
故障記録を「分析できるデータ」に変えるための具体的な方法はこちら。
👇
Excelの故障記録を”分析できる形”に変える

コメント