Stratégie3 KPI10 min de lecture

Les indicateurs maintenance qui mentent(et comment les lire correctement)

MTBF, MTTR, disponibilité — votre tableau de bord affiche du vert pendant que vos lignes plantent. Diagnostic + 3 corrections concrètes.

10 min de lecture
Maintenance industrielle
MTBF · MTTR · Disponibilité
Par Melek Mehrez · Publié le 26 mai 2026

Votre tableau de bord affiche MTBF = 480 h sur la presse n°3. Vendredi 14h, votre chef de prod vous appelle pour le troisième arrêt de la semaine. Quelqu'un ment — et ce n'est pas votre équipe.

Les 3 KPI canoniques de la maintenance industrielle — MTBF, MTTR, disponibilité— sont mathématiquement justes. Tous les CMMS du marché savent les calculer en quelques secondes. Le problème n'est pas la formule.

Le problème, c'est que ces formules s'appliquent sur des données non nettoyées, et qu'elles produisent alors des nombres opérationnellement faux — qui finissent en revue mensuelle, en CAPEX déféré, en cibles budgétaires inatteignables. Bref : en décisions stratégiques bâties sur du sable.

Cet article diagnostique 3 failure modesclassiques des KPI maintenance, avec chiffres terrain à l'appui, et fournit pour chacun une correction concrète implémentable sans changer de logiciel.

1

MTBF gonflé : préventif et correctif mélangés

Le mensonge le plus répandu — et le plus invisible

Définition (ISO 14224 §6.5)

MTBF(Mean Time Between Failures) = uptime cumulé / nombre de défaillances. Mesure de référence de la fiabilité d'un équipement réparable.

Le piège

La plupart des CMMS calculent le MTBF sur tous les WO terminés — préventifs, correctifs, inspections, tout ce qui ferme dans la même bucket. Résultat : plus vous faites de maintenance préventive (donc plus vous êtes mature), plus votre MTBF affiché grimpe — sans que vos équipements soient plus fiables.

Le bruit du préventif amortit le signal du correctif. Et le signal du correctif, c'est exactement ce qu'on cherche à mesurer.

Exemple chiffré — Asset X sur 12 mois (8 760 h calendaires)
50 WO préventifs réalisés (graissage, contrôles) + 5 pannes correctives.
MTBF naïf (tous WO)159 h
→ Étiqueté “asset stable”
MTBF correct (correctifs only)1 752 h
→ Tombe en panne tous les 2 mois
Facteur d'erreur ×11
Conséquence directe

Un asset qui panne tous les 2 mois est étiqueté “fiable”en revue mensuelle. Le CAPEX de remplacement reste reporté année après année. Le jour où l'asset lâche en plein cycle critique, la direction découvre le mensonge — trop tard.

Comment recalculer (3 actions)

  1. Séparer les types de WO au niveau data. Préventif, correctif, amélioration, inspection, urgence. La taxonomie standard ISO 14224 §B.2 est utilisable telle quelle (FreeMaint expose 7 types par défaut).
  2. Filtrer le calcul. MTBF = uptime / count(WO WHERE maintenance_type IN ('CORRECTIVE', 'EMERGENCY'))
  3. Distinguer défaillance fonctionnelle vs potentielle. Un préventif qui détecte une dégradation avant la panne n'est pas une panne — le compter comme défaillance tue l'intérêt même de l'inspection.
Référence interne : voir la taxonomie des types de maintenance dans FreeMaint (7 types alignés ISO 14224, séparation native CORRECTIVE / PREVENTIVE / EMERGENCY).
2

MTTR sous-estimé : le blast radius des arrêts en cascade

Quand le coût réel d'une panne est invisible dans le KPI

Définition

MTTR(Mean Time To Repair) = temps moyen entre l'ouverture du WO et sa complétion. Souvent confondu avec active repair time (le temps réellement passé à réparer).

Le piège

Le MTTR mesure la réparation de l'équipement défaillant. Mais une panne crée presque toujours un blast radius: la machine X tombe, la ligne Y arrêtée en aval, la matière Z dégradée en attendant, l'équipe immobilisée. Le MTTR sur le WO de X ne capture rien de tout ça.

Le blast radius d'une panne — exemple
Machine XCapteur HSActive repair : 2 hLigne YArrêt aval+ 4 h d'attenteMatière ZBatch dégradé+ rework 1 j-équipeMTTR affiché2 hDowntime réel~ 32 h→ Facteur ×16
Conséquence directe

Le coût horaire de panne calculé sur le MTTR (€/h × 2 h = 600 €) est ridiculement sous-évalué. Pas de business case pour investir dans la fiabilité parce que “ça coûte rien”. Le vrai coût (perte de production + matière + équipe = ~9 600 €) reste invisible — et le management refuse les budgets fiabilité parce que les KPI ne justifient pas la dépense.

Comment recalculer (3 actions)

  1. Modéliser le blast radius. Créer un objet “Shutdown” ou “Incident parent” qui regroupe les WO enfants déclenchés par la cascade. La plupart des CMMS modernes le permettent via un champ parent_shutdown_id ou incident_id.
  2. Calculer le MTTR sur le parent. downtime = closed_at(parent) − opened_at(parent) , pas la somme des MTTR enfants.
  3. Distinguer active repair time vs downtime. ISO 14224 §3.13 fait cette distinction depuis 30 ans. Vos rapports doivent les afficher côte à côte — pas le même nombre.
3

Disponibilité gonflée : les micro-arrêts non comptés

1 point d'OEE perdu dans le brouillard statistique

Définition

Availability = Uptime / (Uptime + Downtime). Au cœur du calcul OEE (Overall Equipment Effectiveness) = Availability × Performance × Quality.

Le piège

La disponibilité ne compte que les downtimes loggés via un WO. Mais sur une ligne de production typique, ~60% des arrêts sont des micro-arrêts de moins de 15 minutes : calage, réglage, purge, micro-bourrage, attente matière, changement de format mineur.

Ces arrêts ne génèrent pas de WO parce que l'opérateur les résout en 5 minutes sans rien dire à personne. Résultat : invisibles dans le CMMS, invisibles dans la dispo, invisibles dans l'OEE.

Exemple chiffré — Ligne 24/7 sur 1 mois (720 h théoriques)
Dispo apparente (loggée CMMS)98,9 %
Uptime 712 h
8h

↑ Ce que le CMMS croit. Ce que la direction voit. Ce qui sert de baseline OEE budgétaire.

Dispo réelle (avec micro-arrêts)97,8 %
Uptime 703,7 h
8h
8,3h
Uptime Downtime WOMicro-arrêts <15 min (50 × ~10 min)
1 point d'écart— semble cosmétique. Pas sur l'OEE :
OEE nominal
89,2 %
98,9% × 92% × 98%
OEE réel
88,2 %
97,8% × 92% × 98%

Sur une usine à 50 M€ de CA, 1 point d'OEE perdu = ~500 k€ de marge envolée dans le brouillard statistique. Et la cible OEE budgétée est inatteignable parce que la baseline est fausse.

Comment recalculer (3 actions)

  1. Instrumenter les micro-arrêts. Compteur stop_count sur l'asset, incrémenté à chaque arrêt >5 secondes via SCADA, PLC, ou capteur de présence. C'est la première brique du downtime tracking sérieux.
  2. Aggréger en time-buckets. Pas un WO par micro-arrêt (overhead administratif insoutenable), mais des buckets horaires/journaliers via meter readings dans le CMMS. Une ligne de meter par jour suffit.
  3. Distinguer 3 catégories. Breakdown (>1h, ouvre WO) — Short stop (15-60 min, loggé sans WO) — Minor stoppage(<15 min, compteur agrégé). Chacune reportée séparément dans le dashboard.
Référence : la norme SEMI E10(semi-conducteur) distingue 6 états d'équipement — le standard le plus rigoureux au monde sur ce sujet. À adapter selon le niveau de maturité de votre site.

Tableau récap — à imprimer pour votre prochain comité

Les 3 failure modes, les 3 corrections, les 3 impacts directs.

IndicateurFaille classiqueCalcul correctImpact direction
MTBFMélange PM + correctif dans le compteur de défaillancesmaintenance_type ∈ {CORRECTIVE, EMERGENCY}Risque caché ×5 à ×10
MTTRWO start → complete only, ignore le blast radiusModéliser un shutdown parent + downtime cascadéCoût panne ×3 à ×15
DisponibilitéMicro-arrêts <15 min jamais loggésInstrumenter via SCADA + agréger en meter readingsOEE faux 1-3 points

3 actions pour votre prochaine revue mensuelle

Ces 3 indicateurs ne sont pas mauvais. C'est leur configuration qui ment. La bonne nouvelle : aucun de ces fixes ne demande un nouveau logiciel ou un budget. Juste une taxonomie de WO propre, un objet shutdown parent dans votre CMMS existant, et un cron qui agrège les micro-arrêts depuis votre SCADA.

1

Recalculer le MTBF sur correctifs uniquement

Sur un asset critique, recalculez le MTBF en excluant les WO préventifs. Comparez avec le MTBF affiché. Le facteur d'erreur va parler de lui-même.

2

Logger le prochain incident avec un incident_id

Sur le prochain arrêt non-routine, loggez non seulement le WO de réparation mais aussi un identifiant d'incident qui groupe tous les WO impactés. Calculez le downtime réel sur ce parent.

3

Demander au SCADA vos micro-arrêts du mois

Demandez à votre équipe automatisme le nombre de micro-arrêts <15 min sur le mois passé. Comparez à zéro — ce que votre CMMS croit. Vous allez avoir une surprise.

Pour aller plus loin

  • ISO 14224:2016 — Industries du pétrole, du gaz naturel et pétrochimique — Collecte et échange de données de fiabilité et de maintenance pour les équipements
  • SEMI E10-0814 — Specification for Definition and Measurement of Equipment Reliability, Availability, and Maintainability (RAM)
  • Nakajima (1988)TPM : An Introduction — référence historique sur la décomposition OEE et les six big losses

Vos KPI maintenance disent la vérité ?

FreeMaint est un CMMS freemium (Core gratuit à vie, sans limite d'utilisateurs ni d'assets) qui sépare nativement préventif et correctif via la taxonomie ISO 14224 — et permet d'auditer chaque indicateur.

Article écrit par Melek Mehrez, fondateur de FreeMaint. Voir tous les articles.

Questions fréquentes

Pourquoi mon MTBF est-il trompeur ?

Le MTBF (Mean Time Between Failures) calculé sur tous les ordres de travail terminés mélange préventifs et correctifs. Plus vous avez de PM réalisés, plus le MTBF affiché monte — sans que votre équipement soit plus fiable. La correction : filtrer le calcul sur les seuls WO de type CORRECTIVE ou EMERGENCY, conformément à la taxonomie ISO 14224.

Qu'est-ce que le blast radius d'une panne ?

Le blast radius désigne l'ensemble des conséquences en cascade d'une panne : machine X tombe, ligne Y attend, matière Z se gâte, équipe en attente. Le MTTR calculé sur le seul WO de réparation de X ne capture rien de tout cela. Pour mesurer le coût réel, il faut modéliser un objet shutdown parent qui regroupe tous les WO impactés et calculer le MTTR sur ce parent.

Pourquoi ma disponibilité affichée est-elle fausse ?

La disponibilité ne compte que les downtimes loggés dans le CMMS via un ordre de travail. Mais ~60% des arrêts industriels sont des micro-arrêts de moins de 15 minutes (calage, réglage, purge, micro-bourrage) que l'opérateur résout en 5 minutes sans créer de WO. Ces minutes invisibles font gonfler artificiellement le taux de disponibilité affiché de 1 à 3 points sur l'OEE.

Comment corriger mes KPI sans changer de logiciel ?

Aucun des 3 fixes ne demande un nouveau logiciel : (1) ajouter un champ maintenance_type sur vos WO pour distinguer préventif / correctif / urgence, (2) introduire un champ incident_id pour grouper les WO d'un même blast radius, (3) instrumenter les micro-arrêts via votre SCADA et agréger via meter readings. Le tout dans votre CMMS existant.