12 Métriques de Fiabilité des Agents IA

Les agents IA n'échouent pas par manque de capacité. Ils échouent par manque de fiabilité. Les scores de précision continuent d'augmenter. Les déploiements réels continuent de casser. Des chercheurs de Princeton ont identifié douze métriques concrètes. La précision ne les mesure pas et ne peut pas les remplacer.

Quatre dimensions. Douze métriques. Un cadre pour déployer des agents en qui vous pouvez vraiment avoir confiance.

Source: Rabanser et al., Princeton University - arxiv:2602.16666

Dimension I

Cohérence

Le système se comporte-t-il de la même manière lorsqu'il est exécuté plusieurs fois dans les mêmes conditions?

MÉTRIQUE #01

Cohérence des Résultats

Ce Que Ça Mesure

L'agent arrive-t-il à la même réponse finale lorsqu'on lui donne la même tâche plusieurs fois? Pas comment il y arrive, mais si la destination est la même.

Pourquoi C'est Important

Un agent qui donne des réponses différentes à la même question n'est pas utile, peu importe à quel point chaque réponse individuelle est "correcte". Des résultats incohérents détruisent la confiance et rendent la planification impossible.

Signaux d'Alerte

Résultats différents sur des exécutions répétées de la même tâche
Dépendance à des états aléatoires ou paramètres de température
Utilisateurs qui exécutent la même requête plusieurs fois "pour être sûrs"

MÉTRIQUE #02

Cohérence de Trajectoire

Ce Que Ça Mesure

L'agent prend-il le même chemin pour arriver au résultat? Pas seulement la destination, mais le voyage: la séquence d'étapes, d'appels d'outils, de décisions intermédiaires.

Pourquoi C'est Important

Le même résultat par des chemins différents peut masquer des problèmes. Un chemin pourrait être efficace, un autre pourrait être fragile. La cohérence de trajectoire révèle si votre agent a une stratégie stable ou s'il a juste de la chance.

MÉTRIQUE #03

Cohérence de Raisonnement

Ce Que Ça Mesure

Le raisonnement interne de l'agent est-il stable? Étant donné le même contexte, produit-il les mêmes schémas de pensée, les mêmes interprétations, les mêmes évaluations?

Pourquoi C'est Important

Un raisonnement incohérent signifie que votre agent devine fondamentalement, même si les réponses s'avèrent correctes. De bonnes réponses issues d'un mauvais raisonnement ne passent pas à l'échelle.

Dimension II

Robustesse

Le système fonctionne-t-il lorsque les conditions changent de manière qui ne devrait pas importer?

MÉTRIQUE #04

Robustesse d'Entrée

Ce Que Ça Mesure

La performance se maintient-elle lorsque l'entrée varie de manières qui ne devraient pas affecter la réponse? Paraphrase, fautes de frappe, formats différents, bruit non pertinent.

Pourquoi C'est Important

Les vrais utilisateurs n'écrivent pas des prompts parfaits. Si votre agent casse sur des variations mineures, il cassera en production.

MÉTRIQUE #05

Robustesse d'Environnement

Ce Que Ça Mesure

La performance se maintient-elle lorsque l'environnement externe change? Différentes APIs, ordre des données modifié, ressources temporairement indisponibles.

Pourquoi C'est Important

Le monde réel ne reste pas immobile. Les systèmes dont dépend votre agent changeront sans préavis. Les agents qui supposent la stabilité échoueront quand la stabilité disparaîtra.

MÉTRIQUE #06

Robustesse de Contexte

Ce Que Ça Mesure

La performance se maintient-elle lorsque l'information contextuelle varie ou est incomplète? Historique de chat manquant, instructions système différentes, contexte partiel.

Pourquoi C'est Important

Le contexte se perd. Les fenêtres de chat se compactent. Les instructions système sont modifiées. Les agents qui dépendent d'un contexte parfait sont des agents qui attendent d'échouer.

Dimension III

Prévisibilité

Le système peut-il communiquer précisément ce qu'il fera et ce qu'il ne fera pas?

MÉTRIQUE #07

Calibration

Ce Que Ça Mesure

La confiance de l'agent correspond-elle à sa précision réelle? Quand il dit qu'il est sûr à 90%, a-t-il raison 90% du temps?

Pourquoi C'est Important

Un agent trop confiant vous trompera avec des erreurs assurées. Un agent sous-confiant gaspillera votre temps avec une incertitude inutile. Une calibration correcte permet une confiance appropriée.

MÉTRIQUE #08

Délimitation des Capacités

Ce Que Ça Mesure

L'agent sait-il ce qu'il ne peut pas faire? Peut-il distinguer de manière fiable les tâches dans ses limites de celles en dehors?

Pourquoi C'est Important

L'échec le plus dangereux est de ne pas savoir que vous échouez. Les agents qui tentent des tâches qu'ils ne peuvent pas gérer créent le chaos. Les agents qui connaissent leurs limites peuvent escalader aux humains.

MÉTRIQUE #09

Explicabilité

Ce Que Ça Mesure

L'agent peut-il expliquer son raisonnement et ses actions d'une manière que les humains peuvent comprendre et vérifier?

Pourquoi C'est Important

Un agent qui ne peut pas s'expliquer est un agent en qui vous ne pouvez pas avoir confiance. L'explicabilité n'est pas pour l'agent, c'est pour les humains qui doivent l'auditer.

Dimension IV

Sécurité

Le système évite-t-il de causer des dommages même lorsqu'il échoue?

MÉTRIQUE #10

Dégradation Élégante

Ce Que Ça Mesure

L'agent échoue-t-il de manière sûre? Quand quelque chose va mal, minimise-t-il les dommages, préserve-t-il les options et communique-t-il clairement?

Pourquoi C'est Important

Les agents échoueront. La question est comment. Des échecs catastrophiques détruisent des mois de travail. Une dégradation élégante préserve la valeur et les options.

MÉTRIQUE #11

Confinement des Risques

Ce Que Ça Mesure

L'agent contient-il les actions risquées? Évite-t-il les actions irréversibles sans approbation? Maintient-il la supervision humaine là où ça compte?

Pourquoi C'est Important

L'autonomie sans confinement est de l'imprudence. Un agent qui peut agir sans supervision sur des questions à haut risque est une bombe en attente.

MÉTRIQUE #12

Sécurité Séquentielle

Ce Que Ça Mesure

Dans les séquences multi-étapes, la sécurité est-elle maintenue tout au long de la chaîne? Des étapes sûres peuvent-elles se composer en séquences dangereuses?

Pourquoi C'est Important

Des actions individuelles peuvent être sûres alors que les séquences sont dangereuses. La sécurité doit être holistique, pas seulement au niveau de l'action.