Série « Devenir expert de l'automatisation agentique » — Article 2 sur 5. Article précédent : L'écosystème agentique

La scène que vous avez déjà vécue

Un prestataire vous montre une démo. Un agent IA lit un email entrant, rédige un devis, le dépose dans votre CRM. En 5 minutes. Magique.

Vous signez. Trois mois plus tard :

L'agent plante en pleine nuit parce qu'une API a changé — vous l'apprenez le lundi à 10h quand 3 clients se plaignent
Personne ne sait combien ça coûte exactement par mois
Un collaborateur a modifié le prompt « vite fait » — plus personne ne se souvient de la version qui marchait
L'agent a envoyé un email bizarre à votre meilleur client

Rien de tout ça n'était dans la démo. Parce que la démo, c'est 10 % du travail.

L'iceberg : ce que vous voyez vs ce qu'il faut vraiment

Iceberg montrant le prompt visible (10%) et l'infra invisible (90%)

La partie visible — le prompt, le modèle, la jolie démo — c'est la pointe de l'iceberg.

La partie sous l'eau, c'est l'infrastructure : tout ce qui fait qu'un agent tient en production pendant 6 mois sans intervention humaine. C'est 90 % du travail réel, et c'est précisément ce qu'aucun tutoriel YouTube ne vous montre.

Les 6 piliers d'infra — et ce qu'il se passe quand l'un manque

Les 6 piliers d'infra : secrets, observabilité, retries, sandboxing, human-in-the-loop, versioning

Pilier 1 — Secrets & authentification

Votre agent a besoin de clés API (OpenAI, Brevo, votre CRM...). Ces clés donnent accès à vos données et peuvent coûter très cher si elles fuitent.

Ce qu'il faut : un coffre-fort (Vercel secrets, AWS Secrets Manager, Cloudflare secrets), une rotation régulière, et une isolation par client si vous gérez plusieurs comptes.

Ce qui arrive quand c'est oublié : on a vu des clés OpenAI postées par erreur sur GitHub — résultat : 8 000 € facturés en 6 heures par des bots qui crament du token.

Pilier 2 — Observabilité

Sans observabilité, un agent est une boîte noire. Vous savez qu'il tourne. Vous ne savez pas s'il fait bien son travail.

Ce qu'il faut : chaque exécution loguée (qui, quoi, quand, combien de tokens, combien €), un dashboard pour voir la semaine, des alertes si ça dérive.

Ce qui arrive quand c'est oublié : vous découvrez en fin de mois que l'agent a consommé 10× plus de tokens que prévu — sans que personne ne sache pourquoi. Ou, pire : un client se plaint qu'il n'a jamais reçu son devis, et vous ne pouvez pas retracer ce qui s'est passé.

Pilier 3 — Retries & timeouts

Les APIs plantent. Les rate limits existent. Les exécutions longues arrivent. Un agent sans gestion d'erreurs est un agent fragile.

Ce qu'il faut : retry avec backoff exponentiel, timeouts explicites, idempotence (rejouer une tâche ne la dédouble pas), files d'attente pour absorber les pics.

Ce qui arrive quand c'est oublié : le matin où vous recevez 30 leads d'un coup (ça arrive), l'agent en traite 3 et plante les 27 autres en silence. Perte sèche.

Pilier 4 — Sandboxing

Un agent a besoin d'un périmètre d'action clair. Il peut lire telle table, écrire dans telle autre, mais ne peut pas toucher à la facturation. Il peut rédiger des emails, mais ne peut pas les envoyer seul.

Ce qu'il faut : permissions fines au niveau base de données (RLS en Postgres/Supabase, IAM en cloud), tools scopés, garde-fous sur les actions sensibles.

Ce qui arrive quand c'est oublié : l'agent « hallucine » une adresse email et envoie votre proposition commerciale au concurrent. Oui, c'est arrivé.

Pilier 5 — Human-in-the-loop

Chez Déclic, c'est une règle absolue : un agent draft, un humain valide. Pas d'envoi automatique, pas de facturation automatique, pas de suppression automatique de données.

Ce qu'il faut : des points de validation explicites dans chaque workflow sensible. Une interface simple (dashboard, email, Slack) pour que vous puissiez approuver / rejeter en 10 secondes.

Ce qui arrive quand c'est oublié : vous perdez le contrôle. L'agent prend des décisions à votre place, et un jour, une de ces décisions coûte cher.

Pilier 6 — Versioning & rollback

Un agent évolue. Vous améliorez le prompt, vous ajoutez un outil, vous changez de modèle. Sans versioning, vous êtes incapable de dire « remettez-moi la version qui marchait en mars ».

Ce qu'il faut : tout est du code, tout est dans git. Prompts, outils, config — versionné, testé, rollback-able en 1 clic.

Ce qui arrive quand c'est oublié : une « petite modification » casse un cas d'usage. Personne ne s'en rend compte pendant 3 semaines. Le temps de diagnostiquer : 2 jours de travail.

Pourquoi 80 % des POC IA meurent

On a tous lu l'étude : 80 % des projets IA ne passent jamais en production. La cause principale n'est presque jamais le modèle. Le modèle, aujourd'hui, marche. La cause, c'est presque toujours une (ou plusieurs) de ces 6 briques d'infra qui manque.

La démo est faite en mode « happy path ». La prod, c'est Murphy's law tous les jours.

Deux approches — deux budgets très différents

Face à ces 6 piliers, deux écoles :

École A — « On verra plus tard »

On commence avec un POC rapide (Zapier + ChatGPT, script Python maison). Ça marche 3 mois. Puis les problèmes apparaissent un par un, on patche dans l'urgence, la dette technique s'accumule. Au bout de 12 mois, on est forcé de tout refaire. Coût total : 2× le projet initial.

École B — « L'infra d'abord »

On pose les 6 piliers dès le premier jour. Ça prend 2-4 semaines de setup au lieu d'une semaine. Mais l'agent tient ensuite 12-24 mois sans accroc. Coût total : 40 % de moins sur 2 ans.

C'est l'école Déclic. Ce n'est pas une question de puritanisme technique — c'est une question de coût total sur 2 ans.

La question à poser à tout prestataire IA

Avant de signer avec qui que ce soit, posez ces trois questions :

« Comment je sais, dans 3 mois, combien chaque agent m'a coûté et combien il a tourné ? » (observabilité)
« Si je veux revenir à la version d'il y a 1 mois, ça prend combien de temps ? » (versioning)
« Qu'est-ce qui empêche l'agent d'envoyer un email que je n'aurais pas validé ? » (HITL + sandboxing)

Si la réponse aux trois n'est pas claire, immédiate, et documentée — ce n'est pas un projet prêt pour la prod.

La suite

Article 3 (la semaine prochaine) : les solutions grand public — Delos, Dust, Make+GPT. Comparatif honnête, zones d'usage, zones de plafond.
Article 4 : le niveau expert — coder ses propres agents avec Claude Code.
Article 5 : les critères d'adoption professionnels.

Passez à l'action

Votre projet IA est-il au-dessus ou sous l'eau ? En audit flash gratuit de 30 minutes, on regarde ensemble ce que vous avez (ou ce qu'un prestataire vous propose) et on note l'infra sur chacun des 6 piliers. Vous repartez avec une check-list et une idée claire de ce qui manque.

Demander un diagnostic infra →

Le problème oublié — un agent IA a besoin d'une infra