De 3 à 4 amigos : quand l'IA s'invite dans le refinement
Article 1 - Série : L'évolution de la QA avec l'IA
Si vous travaillez en agile depuis quelques années, vous connaissez probablement la pratique des « 3 amigos ». Cette réunion informelle, mais redoutablement efficace, où le Product Manager, le développeur et le QA se retrouvent autour d'une user story avant qu'elle n'entre dans le sprint. L'idée est simple : confronter trois regards différents sur la même fonctionnalité pour détecter les ambiguïtés, aligner les attentes et éviter les mauvaises surprises en fin de sprint.
C'est une pratique qui a fait ses preuves. Mais elle a une limite connue de tous ceux qui la pratiquent : elle dépend entièrement de la qualité des questions posées dans la salle. Et les questions qu'on ne pose pas, ce sont souvent les plus importantes.
C'est là qu'un quatrième acteur commence à faire son entrée. Pas un humain supplémentaire, l'agenda est déjà chargé, mais un outil d'IA capable d'analyser une user story en quelques secondes et de soulever des angles morts que personne dans la salle n'avait anticipés. Bienvenue dans l'ère des 4 amigos.
Pourquoi les 3 amigos ont leurs limites
Avant d'ajouter un acteur, comprenons pourquoi le trio classique peut parfois manquer sa cible.
Le premier problème, c'est le biais de confirmation. Quand trois personnes qui travaillent ensemble depuis des mois se retrouvent autour d'une user story, elles partagent souvent les mêmes angles morts. Elles ont les mêmes habitudes, les mêmes hypothèses implicites sur le produit, et parfois la même envie d'avancer vite. Résultat : certaines questions ne sont jamais posées, non par négligence, mais parce que personne ne les a vues.
Le deuxième problème, c'est la pression du temps. Un refinement, ça dure rarement plus d'une heure pour couvrir plusieurs stories. Le temps par story est limité, et la profondeur d'analyse souvent sacrifiée au profit du volume. On valide, on estime, on passe à la suivante.
Le troisième problème, c'est la variabilité humaine. La qualité d'un refinement dépend enormément de l'état des participants ce jour-là, de leur niveau de préparation, et de la dynamique de groupe. Certaines sessions sont brillantes. D'autres passent à côté de l'essentiel sans que personne s'en rende compte sur le moment.
Ces limites ne remettent pas en cause la valeur des 3 amigos. Elles pointent simplement un espace où l'IA peut apporter quelque chose de concret.
Ce que le 4ème amigo apporte concrètement
L'idée n'est pas de remplacer l'un des trois participants humains. C'est d'introduire, avant ou pendant ou avant la session, une analyse automatisée de la user story qui vient enrichir la discussion.
Concrètement, cela ressemble à ça : avant la session de refinement, le QA (ou le PM) soumet la user story à un LLM avec un prompt structuré. Le modèle analyse le texte et produit une liste de questions, d'ambiguïtés potentielles, de cas limites non couverts, et parfois de risques techniques ou fonctionnels que la formulation initiale n'abordait pas.
Ce n'est pas de la magie. C'est de la reconnaissance de patterns à grande échelle. Un LLM a été entraîné sur des milliers de spécifications, de user stories, de rapports de bugs et de documentations techniques. Il sait, statistiquement, quels types de formulations génèrent des ambiguïtés, quels cas limites sont fréquemment oubliés dans tel type de fonctionnalité, et quelles questions reviennent systématiquement dans ce genre de contexte.
Le résultat est souvent surprenant. Pas parce que l'IA est plus intelligente que l'équipe, mais parce qu'elle n'a pas les mêmes biais. Elle ne connaît pas le contexte politique du projet. Elle ne sait pas que telle fonctionnalité a déjà été débattue pendant trois sprints. Elle lit la user story telle qu'elle est écrite, pas telle qu'on voudrait qu'elle soit.
Un exemple concret de prompt
Voici untype de prompt qui fonctionne bien dans ce contexte. Il est volontairement simple et adaptable :
« Tu es un expert QA. Analyse cette user story et identifie : 1) les ambiguïtés dans la formulation, 2) les cas limites non couverts par les critères d'acceptance, 3) les dépendances techniques ou fonctionnelles qui pourraient créer des risques, 4) les questions à poser impérativement lors du refinement. User story : [coller ici]. »
Le résultat obtenu n'est pas un rapport à valider tel quel. C'est une base de discussion. L'équipe prend ce que l'IA a produit, en écarte ce qui n'est pas pertinent dans le contexte, et conserve ce qui mérite d'être creusé. En pratique, même si seulement deux ou trois points sur dix s'avèrent réellement utiles, c'est deux ou trois bugs ou incompréhensions évités en amont.
Ce qui est intéressant, c'est que cette pratique améliore aussi la qualité des user stories elles-mêmes. Quand un PM sait que sa story va être analysée par l'IA avant le refinement, il a tendance à la rédiger avec plus de précision. L'IA crée indirectement une pression positive sur la qualité des specs.
Les conditions pour que ça marche
Introduire un 4ème amigo IA ne s'improvise pas. Quelques conditions sont nécessaires pour que la pratique soit vraiment utile et non contre-productive.
La qualité de la user story d'entrée est déterminante. Si la story est vague, décousue ou incomplète, l'IA va produire des questions génériques qui n'apportent pas grand-chose. Le garbage in, garbage out s'applique ici comme partout. L'IA amplifie ce qu'elle reçoit : une bonne story donne de bonnes questions, une story bâclée donne des questions inutiles.
Le prompt doit être adapté au contexte du projet. Un prompt générique donne des résultats génériques. Si vous travaillez sur une application bancaire, précisez-le. Si votre domaine a des contraintes réglementaires spécifiques, mentionnez-les. Plus le contexte est précis, plus les questions générées sont pertinentes.
L'équipe doit rester maître du processus. L'output de l'IA n'est pas une liste de critères d'acceptance supplémentaires à accepter sans discussion. C'est un input parmi d'autres, à traiter avec le même esprit critique que n'importe quelle autre suggestion. Si l'équipe commence à valider l'output de l'IA sans le questionner, on perd tout le bénéfice de la pratique.
Enfin, cette pratique fonctionne mieux en préparation de session qu'en live. Lancer une analyse IA pendant la réunion, partager l'écran et lire les résultats en direct peut créer plus de confusion que de valeur. Le mieux est d'intégrer l'étape IA dans la préparation du refinement, de façon à arriver en session avec des questions déjà structurées.
Ce que ça change pour le rôle du QA
L'introduction de l'IA dans le refinement renforce en réalité le rôle du QA plutôt qu'il ne le diminue. Voilà pourquoi.
Jusqu'ici, la valeur du QA dans les 3 amigos reposait en partie sur sa capacité à poser les bonnes questions. C'est une compétence précieuse, mais qui peut être perçue comme une boîte noire par le reste de l'équipe. Avec le 4ème amigo, le QA devient celui qui maîtrise l'outil, qui sait formuler le bon prompt, qui sait interpréter et filtrer les résultats, et qui anime la discussion autour des points soulevés. C'est un rôle plus visible, plus structuré, et plus stratégique.
C'est aussi une opportunité pour le QA de prendre une posture de Quality Advisor : celui qui, en amont du développement, contribue activement à la qualité des spécifications plutôt que de se contenter de tester ce qui a été livré. L'IA lui donne un levier supplémentaire pour exercer cette influence.
Le Behaviour-Driven Development, qui structure depuis longtemps la pratique des 3 amigos, évolue naturellement vers ce modèle augmenté. Les travaux de Lisa Crispin et Janet Gregory sur l'agile testing soulignent depuis longtemps l'importance du shift-left : tester plus tôt, impliquer la QA plus tôt dans le cycle. Le 4ème amigo IA est une incarnation concrète de ce principe.
A Retenir
Les 3 amigos restent une pratique fondamentale. L'IA ne les remplace pas, elle les enrichit. En introduisant une analyse automatisée des user stories avant le refinement, les équipes gagnent en profondeur d'analyse, réduisent leurs angles morts, et améliorent la qualité des discussions. Le QA, loin d'être mis sur la touche, devient le chef d'orchestre de cette pratique augmentée.
Ce n'est pas une révolution. C'est une évolution pragmatique, accessible dès aujourd'hui avec des outils gratuits, et dont les bénéfices sont visibles dès les premières sessions.
FAQ
Faut-il un outil spécifique pour le 4ème amigo ou ChatGPT suffit ? ChatGPT, Claude ou Gemini suffisent largement pour démarrer. Pas besoin d'un outil dédié. Ce qui fait la différence, ce n'est pas l'outil mais la qualité du prompt et la façon dont l'équipe exploite les résultats. Les outils comme Copilot for Azure DevOps ou les plugins Jira IA peuvent aider à automatiser l'intégration dans le workflow, mais ce n'est pas un prérequis.
Combien de temps prend l'analyse IA d'une user story ? Moins de trente secondes pour obtenir un premier output. La vraie question est le temps nécessaire pour préparer le prompt et exploiter les résultats. En pratique, comptez cinq à dix minutes par story pour une analyse sérieuse. C'est un investissement largement rentabilisé par les échanges évités en cours de sprint.
Et si l'IA soulève des questions non pertinentes ? C'est inévitable, surtout au début. L'IA ne connaît pas votre contexte produit, vos conventions internes, ni les décisions déjà prises. Il faut filtrer. Avec l'expérience et un prompt de mieux en mieux calibré, le ratio signal/bruit s'améliore nettement. Commencez par une user story simple pour vous entraîner avant de généraliser la pratique.
Les développeurs et les PMs sont-ils réceptifs à cette pratique ? Dans la grande majorité des retours terrain, oui. Les PMs apprécient d'avoir des questions structurées avant la session plutôt que des surprises en cours de réunion. Les développeurs aiment avoir des cas limites identifiés tôt. La clé est de présenter l'IA comme un outil de préparation, pas comme un audit de leur travail.
Cette pratique s'applique-t-elle aussi aux bugs et aux épics ? Tout à fait. On peut utiliser le même principe pour analyser un rapport de bug (détecter les informations manquantes, suggérer des cas de reproduction complémentaires) ou pour décomposer un épic en user stories cohérentes. La logique reste la même : utiliser l'IA pour structurer la réflexion, pas pour la remplacer.