L’IA transforme la production IT en collaboration hybride. Une conférence de l'Alenia Production Tour.
(Une conférence de Kaouther Karoui, Data Architect. Vous pouvez regarder l'intégralité de la conférence sur Youtube ou lire le résumé ci-dessous).
Vous souvenez-vous de la dernière fois où un incident de production a fait dérailler votre journée — ou votre nuit ? Serveur en panne, chaîne de données bloquée, firewall capricieux… Pendant que les équipes s’arrachent les cheveux, le business attend, l’utilisateur s’impatiente et la direction veut une explication immédiate. Bonne nouvelle : une nouvelle génération de “coéquipiers digitaux” arrive, infatigables, disponibles 24/7, capables d’apprendre de chaque erreur. Mais comment passer du chaos à l’ingénierie de plateforme augmentée par l’IA sans tomber dans le mythe du “tout automatique” ?
Bienvenue dans le terrain de jeu du chaos engineering, de l’AIOps et du platform engineering, thèmes phares du dernier Alenia Production Tour.
Les grandes organisations — banques, assurances, industriels, retailers — naviguent dans des environnements IT tentaculaires. Legacy et cloud natif cohabitent, ERP mastodontes croisent microservices agiles, et tout ce petit monde doit tourner sans interruption.
Les enjeux sont clairs :
Derrière ces enjeux techniques se cachent aussi des réalités humaines : la fatigue des équipes, la peur de l’erreur, la difficulté à se projeter dans un futur où l’IA s’invite de plus en plus dans les métiers d’exploitation.
2.1. Les cinq niveaux d’automatisation
L’IT production évolue par paliers :
La plupart des organisations oscillent entre les niveaux 2 et 3, quelques pionniers touchent du doigt le 4. Le 5 reste hors de portée, faute de données fiables (bonjour la CMDB incomplète) et de maturité culturelle.
2.2. Chaos engineering : tester pour mieux dormir
Né chez Netflix, le chaos monkey a marqué les esprits : débrancher volontairement des serveurs en production pour tester la résilience. Mais dans une banque ou un hôpital, le “tout casser pour voir” reste un fantasme dangereux.
D’où l’idée de la simulation virtuelle : répliquer son SI, injecter des pannes, mesurer les réactions… et identifier les points de rupture avant qu’ils ne surviennent. Une assurance-vie pour les DSI qui redoutent le “syndrome du domino” : une petite panne locale qui dégénère en crise systémique.
2.3. AIOps : l’espoir d’une production augmentée
L’AIOps, c’est l’IA au service des Ops :
L’idée n’est pas de remplacer les SRE (Site Reliability Engineers) mais de les augmenter. Comme un copilote numérique, l’IA agrège signaux faibles, historique d’incidents, documentation, et propose des pistes de résolution.
3.1. Économique : coût du chaos vs investissement IA
Chaque minute d’indisponibilité coûte des milliers (voire millions) d’euros, sans compter la réputation. L’automatisation intelligente promet de réduire drastiquement ces pertes.
Mais l’investissement est lourd : collecter et fiabiliser la donnée, former les équipes, acheter ou développer des outils. Le ROI ne vient pas du jour au lendemain : il se mesure en incidents évités, en productivité retrouvée, en sérénité gagnée.
3.2. Juridique & réglementaire : l’IA sous contrôle
Dans des secteurs régulés, pas question de laisser un agent IA “bidouiller” un pare-feu sans garde-fous. D’où l’importance des circuit breakers : mécanismes de coupure qui stoppent l’agent s’il sort de son périmètre.
Transparence et traçabilité deviennent clés : pouvoir expliquer qui a fait quoi, quand, et pourquoi. Sans cette auditabilité, impossible d’être conforme — ni de bâtir la confiance des métiers.
3.3. Technologique : la bataille des données
Le nerf de la guerre, c’est la donnée :
Sans ces fondations, l’AIOps reste un château de cartes.
3.4. Organisationnel : du top-down au bottom-up
Deux approches se complètent :
Les hackathons internes apparaissent comme un bon compromis : en quelques jours, aligner vision stratégique et savoir-faire terrain.
3.5. Culturel et humain : la peur du remplacement
La résistance au changement est forte : “L’IA va-t-elle prendre mon job ?”. La clé est de positionner l’IA comme un collègue, pas comme un remplaçant.
C’est une transformation identitaire autant que technologique.
4.1. Construire la confiance par étapes
Un agent IA ne doit pas être lâché en production comme un stagiaire livré à lui-même. La recette :
4.2. Mettre des garde-fous
4.3. Outiller le terrain
Les fondamentaux à poser :
4.4. Préparer les équipes
Parce qu’une production sans expérimentation, c’est une production figée. Et une production figée… finit toujours par casser.
Nous sommes probablement la dernière génération à travailler dans des équipes 100 % humaines en production. Bientôt, les équipes seront hybrides : humains + agents IA, chacun avec ses forces et ses limites.
Cela pose une question passionnante : quelle culture allons-nous créer dans ces équipes mixtes ?
Une culture de défiance (“l’IA va nous remplacer”) ou une culture de collaboration (“l’IA nous libère de la charge inutile”) ?
Le chaos engineering nous apprend une leçon : il vaut mieux casser volontairement et apprendre que subir passivement la panne. Alors pourquoi ne pas appliquer cette logique à l’IA en production ? Expérimentons, testons, échouons vite et apprenons.
Parce que demain, le chaos sera toujours là. Mais nous aurons peut-être appris à en faire un allié.
Passer du chaos à l’ingénierie de plateforme augmentée n’est pas un sprint mais une transformation profonde. Elle demande de la donnée fiable, des garde-fous, une gouvernance éclairée… mais surtout une nouvelle façon de penser le travail en production.
L’IA ne sera jamais le pompier parfait. Mais elle peut devenir ce collègue infatigable qui nous aide à tenir la garde de nuit sans perdre notre humanité.
À nous de décider si nous voulons la subir, ou l’inviter dans notre équipe.