25/06/2026

Pannes d'IA – Les coupures ont été multipliées par 8 en un an

Par admin

Pannes d'IA - Les coupures ont été multipliées par 8 en un an

Vous vous souvenez quand ChatGPT tombait trop souvent en rade et que ça vous faisait juste lever les yeux au ciel avant d’aller vous chercher un café en trainant de la pantoufle ??

Bah cette époque est en train de se terminer mes amis.

Les analystes d’Ookla viennent d’éplucher 471 jours de données Downdetector aux États-Unis, ce qui représente environ 3,7 millions de signalements sur les grandes plateformes IA (ChatGPT, Claude, Gemini, Copilot) + les deux géants du cloud qui les font tourner, AWS et Azure et le constat est sans appel : Du côté des applis IA, les grosses journées de panne ont été multipliées par 8 en un an. Y’en a eu 6 au premier trimestre 2025, et 51 sur le même trimestre en 2026.

Et le truc qui a changé entre l’année dernière et aujourd’hui, c’est que l’IA n’est plus un gadget optionnel. Vous l’avez branchée dans votre code, vos analyses, votre support client, vos petits automatismes du quotidien… Du coup une session qui se coupe ou une tâche d’agent qui se fige, bah ça pète du vrai boulot qui tourne à l’intérieur de vrais process métier.

Et à mon grand désarroi, le mauvais élève, c’est Claude puisqu’il concentre à lui seul 39 de ces 51 journées noires, là où Gemini en compte 7, Copilot 3 et ChatGPT 2.

Toutefois, ce chiffre est à prendre avec un peu de nuance car début 2025, Claude ne générait quasiment aucun signalement sur Downdetector, pour la simple et bonne raison que peu de gens l’utilisaient. Puis l’usage a décollé (Claude Code en tête, avec un chiffre d’affaires annualisé d’Anthropic qui bondit de 14 à 47 milliards de dollars entre février et mai), et les pannes avec.

Rien que durant le mois de mars 2026, Claude a totalisé presque 3 fois plus de signalements qu’en février. Ce n’est pas forcément qu’il est devenu moins fiable, mais c’est juste qu’il joue maintenant dans une autre cour, avec beaucoup (pardon : BEAUCOUP) plus de monde qui tape trèèèès fort dessus.

À l’inverse, ChatGPT a vu sa médiane mensuelle d’erreurs baisser entre avril 2025 et avril 2026, alors même que l’usage de Codex partait dans la stratosphère sur la même période. Plus d’utilisateurs et pourtant moins de bruit de fond, ça veut dire qu’OpenAI a sérieusement bossé la tuyauterie pour proposer un service fiable.

Mais quand une de ces plateformes tombe, ça ne veut pas forcement dire que la panne vient du modèle lui-même. En fait le problème se loge très souvent dans la couche produit que vous voyez (login, routage, gestion de la charge, files d’attente), mais également dans le cloud qui héberge tout ce petit monde, ou dans la couche d’accès (DNS, passerelles web, authentification). Bref, votre prompt qui refuse de répondre, ça peut en réaliter cacher 10 causes complètement différentes.

L’exemple le plus parlant, c’est la grosse
panne d’AWS du 20 octobre 2025
, où le système de gestion DNS est partie en toupie durant une grande partie de la journée, provoquant de nombreuses coupures dans tout un tas de services. Et 9 jours plus tard, c’était au tour d’Azure de planter. Ce ne sont pas des services IA à proprement dit mais comme ils en hébergent aussi, et bien ça se répercute sur les services.

Et c’est ça tout le piège dans lequel on s’est confortablement installé car derrière nos Claude Code, nos ChatGPT et compagnie, se cache des services essentiels détenus par une poignée de boîtes. La prochaine grosse coupure de Claude ou de ChatGPT pourrait débuter à cause d’un pauvre GPU qui lâche, d’une mauvaise config poussée en production un vendredi soir, d’un DNS qui déraille ou encore d’une simple règle de quotas foireuse.

Et côté utilisateur lambda, il n’y a malheureusement pas grand-chose à faire à part patienter en gardant un œil sur les pages de statut des services (
status.anthropic.com
,
status.openai.com
et compagnie) pour savoir si ça vient de vous ou d’eux.

Maintenant, je pense que si vous montez des
workflows sérieux à base d’agents
sur ces outils, la bonne question n’est pas de savoir si le service est en ligne. C’est plutôt de savoir quelles parties de votre boulot dépendent de quelle couche, et de ce qui va vraiment se passer le jour où l’une d’elles va se mettre à tousser sérieusement. C’est ce que les équipes IT ont appris à la dure récemment avec les
grosses pannes Microsoft 365
, sauf qu’ici la dépendance est encore plus profonde.

Source

Source : korben.info