Cloudflare a expliqué la plus grande panne : non, ce n'était pas un hacker — c'était… un fichier

Par: Russell Thompson | 19.11.2025, 12:47

La panne mondiale de Cloudflare, qui le 18 novembre a interrompu l'accès à ChatGPT, X, Downdetector et à de nombreux autres grands sites, n'était pas une cyberattaque à grande échelle. Bien que l'entreprise ait initialement suspecté une hyper-DDOS, plus tard le PDG de Cloudflare Matthew Prince a reconnu : la source du problème était une erreur interne dans le système de gestion des bots.

Dans un rapport détaillé, Prince a noté que la panne a été causée par un changement dans le mécanisme de mise à jour du fichier de configuration, utilisé par le machine learning de Cloudflare pour évaluer le « comportement bot » de chaque requête. Ce fichier est mis à jour toutes les quelques minutes, et le changement dans le fonctionnement de la base de données ClickHouse a conduit à la création d'un grand nombre de « lignes caractéristiques » dupliquées. Le fichier a rapidement grossi, dépassé les limites de mémoire acceptables et commencé à casser le principal proxy de l'entreprise.

Prince s'est publiquement excusé et a souligné : la panne n'est liée ni à des hackers, ni à des attaques DDoS, ni à l'IA générative.

Comment l'erreur a affecté le web

Le problème a touché spécifiquement les sites qui reposent sur les règles de blocage des bots de Cloudflare. En raison de mauvaises évaluations de bots, ils ont commencé à rejeter des requêtes utilisateur tout à fait normales. En conséquence, les grands services semblaient « en panne », tandis que ceux qui n'utilisaient pas le module de gestion des bots continuaient de fonctionner sans problème.

Selon Cloudflare, c'est l'incident le plus grave depuis 2019, lorsque un bug dans l'un des modules a également provoqué l'effondrement du réseau principal. La situation d'aujourd'hui s'est avérée similaire : une mise à jour ratée - et 20% d'internet commence à renvoyer des erreurs 5xx.

Pourquoi Cloudflare s'est-il préoccupé de la gestion des bots

Le système de gestion des bots est devenu particulièrement pertinent à l'ère de l'intelligence artificielle. Les sites bloquent de plus en plus les bots IA agressifs qui téléchargent illégalement leur contenu pour entraîner des modèles. Cloudflare teste même un programme « payez pour ramper », permettant aux sites de générer des revenus grâce à l'accès pour les services d'IA.

L'ironie, c'est que c'est précisément le module responsable de la lutte contre les bots qui a temporairement « fait tomber » la moitié des utilisateurs réels.

Ce que Cloudflare promet de faire

L'entreprise a annoncé quatre étapes pour prévenir de telles catastrophes :

  • renforcer le traitement des configurations internes
  • interrupteurs globaux de fonctionnalité (feature kill-switches)
  • protéger les systèmes contre la surcharge par les rapports d'erreurs
  • réviser le comportement de tous les modules proxy en cas d'erreurs critiques

Source : Cloudflare