Cloudflare bloque les robots IA mixtes sur les sites avec publicités dès septembre
À partir du 15 septembre 2026, Cloudflare va bloquer automatiquement les robots qui mélangent indexation de recherche et collecte de données pour entraîner des modèles d'IA sur les pages financées par la publicité. La mesure touche des géants comme Google et OpenAI, dont les robots parcourent des millions de sites sans reverser quoi que ce soit aux éditeurs. Pour les sites français qui monétisent leur contenu via des annonces, c'est un changement concret qui arrive sans action de leur part.
Le problème des robots « tout-en-un »
Jusqu'ici, un même robot pouvait à la fois indexer un site pour le moteur de recherche et aspirer son contenu pour entraîner une IA — deux usages très différents, mais facturés au même prix : zéro. Cloudflare, qui gère environ 20 % du trafic web mondial, a publié ses propres chiffres : Google affiche un ratio de 14 visites de robot pour 1 clic renvoyé vers l'éditeur, contre 1 700 pour 1 chez OpenAI et 73 000 pour 1 chez Anthropic. Autrement dit, les robots d'IA aspirent le contenu sans générer de trafic en retour, selon Let's Data Science.
Cloudflare cite explicitement Googlebot comme exemple de robot mixte : il sert à la fois la recherche Google et des fonctionnalités liées à Gemini, AI Overviews et AI Mode. Google opère pourtant déjà un robot séparé, Google-Extended, dédié à l'IA — ce qui lui donne une longueur d'avance sur les autres pour se conformer aux nouvelles règles.
Ce qui change concrètement
Les nouvelles règles s'appliqueront par défaut à tous les nouveaux clients, nouveaux sites et comptes gratuits Cloudflare à partir du 15 septembre. L'indexation pour les moteurs de recherche restera autorisée. En revanche, l'utilisation du contenu pour entraîner des modèles ou faire tourner des agents IA sur des pages avec publicités sera bloquée automatiquement. Les propriétaires de sites existants sous offre payante pourront choisir de s'y soumettre ou non.
En parallèle, Cloudflare renomme son service Pay Per Crawl en Pay Per Use. La nouveauté : les éditeurs seront rémunérés non plus au moment où un robot visite leur page, mais quand leur contenu apparaît réellement dans une réponse de chatbot. Les premiers partenaires sont Ceramic.AI et You.com ; le programme est ouvert à d'autres entreprises, annonce TechCrunch.
Un calendrier qui tombe avec la loi IA européenne
La date du 15 septembre n'est pas anodine. Depuis le 2 août 2026, le règlement européen sur l'IA impose aux fournisseurs de modèles GPAI — les grands modèles d'usage général — de publier les noms de domaine représentant le top 10 % de leurs données d'entraînement et de respecter les opt-out exprimés via `robots.txt` ou `ai.txt`. Les amendes peuvent atteindre 15 millions d'euros ou 3 % du chiffre d'affaires mondial, selon DataImpulse. Des éditeurs comme l'Agence France-Presse soutiennent ce type de contrôle ; la CNIL travaille de son côté à des lignes directrices sur le scraping IA compatibles avec le RGPD.
Pour les éditeurs français — médias, blogs, sites e-commerce —, la combinaison des règles Cloudflare et du règlement IA européen offre enfin un levier concret pour négocier avec les plateformes d'IA, ou simplement pour bloquer les robots sans effort supplémentaire.