La bataille des éditeurs de presse face à Common Crawl continue

Source : NEXT INpact

Publié le : mercredi 5 novembre 2025 à 13:33

Alors que Common Crawl fournit des téraoctets de données d’entrainement aux entreprises d’IA générative, l’organisation est accusée de récupérer des contenus placés derrière des paywalls. La presse, en France ou ailleurs, essaye de bloquer l’aspiration de ses contenus via des procédures judiciaires, mais la plupart des paywalls laissent des trous pour jouer le jeu de […]

Lire le reste de l'article sur NEXT INpact.