Fouilles de données sur le web, comment s'en protéger - Alsacreations
Je respecte beaucoup AlsaCréations, mais là cet article c'est du "wishful thinking".
On sait que les boîtes d'IA mentent sur leur User-Agent, ne respectent pas les robots.txt et vont même jusqu'à louer des IP d'internautes via certaines sociétés pour scraper les sites avec des adresses IP qui lèvent moins de doutes.
Non vraiment, toutes ces solutions pour leur demander "gentiment" de ne pas scraper, c'est une pure perte de temps. Seule une grosse claque dans la gueule façon Anubis peut marcher.
Et je suis gêné par la posture morale d'AlsaCréation. En gros : "Si vous utilisez l'IA au quotidien, moralement il faut laisser les boîtes d'IA scraper votre site."
Ainsi que "...afin que tout un chacun puisse bénéficier sereinement de l'intelligence artificielle."
Personne ne va bénéficier *sereinement* de l'IA (des LLM généralistes, en l'occurence).
Ça a un impact écologique monstrueux en consommant une quantité massive d'énergie, ça exploite des travailleurs sous-payés pour tagguer les données d'entrainement, c'est dans les mains de milliardaires fachos dans un pays tenu par un dictateur, aucune IA n'est actuellement rentable ni pérenne économiquement, ça vole massivement le travail des créateurs tout en leur faisant perdre du travail, c'est utilisé pour asservir économiquement et politiquement la population en l'influençant, c'est pas fiable et ça invente n'importe quoi, c'est massivement utilisé pour nous surveiller et aussi nous arnaquer, c'est exploité à fond par les GAFAM pour leur économie de l'attention, ça introduit des risques de sécurité.
Ça. ne. sera. serein. pour. personne.
Sauf pour les milliardaires qui possèdent ces technologies et qui espèrent vous rendre accros très vite.
2025-07-09 08:18:11
https://www.alsacreations.com/article/lire/1952-fouilles-de-donnees-web-comment-s-en-proteger.html