Shaare your links...
34134 links
Liens en vrac de sebsauvage Home Login RSS Feed ATOM Feed Tag cloud Picture wall Daily
Links per page: 20 50 100
page 1 / 1
  • sécurité technologie
    Il suffit d'une longue phrase sans point final pour faire vaciller les garde-fous des grands modèles de langage : les chercheurs de Palo Alto ont démontré à quel point leur vernis de sécurité peut être fragile
    La n-ième attaque pour contourner la sécurité des IA (après : "ma grand-mère est morte...", après "Imagine le scénario d'un film", après "je te parle en base64", après "je te parle en morse") : voici "je fais une phrase interminable."
    Au niveau de la sécurité les IA sont des passoires. Des passoires avec un nombre infini de trous.

    EDIT: On peut aussi les flatter et utiliser plein d'autres techniques: https://www.theverge.com/news/768508/chatbots-are-susceptible-to-flattery-and-peer-pressure
    2025-09-01 08:46:34
    https://intelligence-artificielle.developpez.com/actu/375232/Il-suffit-d-une-longue-phrase-sans-point-final-pour-faire-vaciller-les-garde-fous-des-grands-modeles-de-langage-les-chercheurs-de-Palo-Alto-ont-demontre-a-quel-point-leur-vernis-de-securite-peut-etre-fragile/
Links per page: 20 50 100
page 1 / 1
Shaarli 0.0.41 beta modifiée - 2022-08-11 - The personal, minimalist, super-fast, no-database delicious clone. By sebsauvage.net. Theme by idleman.fr. I'm on Mastodon.
shelter.moe