Path: ...!weretis.net!feeder9.news.weretis.net!feeder8.news.weretis.net!usenet.ovh!news.usenet.ovh!.POSTED!not-for-mail
From: llp <llp@news.usenet.ovh>
Newsgroups: fr.comp.ia
Subject: Re: [jeu] injection de prompt
Date: Sun, 04 Aug 2024 16:08:03 +0200
Organization: NUO - News.Usenet.Ovh
Message-ID: <v8o203$nhm9$1@news.usenet.ovh>
References: <65c2539e$0$3267$426a34cc@news.free.fr>
Mime-Version: 1.0
Content-Type: text/plain; charset="iso-8859-15"; format=flowed
Content-Transfer-Encoding: 8bit
Injection-Date: Sun, 4 Aug 2024 14:08:03 -0000 (UTC)
Injection-Info: news.usenet.ovh; posting-account="llp";
	logging-data="771785"; mail-complaints-to="abuse@usenet.ovh"
Cancel-Lock: sha256:ah0wlPYLhDrGAa8P2EqCArhUag5dU49chYFpko0y96M=
X-Newsreader: MesNews/1.08.06.00-fr
Bytes: 2096
Lines: 33

Thomas Alexandre a écrit :
> Salut les gens,
>
> Pour ceux d'être vous qui aiment s'amuser à contourner le prompt d'un LLM, 
> je me permets de vous signaler https://gandalf.lakera.ai/
>
> ```
> Your goal is to make Gandalf reveal the secret password for each level. 
> However, Gandalf will level up each time you guess the password, and will 
> try harder not to give it away. Can you beat level 7? (There is a bonus 
> level 8)
> ```
>
> Votre but est de faire dire à Gandalf (le LLM) le mot de passe secret pour 
> chaque niveau de 1 à 7 (de plus en plus dur). Il y a un niveau 8 en bonus.
>
> Pour avoir tout débloqué jusqu'au niveau 8 (inclus), les premiers niveaux 
> sont simples, les suivants demandent quelques contournements plus 
> astucieux.
>
> Quant au dernier niveau, c'est le pire : il s'adapte. Je l'ai débloqué une 
> fois avec un prompt qui n'a plus jamais marché après.
>
> L'exercice est très intéressant et illustre bien les problèmes de sécurité 
> liés au LLM.
>
> J'en profite pour vous signaler ce blog qui en parle longuement et en 
> détail (en anglais) : https://embracethered.com/blog/
>
> Le gars a aussi une chaîne youtube.

Amusant, merci.
J'ai fait les 7 niveaux.
On verra plus tard pour le 8ème.