Path: ...!weretis.net!feeder9.news.weretis.net!feeder8.news.weretis.net!usenet.ovh!news.usenet.ovh!.POSTED!not-for-mail From: llp Newsgroups: fr.comp.ia Subject: Re: [jeu] injection de prompt Date: Sun, 04 Aug 2024 16:08:03 +0200 Organization: NUO - News.Usenet.Ovh Message-ID: References: <65c2539e$0$3267$426a34cc@news.free.fr> Mime-Version: 1.0 Content-Type: text/plain; charset="iso-8859-15"; format=flowed Content-Transfer-Encoding: 8bit Injection-Date: Sun, 4 Aug 2024 14:08:03 -0000 (UTC) Injection-Info: news.usenet.ovh; posting-account="llp"; logging-data="771785"; mail-complaints-to="abuse@usenet.ovh" Cancel-Lock: sha256:ah0wlPYLhDrGAa8P2EqCArhUag5dU49chYFpko0y96M= X-Newsreader: MesNews/1.08.06.00-fr Bytes: 2096 Lines: 33 Thomas Alexandre a écrit : > Salut les gens, > > Pour ceux d'être vous qui aiment s'amuser à contourner le prompt d'un LLM, > je me permets de vous signaler https://gandalf.lakera.ai/ > > ``` > Your goal is to make Gandalf reveal the secret password for each level. > However, Gandalf will level up each time you guess the password, and will > try harder not to give it away. Can you beat level 7? (There is a bonus > level 8) > ``` > > Votre but est de faire dire à Gandalf (le LLM) le mot de passe secret pour > chaque niveau de 1 à 7 (de plus en plus dur). Il y a un niveau 8 en bonus. > > Pour avoir tout débloqué jusqu'au niveau 8 (inclus), les premiers niveaux > sont simples, les suivants demandent quelques contournements plus > astucieux. > > Quant au dernier niveau, c'est le pire : il s'adapte. Je l'ai débloqué une > fois avec un prompt qui n'a plus jamais marché après. > > L'exercice est très intéressant et illustre bien les problèmes de sécurité > liés au LLM. > > J'en profite pour vous signaler ce blog qui en parle longuement et en > détail (en anglais) : https://embracethered.com/blog/ > > Le gars a aussi une chaîne youtube. Amusant, merci. J'ai fait les 7 niveaux. On verra plus tard pour le 8ème.