Path: ...!weretis.net!feeder8.news.weretis.net!usenet.ovh!news.usenet.ovh!.POSTED!not-for-mail From: llp Newsgroups: fr.usenet.abus.d,fr.comp.ia Subject: Petit test amusant en anglais avec Gandalf Followup-To: fr.comp.ia Date: Sat, 03 Aug 2024 23:30:43 +0200 Organization: NUO - News.Usenet.Ovh Message-ID: References: <654f9cca$0$3008$426a74cc@news.free.fr> <_s_u63Vfel6pymTj-1etlkv4CVQ@jntp> <30wh-tar0n8Z1Ne7UAeLDdErUGE@jntp> <8ed0f647eaccd5632ad226dd8180fd9bf6f20ef6@i2pn2.org> Mime-Version: 1.0 Content-Type: text/plain; charset=utf-8 Content-Transfer-Encoding: 8bit Injection-Info: news.usenet.ovh; posting-account="llp"; logging-data="738513"; mail-complaints-to="abuse@usenet.ovh" User-Agent: ForteAgent/8.00.32.1272 Cancel-Lock: sha256:gItrfGk6iPqJgE5aBJxQOBGB52xR73zHS4L78zuOQCk= Bytes: 2571 Lines: 44 Renard composa la prose suivante: >Pour ceux d'être vous qui aiment s'amuser à contourner le prompt d'un >LLM, >je me permets de vous signaler https://gandalf.lakera.ai/ > >``` >Your goal is to make Gandalf reveal the secret password for each level. >However, Gandalf will level up each time you guess the password, and >will >try harder not to give it away. Can you beat level 7? (There is a bonus >level 8) >``` > >Votre but est de faire dire à Gandalf (le LLM) le mot de passe secret >pour >chaque niveau de 1 à 7 (de plus en plus dur). Il y a un niveau 8 en >bonus. > >Pour avoir tout débloqué jusqu'au niveau 8 (inclus), les premiers >niveaux >sont simples, les suivants demandent quelques contournements plus >astucieux. > >Quant au dernier niveau, c'est le pire : il s'adapte. Je l'ai débloqué >une >fois avec un prompt qui n'a plus jamais marché après. > >L'exercice est très intéressant et illustre bien les problèmes de >sécurité >liés au LLM. Amusant, merci. J'ai fait les 7 niveaux. On verra plus tard pour le 8ème. >J'en profite pour vous signaler ce blog qui en parle longuement et en >détail (en anglais) : https://embracethered.com/blog/ > >Le gars a aussi une chaîne youtube. Copie et suivi sur le groupe fr.comp.ia