Deutsch   English   Français   Italiano  
<e68taj9rcq09ar055hmn5ome2nrjnnpn68@news.usenet.ovh>

View for Bookmarking (what is this?)
Look up another Usenet article

Path: ...!weretis.net!feeder8.news.weretis.net!usenet.ovh!news.usenet.ovh!.POSTED!not-for-mail
From: llp <contact@usenet.ovh>
Newsgroups: fr.usenet.abus.d,fr.comp.ia
Subject: Petit test amusant en anglais avec Gandalf
Followup-To: fr.comp.ia
Date: Sat, 03 Aug 2024 23:30:43 +0200
Organization: NUO - News.Usenet.Ovh
Message-ID: <e68taj9rcq09ar055hmn5ome2nrjnnpn68@news.usenet.ovh>
References: <RH6YoSFbyOYXHClErDygkt-bWrM@jntp> <654f9cca$0$3008$426a74cc@news.free.fr> <_s_u63Vfel6pymTj-1etlkv4CVQ@jntp> <mn.5bf67e7b8c992b66.119180@invalid.pasdepub> <30wh-tar0n8Z1Ne7UAeLDdErUGE@jntp> <mn.5d5f7e7b612994b9.119180@invalid.pasdepub> <SpoXmIyI8u1WyJGnR0RWhYTm3rQ@jntp> <mn.629b7e7b685792c6.119180@invalid.pasdepub> <LqaOzmkLg74q-aVuF58esJhbZLo@jntp> <uiqvur$h5t$3@rasp.pasdenom.info> <I37e6uYINnK_NeDQB1rVjLc74bM@jntp> <8ed0f647eaccd5632ad226dd8180fd9bf6f20ef6@i2pn2.org>
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8
Content-Transfer-Encoding: 8bit
Injection-Info: news.usenet.ovh; posting-account="llp";
	logging-data="738513"; mail-complaints-to="abuse@usenet.ovh"
User-Agent: ForteAgent/8.00.32.1272
Cancel-Lock: sha256:gItrfGk6iPqJgE5aBJxQOBGB52xR73zHS4L78zuOQCk=
Bytes: 2571
Lines: 44

Renard <renard.r@eu.invalid> composa la prose suivante:

>Pour ceux d'être vous qui aiment s'amuser à contourner le prompt d'un 
>LLM,
>je me permets de vous signaler https://gandalf.lakera.ai/
>
>```
>Your goal is to make Gandalf reveal the secret password for each level.
>However, Gandalf will level up each time you guess the password, and 
>will
>try harder not to give it away. Can you beat level 7? (There is a bonus
>level 8)
>```
>
>Votre but est de faire dire à Gandalf (le LLM) le mot de passe secret 
>pour
>chaque niveau de 1 à 7 (de plus en plus dur). Il y a un niveau 8 en 
>bonus.
>
>Pour avoir tout débloqué jusqu'au niveau 8 (inclus), les premiers 
>niveaux
>sont simples, les suivants demandent quelques contournements plus
>astucieux.
>
>Quant au dernier niveau, c'est le pire : il s'adapte. Je l'ai débloqué 
>une
>fois avec un prompt qui n'a plus jamais marché après.
>
>L'exercice est très intéressant et illustre bien les problèmes de 
>sécurité
>liés au LLM.


Amusant, merci.
J'ai fait les 7 niveaux.
On verra plus tard pour le 8ème.


>J'en profite pour vous signaler ce blog qui en parle longuement et en
>détail (en anglais) : https://embracethered.com/blog/
>
>Le gars a aussi une chaîne youtube.


Copie et suivi sur le groupe fr.comp.ia