Deutsch   English   Français   Italiano  
<tkgcgh$j7u$1@cabale.usenet-fr.net>

View for Bookmarking (what is this?)
Look up another Usenet article

Path: ...!news.mixmin.net!proxad.net!feeder1-2.proxad.net!usenet-fr.net!.POSTED!not-for-mail
From: Olivier Miakinen <om+news@miakinen.net>
Newsgroups: fr.comp.lang.python
Subject: =?UTF-8?Q?Re:_Propri=c3=a9t=c3=a9s_Unicode_dans_les_regex_Python?=
Date: Wed, 9 Nov 2022 15:12:34 +0100
Organization: There's no cabale
Lines: 29
Message-ID: <tkgcgh$j7u$1@cabale.usenet-fr.net>
References: <tk67uo$1b37$1@cabale.usenet-fr.net>
 <63680b04$0$3005$426a74cc@news.free.fr>
 <unicodedata-20221109092838@ram.dialup.fu-berlin.de>
 <tkg09p$glm$1@cabale.usenet-fr.net>
 <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid>
NNTP-Posting-Host: pa-129.182.162.208.frcl.bull.fr
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: cabale.usenet-fr.net 1668003153 19710 129.182.162.208 (9 Nov 2022 14:12:33 GMT)
X-Complaints-To: abuse@usenet-fr.net
NNTP-Posting-Date: Wed, 9 Nov 2022 14:12:33 +0000 (UTC)
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:60.0) Gecko/20100101
 Firefox/60.0 SeaMonkey/2.53.1
In-Reply-To: <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid>
Bytes: 2285

Le 09/11/2022 à 14:13, Alain Ketterlin m'a répondu :
> 
> D'après https://www.compart.com/en/unicode/category/Lu il y a 1791
> caractères Unicode dans la catégorie Lu. Donc si tu veux construire une
> expression régulière re en remplaçant "\p{Lu}" par "[.....]" dans une
> expression régulière pcre, tu vas aboutir à une expression énorme...

Certes ! :-)

Sans compter que cette collection peut augmenter au fil des différentes
versions d'Unicode.

> Mais effectivement, si tu n'as pas vraiment besoin d'une expression
> régulière et que le test de correspondance peut être fait "à la main",
> c'est une solution.

Je posais la question pour un outil dans lequel tout se fait par
expressions régulières. Par conséquent le module unicodedata ne peut
pas me servir directement pour cela, mais il pourrait m'être utile
dans d'autres circonstances et je remercie encore Stefan de me l'avoir
fait découvrir.

Pour l'heure je vais me contenter des [A-Z] ou [a-z], quitte à y
ajouter des caractères accentués au cas par cas.

Cordialement,

-- 
Olivier Miakinen