Deutsch   English   Français   Italiano  
<87mt94306r.fsf@universite-de-strasbourg.fr.invalid>

View for Bookmarking (what is this?)
Look up another Usenet article

Path: ...!weretis.net!feeder8.news.weretis.net!news.mixmin.net!aioe.org!kHnzHQPYRqPEXuGPl1BLfw.user.46.165.242.75.POSTED!not-for-mail
From: Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid>
Newsgroups: fr.comp.lang.python
Subject: Re: =?utf-8?B?UHJvcHJpw6l0w6lz?= Unicode dans les regex Python
Date: Sun, 06 Nov 2022 10:24:28 +0100
Organization: =?utf-8?Q?Universit=C3=A9?= de Strasbourg
Message-ID: <87mt94306r.fsf@universite-de-strasbourg.fr.invalid>
References: <tk67uo$1b37$1@cabale.usenet-fr.net>
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8
Content-Transfer-Encoding: quoted-printable
Injection-Info: gioia.aioe.org; logging-data="7809"; posting-host="kHnzHQPYRqPEXuGPl1BLfw.user.gioia.aioe.org"; mail-complaints-to="abuse@aioe.org";
User-Agent: Gnus/5.13 (Gnus v5.13) Emacs/25.2 (gnu/linux)
Cancel-Lock: sha1:zxxeVgdRePouiwje93ydYd2J1Jc=
X-Notice: Filtered by postfilter v. 0.9.2
Bytes: 2345
Lines: 39

Olivier Miakinen <om+news@miakinen.net> writes:

> Je viens de me rendre compte que dans Python 3.8.10 les propri=C3=A9t=C3=
=A9s Unicode
> \p{xx} et \P{xx} ne sont pas support=C3=A9es dans les regex :
>
> <https://www.pcre.org/original/doc/html/pcresyntax.html#SEC4>
> <https://www.pcre.org/original/doc/html/pcresyntax.html#SEC5>
>
>
> J'obtiens :
>   File "/usr/lib/python3.8/sre_parse.py", line 426, in _escape
>     raise source.error("bad escape %s" % escape, len(escape))
> re.error: bad escape \p at position 0

Oui, re ne fournit qu'une partie des "escapes" de pcre (il manque aussi
\h et \v et d'autres).

> Est-ce que quelqu'un sait si c'est support=C3=A9 dans une autre version de
> Python, ou s'il est pr=C3=A9vu que =C3=A7a le soit un jour ?

Je ne sais pas, mais je sais qu'une biblioth=C3=A8que du niveau de PCRE est
un tr=C3=A8s gros boulot, et pas forc=C3=A9ment une priorit=C3=A9 pour Pyth=
on
j'imagine.

Cela =C3=A9tant, la doc mentionne une biblioth=C3=A8que "regex", qui appare=
mment a
bonne r=C3=A9putation. Je n'en sais pas plus.

https://docs.python.org/3/library/re.html ("See also" =C3=A0 la fin de l'in=
tro)

https://stackoverflow.com/questions/7063420/perl-compatible-regular-express=
ion-pcre-in-python

(Le second lien est une r=C3=A9ponse ancienne, mais qui me semble bien
inform=C3=A9e.)

-- Alain.