Deutsch English Français Italiano |
<87mt94306r.fsf@universite-de-strasbourg.fr.invalid> View for Bookmarking (what is this?) Look up another Usenet article |
Path: ...!weretis.net!feeder8.news.weretis.net!news.mixmin.net!aioe.org!kHnzHQPYRqPEXuGPl1BLfw.user.46.165.242.75.POSTED!not-for-mail From: Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> Newsgroups: fr.comp.lang.python Subject: Re: =?utf-8?B?UHJvcHJpw6l0w6lz?= Unicode dans les regex Python Date: Sun, 06 Nov 2022 10:24:28 +0100 Organization: =?utf-8?Q?Universit=C3=A9?= de Strasbourg Message-ID: <87mt94306r.fsf@universite-de-strasbourg.fr.invalid> References: <tk67uo$1b37$1@cabale.usenet-fr.net> Mime-Version: 1.0 Content-Type: text/plain; charset=utf-8 Content-Transfer-Encoding: quoted-printable Injection-Info: gioia.aioe.org; logging-data="7809"; posting-host="kHnzHQPYRqPEXuGPl1BLfw.user.gioia.aioe.org"; mail-complaints-to="abuse@aioe.org"; User-Agent: Gnus/5.13 (Gnus v5.13) Emacs/25.2 (gnu/linux) Cancel-Lock: sha1:zxxeVgdRePouiwje93ydYd2J1Jc= X-Notice: Filtered by postfilter v. 0.9.2 Bytes: 2345 Lines: 39 Olivier Miakinen <om+news@miakinen.net> writes: > Je viens de me rendre compte que dans Python 3.8.10 les propri=C3=A9t=C3= =A9s Unicode > \p{xx} et \P{xx} ne sont pas support=C3=A9es dans les regex : > > <https://www.pcre.org/original/doc/html/pcresyntax.html#SEC4> > <https://www.pcre.org/original/doc/html/pcresyntax.html#SEC5> > > > J'obtiens : > File "/usr/lib/python3.8/sre_parse.py", line 426, in _escape > raise source.error("bad escape %s" % escape, len(escape)) > re.error: bad escape \p at position 0 Oui, re ne fournit qu'une partie des "escapes" de pcre (il manque aussi \h et \v et d'autres). > Est-ce que quelqu'un sait si c'est support=C3=A9 dans une autre version de > Python, ou s'il est pr=C3=A9vu que =C3=A7a le soit un jour ? Je ne sais pas, mais je sais qu'une biblioth=C3=A8que du niveau de PCRE est un tr=C3=A8s gros boulot, et pas forc=C3=A9ment une priorit=C3=A9 pour Pyth= on j'imagine. Cela =C3=A9tant, la doc mentionne une biblioth=C3=A8que "regex", qui appare= mment a bonne r=C3=A9putation. Je n'en sais pas plus. https://docs.python.org/3/library/re.html ("See also" =C3=A0 la fin de l'in= tro) https://stackoverflow.com/questions/7063420/perl-compatible-regular-express= ion-pcre-in-python (Le second lien est une r=C3=A9ponse ancienne, mais qui me semble bien inform=C3=A9e.) -- Alain.