Deutsch   English   Français   Italiano  
<63680b04$0$3005$426a74cc@news.free.fr>

View for Bookmarking (what is this?)
Look up another Usenet article

Path: ...!news.mixmin.net!feeder1-2.proxad.net!proxad.net!feeder1-1.proxad.net!cleanfeed1-a.proxad.net!nnrp1-2.free.fr!not-for-mail
Date: Sun, 6 Nov 2022 20:29:07 +0100
MIME-Version: 1.0
User-Agent: Mozilla/5.0 (Windows NT 10.0; rv:102.0) Gecko/20100101
 Thunderbird/102.4.1
Subject: =?UTF-8?Q?Re=3a_Propri=c3=a9t=c3=a9s_Unicode_dans_les_regex_Python?=
Content-Language: fr
Newsgroups: fr.comp.lang.python
References: <tk67uo$1b37$1@cabale.usenet-fr.net>
From: ast <ast@invalid>
In-Reply-To: <tk67uo$1b37$1@cabale.usenet-fr.net>
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
Lines: 34
Message-ID: <63680b04$0$3005$426a74cc@news.free.fr>
Organization: Guest of ProXad - France
NNTP-Posting-Date: 06 Nov 2022 20:29:08 CET
NNTP-Posting-Host: 91.170.32.5
X-Trace: 1667762948 news-3.free.fr 3005 91.170.32.5:12419
X-Complaints-To: abuse@proxad.net
Bytes: 1918

Le 05/11/2022 à 18:53, Olivier Miakinen a écrit :
> [diapublication avec f.c.l.regexp, suivi vers f.c.l.python]
> 
> Bonjour,
> 
> 
> Je viens de me rendre compte que dans Python 3.8.10 les propriétés Unicode
> \p{xx} et \P{xx} ne sont pas supportées dans les regex :
> 
> <https://www.pcre.org/original/doc/html/pcresyntax.html#SEC4>
> <https://www.pcre.org/original/doc/html/pcresyntax.html#SEC5>
> 
> 
> J'obtiens :
>    File "/usr/lib/python3.8/sre_parse.py", line 426, in _escape
>      raise source.error("bad escape %s" % escape, len(escape))
> re.error: bad escape \p at position 0
> 
> 
> Est-ce que quelqu'un sait si c'est supporté dans une autre version de
> Python, ou s'il est prévu que ça le soit un jour ?
> 
> 
> Cordialement,

Semble fonctionner avec le module regex qui est bien plus complet que re

pip install regex


 >>> regex.search(r"\p{Lu}", "abcdEfgh")
<regex.Match object; span=(4, 5), match='E'>