Path: ...!news.mixmin.net!proxad.net!feeder1-2.proxad.net!usenet-fr.net!.POSTED!not-for-mail From: Olivier Miakinen Newsgroups: fr.comp.lang.python Subject: =?UTF-8?Q?Re:_Propri=c3=a9t=c3=a9s_Unicode_dans_les_regex_Python?= Date: Wed, 9 Nov 2022 15:12:34 +0100 Organization: There's no cabale Lines: 29 Message-ID: References: <63680b04$0$3005$426a74cc@news.free.fr> <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid> NNTP-Posting-Host: pa-129.182.162.208.frcl.bull.fr Mime-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit X-Trace: cabale.usenet-fr.net 1668003153 19710 129.182.162.208 (9 Nov 2022 14:12:33 GMT) X-Complaints-To: abuse@usenet-fr.net NNTP-Posting-Date: Wed, 9 Nov 2022 14:12:33 +0000 (UTC) User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0 SeaMonkey/2.53.1 In-Reply-To: <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid> Bytes: 2285 Le 09/11/2022 à 14:13, Alain Ketterlin m'a répondu : > > D'après https://www.compart.com/en/unicode/category/Lu il y a 1791 > caractères Unicode dans la catégorie Lu. Donc si tu veux construire une > expression régulière re en remplaçant "\p{Lu}" par "[.....]" dans une > expression régulière pcre, tu vas aboutir à une expression énorme... Certes ! :-) Sans compter que cette collection peut augmenter au fil des différentes versions d'Unicode. > Mais effectivement, si tu n'as pas vraiment besoin d'une expression > régulière et que le test de correspondance peut être fait "à la main", > c'est une solution. Je posais la question pour un outil dans lequel tout se fait par expressions régulières. Par conséquent le module unicodedata ne peut pas me servir directement pour cela, mais il pourrait m'être utile dans d'autres circonstances et je remercie encore Stefan de me l'avoir fait découvrir. Pour l'heure je vais me contenter des [A-Z] ou [a-z], quitte à y ajouter des caractères accentués au cas par cas. Cordialement, -- Olivier Miakinen