Path: ...!3.eu.feeder.erje.net!feeder.erje.net!proxad.net!feeder1-2.proxad.net!usenet-fr.net!.POSTED!not-for-mail From: Olivier Miakinen Newsgroups: fr.comp.lang.python Subject: =?UTF-8?Q?Re:_Un_caract=c3=a8re_sp=c3=a9cial...?= Date: Wed, 19 Oct 2022 17:18:56 +0200 Organization: There's no cabale Lines: 24 Message-ID: References: NNTP-Posting-Host: pa-129.182.162.217.frcl.bull.fr Mime-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit X-Trace: cabale.usenet-fr.net 1666192736 62584 129.182.162.217 (19 Oct 2022 15:18:56 GMT) X-Complaints-To: abuse@usenet-fr.net NNTP-Posting-Date: Wed, 19 Oct 2022 15:18:56 +0000 (UTC) User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0 SeaMonkey/2.53.1 In-Reply-To: Bytes: 2021 Bonjour, Le 19/10/2022 à 14:29, duareb a écrit : > Après l'importation d'un fichier texte de nombres entiers , les éléments ont été > transformés : par exemple l'entier écrit '1 549' est devenu '1 549', Visiblement, le fichier était en UTF-8, et après l'importation il est lu comme si c'était du CP1252 (version Windows du Latin1). En effet,   = E2 80 AF (en CP1252), et l'encodage UTF-8 E2 80 AF est celui de l'espace insécable étroite U+202F ( ). Pour obtenir une conversion parfaite, tu dois arriver à dire que tu pars d'un fichier UTF-8, et si possible que tu veux aussi avoir à l'arrivée un résultat en UTF-8, puisque le caractère « espace insécable étroite » n'existe pas dans CP1252. Sinon, si tu veux juste virer ces caractères, tu peux soit le faire dans le fichier texte avant importation, soit dans le résultat importé en utilisant des expressions rationnelles si tu ne peux pas copier-coller le caractère macron. -- Olivier Miakinen