Deutsch English Français Italiano |
<slrnuqhp83.v00.doug.letough@arcadia.local.mcos.nc> View for Bookmarking (what is this?) Look up another Usenet article |
Path: ...!weretis.net!feeder8.news.weretis.net!pasdenom.info!.POSTED.host-202-22-152-66.static.lagoon.nc!not-for-mail From: Doug713705 <doug.letough@free.fr> Newsgroups: fr.comp.usenet.serveurs Subject: Re: Encodage, charset et type MIME Followup-To: fr.comp.usenet.lecteurs-de-news Date: Thu, 18 Jan 2024 08:44:51 -0000 (UTC) Organization: redatomik.org Message-ID: <slrnuqhp83.v00.doug.letough@arcadia.local.mcos.nc> References: <slrnuqhnvu.nfk.doug.letough@arcadia.local.mcos.nc> Reply-To: Doug Le Tough <doug.letough@free.fr> MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Injection-Date: Thu, 18 Jan 2024 08:44:51 -0000 (UTC) Injection-Info: rasp.pasdenom.info; posting-account="doug.letough@usenet"; posting-host="host-202-22-152-66.static.lagoon.nc:202.22.152.66"; logging-data="27043"; mail-complaints-to="abuse@pasdenom.info" User-Agent: slrn/1.0.3 (Linux) Cancel-Lock: sha1:yYiyFjb+5IeD12kRZHWfiI0e1Wo= sha256:ZuT/qhV1BEzuavpqoj8LUEXjR/n0IcrykK0g0e52cew= sha1:tvBs0r4GSjniBitO1eUzf3CG8u0= sha256:Rj7E8/240xK7cbYdqCLA+tdiMb4QJeRDKXboMbXo2d0= Bytes: 2457 Lines: 31 [Repost vers fr.comp.usenet.serveurs pour cause de foirage de XPost] Bonjour à toutes et tous, Je suis en train de coder un petite app en Python dont l'objectif et de traiter des mails de diverses provenances dont Usenet. Ça fait maintenant quelques années que je me suis éloigné d'Usenet et j'ai complètement oublié tout ce que je pouvais savoir sur les subtilités et pièges qui se cachent derrière les notions de charset, d'encodage et de type MIME. En clair, je lutte pour décoder de manière fiable les articles en provenance d'Usenet lorsque le corps d'un article est encodé en utf-8 et publié en Quoted-Printable. Ça devient le bazar avec des "=" en fin de ligne qui se mélangent avec ceux des caractères encodés en UTF-8. Autre interrogation, je suppose que les entêtes (headers) d'un article sont systématiquement en iso-8859-1 sauf le sujet qui peut être en UTF-8 Quoted-Printable. J'ai bon ? Vous l'aurez compris, j'ai besoin qu'on me raffraichisse la mémoire sur comment décoder tout ce fatras. Un lien vers une documentation, voire des exemples, seraient bienvenus. À votre bon coeur :) XP fr.comp.usenet.serveurs et fr.comp.mail FU2 fr.comp.usenet.lecteurs-de-news -- Doug Envoyé depuis mon Jacob Delafon 3000 Turbo