Deutsch   English   Français   Italiano  
<slrnuqhnvu.nfk.doug.letough@arcadia.local.mcos.nc>

View for Bookmarking (what is this?)
Look up another Usenet article

Path: ...!news.mixmin.net!proxad.net!feeder1-2.proxad.net!usenet-fr.net!pasdenom.info!.POSTED.host-202-22-152-66.static.lagoon.nc!not-for-mail
From: Doug713705 <doug.letough@free.fr>
Newsgroups: fr.comp.usenet.lecteurs-de-news,fr.comp.mail
Subject: Encodage, charset et type MIME
Followup-To: fr.comp.usenet.lecteurs-de-news
Date: Thu, 18 Jan 2024 08:23:26 -0000 (UTC)
Organization: redatomik.org
Message-ID: <slrnuqhnvu.nfk.doug.letough@arcadia.local.mcos.nc>
Reply-To: Doug Le Tough <doug.letough@free.fr>
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
Injection-Date: Thu, 18 Jan 2024 08:23:26 -0000 (UTC)
Injection-Info: rasp.pasdenom.info; posting-account="doug.letough@usenet"; posting-host="host-202-22-152-66.static.lagoon.nc:202.22.152.66";
	logging-data="24575"; mail-complaints-to="abuse@pasdenom.info"
User-Agent: slrn/1.0.3 (Linux)
Cancel-Lock: sha1:Lyfum2LBSKbgOLzyPAFM5EgGGN8= sha256:vYZEsdQkuGd6Tfx1UACuEQZjwJ/4kS83nK2NDCE/kug=
	sha1:1pmDXqwJlrMqhhzhTBMdnuyOK+M= sha256:koIv2Lga0NaMHrLQTInNcV6c5AkbFCDKSLHjx43QlLA=
Bytes: 2362
Lines: 29

Bonjour à toutes et tous,

Je suis en train de coder un petite app en Python dont l'objectif et de
traiter des mails de diverses provenances dont Usenet.

Ça fait maintenant quelques années que je me suis éloigné d'Usenet et
j'ai complètement oublié tout ce que je pouvais savoir sur les
subtilités et pièges qui se cachent derrière les notions de charset,
d'encodage et de type MIME.

En clair, je lutte pour décoder de manière fiable les articles en
provenance d'Usenet lorsque le corps d'un article est encodé en utf-8 et 
publié en Quoted-Printable. Ça devient le bazar avec des "=" en fin de
ligne qui se mélangent avec ceux des caractères encodés en UTF-8.

Autre interrogation, je suppose que les entêtes (headers) d'un article 
sont systématiquement en iso-8859-1 sauf le sujet qui peut être en UTF-8
Quoted-Printable. J'ai bon ?

Vous l'aurez compris, j'ai besoin qu'on me raffraichisse la mémoire sur 
comment décoder tout ce fatras. Un lien vers une documentation, voire
des exemples, seraient bienvenus.

À votre bon coeur :)

XP fr.comp.usenet.serveurs et fr.comp.mail
FU2 fr.comp.usenet.lecteurs-de-news
-- 
Doug
Envoyé depuis mon Jacob Delafon 3000 Turbo