Deutsch   English   Français   Italiano  
<u4r50c$2hq9$1@cabale.usenet-fr.net>

View for Bookmarking (what is this?)
Look up another Usenet article

Path: ...!weretis.net!feeder8.news.weretis.net!news.trigofacile.com!usenet-fr.net!.POSTED!not-for-mail
From: Olivier Miakinen <om+news@miakinen.net>
Newsgroups: fr.comp.lang.python
Subject: Re: XML : texte en forme de balise
Date: Fri, 26 May 2023 22:32:11 +0200
Organization: There's no cabale
Lines: 46
Message-ID: <u4r50c$2hq9$1@cabale.usenet-fr.net>
References: <0b2d9848-ac47-41fe-8400-debbb3968e4en@googlegroups.com>
 <u4nv8f$188f$1@cabale.usenet-fr.net>
 <983c9a4c-99b6-4517-be5c-fc8e76d204e1n@googlegroups.com>
NNTP-Posting-Host: 200.89.28.93.rev.sfr.net
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-15
Content-Transfer-Encoding: 8bit
X-Trace: cabale.usenet-fr.net 1685133132 83785 93.28.89.200 (26 May 2023 20:32:12 GMT)
X-Complaints-To: abuse@usenet-fr.net
NNTP-Posting-Date: Fri, 26 May 2023 20:32:12 +0000 (UTC)
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:52.0) Gecko/20100101
 Firefox/52.0 SeaMonkey/2.49.4
In-Reply-To: <983c9a4c-99b6-4517-be5c-fc8e76d204e1n@googlegroups.com>
Bytes: 2900

Bonjour,

Le 26/05/2023 09:04, pata...@gmail.com m'a r�pondu :
>> > 
>> > j'ai cette cha�ne de caract�res � traiter "<a><b>this is <bad> tag text</b></a>". 
>> 
>> Question subsidiaire, existe-t-il des fonctions qui traitent du texte format� 
>> en tant que HTML plut�t que XML ? �a pourrait �tre une solution, puisque le 
>> formalisme de HTML est moins rigide que celui de XML. 
>> 
>> -- 
>> Olivier Miakinen

<apart�>
Ce serait bien si tu pouvais utiliser une vrai lecteur de news sur un vrai
serveur plut�t que de passer par cette horreur qu'est Google groupes.

�a te permettrait :
- de choisir un nom qui ne soit pas ton adresse de courriel charcut�e ;
- que la signature soit supprim�e automatiquement des r�ponses ;
- que les lignes ne soient pas trop longues.
</apart�>

> 
> cette petite cha�ne est un exemple et malheureusement, je ne connais pas � l'avance les "bad tag" (<????>).

Peu importe qu'ils soient connus ou inconnus. En XML, une balise ouvrante doit
�tre suivie d'une balise fermante : <bad>...</bad>, ou alors elle doit �tre
auto-fermante : <bad/>.

Donc, si tu as un <b> suivi de <bad> puis de </b>, la syntaxe est incorrecte
et un outil automatique ne devrait rien pouvoir en faire. Et ce n'est pas en
fournissant une liste de � mauvaises � balises que �a pourrait �tre corrig�.

> ma question serait donc plut�t : comment fournir � xml.etree.ElementTree la liste des tags � consid�rer ?

C'est donc une mauvaise question. D�sol� si ma r�ponse te para�t trop brutale.

> dans XML il est question de namespace (espace des noms) : je suppose que c'est sans doute destin� � �a...

En l'occurrence, non. La cha�ne "<a><b>this is <bad> tag text</b></a>" n'est
*pas* du XML bien form�, alors aucun namespace ne pourra corriger ce bug.


-- 
Olivier Miakinen