Path: ...!weretis.net!feeder6.news.weretis.net!feeder8.news.weretis.net!news.mixmin.net!aioe.org!uX1/4f1y4CGJWqFF1y/ZFQ.user.46.165.242.91.POSTED!not-for-mail
From: Dominique <zzz@aol.com.invalid>
Newsgroups: fr.comp.lang.python
Subject: =?UTF-8?Q?Re=3a_Caract=c3=a8re_parasite_dans_une_cellule_de_tableur?=
 =?UTF-8?Q?=2e?=
Date: Mon, 16 Aug 2021 09:57:16 +0200
Organization: Aioe.org NNTP Server
Message-ID: <sfd5os$19jm$1@gioia.aioe.org>
References: <sf7lu3$1c7m$1@gioia.aioe.org>
 <sfaih5$2pdt$1@cabale.usenet-fr.net>
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
Injection-Info: gioia.aioe.org; logging-data="42614"; posting-host="uX1/4f1y4CGJWqFF1y/ZFQ.user.gioia.aioe.org"; mail-complaints-to="abuse@aioe.org";
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:91.0) Gecko/20100101
 Thunderbird/91.0
X-Notice: Filtered by postfilter v. 0.9.2
Content-Language: fr
Bytes: 3583
Lines: 63

Le 15/08/2021 à 10:16, Olivier Miakinen a écrit :

> Tout d'abord, le \b n'est pas un passage à la ligne mais un retour
> arrière (backspace, de code ASCII 08).

Oui, tu as raison, merci.

> 
> Cela dit, dans ton fichier il y a bien un passage à la ligne \n au
> milieu de la chaîne :
> 
> $ od -c test.csv

Je ne connaissais pas od. C'est idéal pour voir les caractères « 
invisibles » :-)

> 0000000   C   E   L   I   N   E   ;   "   F   i   l   t   r   e       s
> 0000020   t   r   u   c   t   u   r   e   l       c   o   d   i   q   u
> 0000040   e       :       ,       T   R   E   S 342 200 246   .       (
> 0000060   0   2   9   0   0   5   )  \n   I   d   e   n   t   i   f   i
> 0000100   a   n   t       o   r   g   a   n   i   s   m   e       (   C
> 0000120   O   D   E   _   B   U   D   C   O   L   L   )   ,       l   i
> 0000140   s   t   e       d   e       v   a   l   e   u   r   s       a
> 0000160   u   t   o   r   i   s 303 251   e   s       :       0   2   9
> 0000200   0   0   5   4   1   4   C   0   ,       0   2   9   0   0   5
> 0000220   4   1   4   E   0   ,       0   2   9   0   0   5   4   1   4
> 0000240   P   4   ,       0   2   9   0   0   5   4   1   4   P   2   ,
> 0000260       0   2   9   0   0   5   4   1   4   B   0   ,       0   2
> 0000300   9   0   0   5   4   1   4   N   0   ,       0   2   9   0   0
> 0000320   5   4   1   4   0   0   ,       0   2   9   0   0   5   4   1
> 0000340   4   P   5   ,       0   2   9   0   0   5   4   1   4   P   1
> 0000360   ,       0   2   9   0   0   5   4   1   4   G   0   "  \n



> Le supprimer me semble une mauvaise idée car cela concatènerait
> « (029005) » et « Identifiant » en « (029005)Identifiant ». Je
> suppose que tu préfèrerais remplacer ce \n par une espace.

Cette concaténation ne me pose pas de problème dans le sens où, après « 
Céline », les premières informations qui m'intéressent sont après le mot 
« autorisées : »


> str.replace("\n", " ")

Ça a fonctionné exactement comme je le désirais, et depuis Pandas. Merci :-)

> 
> Attention : il ne faut le faire que ligne par ligne (ou cellule par
> cellule) après lecture du fichier CSV, pour ne pas supprimer les
> sauts de ligne qui séparent des champs différents.

Il n'y en a pas. Cet incident ne s'est pas produit.


Merci pour ton aide et la découverte d'od :-)

Bonne journée,

-- 
Dominique
Courriel : dominique point sextant ate orange en France
Esto quod es