| Deutsch English Français Italiano |
|
<sfd5os$19jm$1@gioia.aioe.org> View for Bookmarking (what is this?) Look up another Usenet article |
Path: ...!weretis.net!feeder6.news.weretis.net!feeder8.news.weretis.net!news.mixmin.net!aioe.org!uX1/4f1y4CGJWqFF1y/ZFQ.user.46.165.242.91.POSTED!not-for-mail
From: Dominique <zzz@aol.com.invalid>
Newsgroups: fr.comp.lang.python
Subject: =?UTF-8?Q?Re=3a_Caract=c3=a8re_parasite_dans_une_cellule_de_tableur?=
=?UTF-8?Q?=2e?=
Date: Mon, 16 Aug 2021 09:57:16 +0200
Organization: Aioe.org NNTP Server
Message-ID: <sfd5os$19jm$1@gioia.aioe.org>
References: <sf7lu3$1c7m$1@gioia.aioe.org>
<sfaih5$2pdt$1@cabale.usenet-fr.net>
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
Injection-Info: gioia.aioe.org; logging-data="42614"; posting-host="uX1/4f1y4CGJWqFF1y/ZFQ.user.gioia.aioe.org"; mail-complaints-to="abuse@aioe.org";
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:91.0) Gecko/20100101
Thunderbird/91.0
X-Notice: Filtered by postfilter v. 0.9.2
Content-Language: fr
Bytes: 3583
Lines: 63
Le 15/08/2021 à 10:16, Olivier Miakinen a écrit :
> Tout d'abord, le \b n'est pas un passage à la ligne mais un retour
> arrière (backspace, de code ASCII 08).
Oui, tu as raison, merci.
>
> Cela dit, dans ton fichier il y a bien un passage à la ligne \n au
> milieu de la chaîne :
>
> $ od -c test.csv
Je ne connaissais pas od. C'est idéal pour voir les caractères «
invisibles » :-)
> 0000000 C E L I N E ; " F i l t r e s
> 0000020 t r u c t u r e l c o d i q u
> 0000040 e : , T R E S 342 200 246 . (
> 0000060 0 2 9 0 0 5 ) \n I d e n t i f i
> 0000100 a n t o r g a n i s m e ( C
> 0000120 O D E _ B U D C O L L ) , l i
> 0000140 s t e d e v a l e u r s a
> 0000160 u t o r i s 303 251 e s : 0 2 9
> 0000200 0 0 5 4 1 4 C 0 , 0 2 9 0 0 5
> 0000220 4 1 4 E 0 , 0 2 9 0 0 5 4 1 4
> 0000240 P 4 , 0 2 9 0 0 5 4 1 4 P 2 ,
> 0000260 0 2 9 0 0 5 4 1 4 B 0 , 0 2
> 0000300 9 0 0 5 4 1 4 N 0 , 0 2 9 0 0
> 0000320 5 4 1 4 0 0 , 0 2 9 0 0 5 4 1
> 0000340 4 P 5 , 0 2 9 0 0 5 4 1 4 P 1
> 0000360 , 0 2 9 0 0 5 4 1 4 G 0 " \n
> Le supprimer me semble une mauvaise idée car cela concatènerait
> « (029005) » et « Identifiant » en « (029005)Identifiant ». Je
> suppose que tu préfèrerais remplacer ce \n par une espace.
Cette concaténation ne me pose pas de problème dans le sens où, après «
Céline », les premières informations qui m'intéressent sont après le mot
« autorisées : »
> str.replace("\n", " ")
Ça a fonctionné exactement comme je le désirais, et depuis Pandas. Merci :-)
>
> Attention : il ne faut le faire que ligne par ligne (ou cellule par
> cellule) après lecture du fichier CSV, pour ne pas supprimer les
> sauts de ligne qui séparent des champs différents.
Il n'y en a pas. Cet incident ne s'est pas produit.
Merci pour ton aide et la découverte d'od :-)
Bonne journée,
--
Dominique
Courriel : dominique point sextant ate orange en France
Esto quod es