Path: ...!weretis.net!feeder6.news.weretis.net!feeder8.news.weretis.net!news.mixmin.net!aioe.org!uX1/4f1y4CGJWqFF1y/ZFQ.user.46.165.242.91.POSTED!not-for-mail From: Dominique Newsgroups: fr.comp.lang.python Subject: =?UTF-8?Q?Re=3a_Caract=c3=a8re_parasite_dans_une_cellule_de_tableur?= =?UTF-8?Q?=2e?= Date: Mon, 16 Aug 2021 09:57:16 +0200 Organization: Aioe.org NNTP Server Message-ID: References: Mime-Version: 1.0 Content-Type: text/plain; charset=UTF-8; format=flowed Content-Transfer-Encoding: 8bit Injection-Info: gioia.aioe.org; logging-data="42614"; posting-host="uX1/4f1y4CGJWqFF1y/ZFQ.user.gioia.aioe.org"; mail-complaints-to="abuse@aioe.org"; User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:91.0) Gecko/20100101 Thunderbird/91.0 X-Notice: Filtered by postfilter v. 0.9.2 Content-Language: fr Bytes: 3583 Lines: 63 Le 15/08/2021 à 10:16, Olivier Miakinen a écrit : > Tout d'abord, le \b n'est pas un passage à la ligne mais un retour > arrière (backspace, de code ASCII 08). Oui, tu as raison, merci. > > Cela dit, dans ton fichier il y a bien un passage à la ligne \n au > milieu de la chaîne : > > $ od -c test.csv Je ne connaissais pas od. C'est idéal pour voir les caractères « invisibles » :-) > 0000000 C E L I N E ; " F i l t r e s > 0000020 t r u c t u r e l c o d i q u > 0000040 e : , T R E S 342 200 246 . ( > 0000060 0 2 9 0 0 5 ) \n I d e n t i f i > 0000100 a n t o r g a n i s m e ( C > 0000120 O D E _ B U D C O L L ) , l i > 0000140 s t e d e v a l e u r s a > 0000160 u t o r i s 303 251 e s : 0 2 9 > 0000200 0 0 5 4 1 4 C 0 , 0 2 9 0 0 5 > 0000220 4 1 4 E 0 , 0 2 9 0 0 5 4 1 4 > 0000240 P 4 , 0 2 9 0 0 5 4 1 4 P 2 , > 0000260 0 2 9 0 0 5 4 1 4 B 0 , 0 2 > 0000300 9 0 0 5 4 1 4 N 0 , 0 2 9 0 0 > 0000320 5 4 1 4 0 0 , 0 2 9 0 0 5 4 1 > 0000340 4 P 5 , 0 2 9 0 0 5 4 1 4 P 1 > 0000360 , 0 2 9 0 0 5 4 1 4 G 0 " \n > Le supprimer me semble une mauvaise idée car cela concatènerait > « (029005) » et « Identifiant » en « (029005)Identifiant ». Je > suppose que tu préfèrerais remplacer ce \n par une espace. Cette concaténation ne me pose pas de problème dans le sens où, après « Céline », les premières informations qui m'intéressent sont après le mot « autorisées : » > str.replace("\n", " ") Ça a fonctionné exactement comme je le désirais, et depuis Pandas. Merci :-) > > Attention : il ne faut le faire que ligne par ligne (ou cellule par > cellule) après lecture du fichier CSV, pour ne pas supprimer les > sauts de ligne qui séparent des champs différents. Il n'y en a pas. Cet incident ne s'est pas produit. Merci pour ton aide et la découverte d'od :-) Bonne journée, -- Dominique Courriel : dominique point sextant ate orange en France Esto quod es