Deutsch   English   Français   Italiano  
<t5116e$j1d$1@dont-email.me>

View for Bookmarking (what is this?)
Look up another Usenet article

Path: ...!news.mixmin.net!eternal-september.org!reader02.eternal-september.org!.POSTED!not-for-mail
From: Ghost-Raider <ghost-raider@compuserve.com>
Newsgroups: fr.comp.os.linux.configuration
Subject: Re: Mise en Route de la Super Configuration Linux de Ghost "Michu"
 Raider
Date: Thu, 5 May 2022 19:23:26 +0200
Organization: A noiseless patient Spider
Lines: 35
Message-ID: <t5116e$j1d$1@dont-email.me>
References: <t36no1$c49$1@dont-email.me>
 <6262f8af$0$22279$426a74cc@news.free.fr> <t4101f$s4t$1@ns507557.dodin.fr.nf>
 <62641129$0$18007$426a34cc@news.free.fr>
 <20220423110115.08027812@coffee.novazur.fr>
 <626429ab$0$26324$426a74cc@news.free.fr>
 <20220424231636.2fe41b58@coffee.novazur.fr> <t45ups$boh$4@dont-email.me>
 <626c2eea$0$22070$426a34cc@news.free.fr> <t4jooa$fsg$1@dont-email.me>
 <626e40e5$0$18747$426a74cc@news.free.fr> <t4m6ac$io4$2@dont-email.me>
 <626ebda2$0$18740$426a34cc@news.free.fr>
 <20220501130956.749070af@coffee.novazur.fr> <t4p94h$nfm$1@dont-email.me>
 <62703520$0$22258$426a34cc@news.free.fr> <t4rr3b$spi$1@dont-email.me>
 <t4sbff$j51$1@ns507557.dodin.fr.nf> <t4t5ke$1ptr$1@gioia.aioe.org>
 <t4tenr$sf4$1@ns507557.dodin.fr.nf> <t4tvja$18np$1@gioia.aioe.org>
 <t4up6f$74l$1@ns507557.dodin.fr.nf> <t4vru9$d5r$1@gioia.aioe.org>
 <t504sk$klh$1@dont-email.me> <t508nm$jmp$1@ns507557.dodin.fr.nf>
 <t50hvm$hqb$1@dont-email.me>
 <slrnt77lek.1n0.lhh+news-no_spam@hercule.home.arpa>
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
Injection-Date: Thu, 5 May 2022 17:23:26 -0000 (UTC)
Injection-Info: reader02.eternal-september.org; posting-host="f3fadcb293544b55d260208a08ad5e9e";
	logging-data="19501"; mail-complaints-to="abuse@eternal-september.org";	posting-account="U2FsdGVkX18rBgC3LPNoWQZP/PTq+Kn5EqIsLei4V8k="
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:91.0) Gecko/20100101
 Thunderbird/91.8.1
Cancel-Lock: sha1:1h35+xgo0NlgB6Yqhrnbd3FDhcM=
In-Reply-To: <slrnt77lek.1n0.lhh+news-no_spam@hercule.home.arpa>
Content-Language: fr
Bytes: 3469

Le 05/05/2022 à 15:49, Jacques L'helgoualc'h a écrit :
> Le 05-05-2022, Ghost-Raider a écrit :
> [ Banques + PDF = :/ ]
> 
> Ce que je crains le plus, ce sont les *.pdf-images, où tu auras besoin d'OCR.

J'ai tout numérisé en PDF indexés.
> 
> Sinon, il y a les convertisseurs pdf2qqch ou pdftoqqch ...

Oui, celui-ci est le seul que j'ai trouvé qui crée des zones numériques 
exploitables :
www.ilovepdf.com/pdf_to_excel
Mais j'ai des milliers de PDF à retranscrire, ça m'étonnerais que je 
puisse les traiter tous sans passer à la caisse:

"Les fonctionnalités gratuites comprennent :
     Accès aux outils iLovePDF
     Traitement de documents limité
     Travailler sur le web"

Il me faudrait un logiciel en local, éventuellement payant d'ailleurs.
> 
>> Donc, si quelqu'un connaît la perle rare qui sait repérer et créer
>> les zones monétaires dans les PDF éventuellement convertis en TXT ou XLS
>> ou autre, je suis preneur.
> 
> Le language *Perl* est ce qu'il te faut pour triturer les textes ---
> mais tu devras t'intéresser aux expressions régulières :) 

Oui, je viens de regarder mais je n'ai trouvé aucun module Perl qui 
ressemble même de loin à ce que je recherche.

-- 
Envoyé depuis mon PC Linux Mint 20.3 Cinnamon 5.2.7