Deutsch English Français Italiano |
<t5116e$j1d$1@dont-email.me> View for Bookmarking (what is this?) Look up another Usenet article |
Path: ...!news.mixmin.net!eternal-september.org!reader02.eternal-september.org!.POSTED!not-for-mail From: Ghost-Raider <ghost-raider@compuserve.com> Newsgroups: fr.comp.os.linux.configuration Subject: Re: Mise en Route de la Super Configuration Linux de Ghost "Michu" Raider Date: Thu, 5 May 2022 19:23:26 +0200 Organization: A noiseless patient Spider Lines: 35 Message-ID: <t5116e$j1d$1@dont-email.me> References: <t36no1$c49$1@dont-email.me> <6262f8af$0$22279$426a74cc@news.free.fr> <t4101f$s4t$1@ns507557.dodin.fr.nf> <62641129$0$18007$426a34cc@news.free.fr> <20220423110115.08027812@coffee.novazur.fr> <626429ab$0$26324$426a74cc@news.free.fr> <20220424231636.2fe41b58@coffee.novazur.fr> <t45ups$boh$4@dont-email.me> <626c2eea$0$22070$426a34cc@news.free.fr> <t4jooa$fsg$1@dont-email.me> <626e40e5$0$18747$426a74cc@news.free.fr> <t4m6ac$io4$2@dont-email.me> <626ebda2$0$18740$426a34cc@news.free.fr> <20220501130956.749070af@coffee.novazur.fr> <t4p94h$nfm$1@dont-email.me> <62703520$0$22258$426a34cc@news.free.fr> <t4rr3b$spi$1@dont-email.me> <t4sbff$j51$1@ns507557.dodin.fr.nf> <t4t5ke$1ptr$1@gioia.aioe.org> <t4tenr$sf4$1@ns507557.dodin.fr.nf> <t4tvja$18np$1@gioia.aioe.org> <t4up6f$74l$1@ns507557.dodin.fr.nf> <t4vru9$d5r$1@gioia.aioe.org> <t504sk$klh$1@dont-email.me> <t508nm$jmp$1@ns507557.dodin.fr.nf> <t50hvm$hqb$1@dont-email.me> <slrnt77lek.1n0.lhh+news-no_spam@hercule.home.arpa> MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8; format=flowed Content-Transfer-Encoding: 8bit Injection-Date: Thu, 5 May 2022 17:23:26 -0000 (UTC) Injection-Info: reader02.eternal-september.org; posting-host="f3fadcb293544b55d260208a08ad5e9e"; logging-data="19501"; mail-complaints-to="abuse@eternal-september.org"; posting-account="U2FsdGVkX18rBgC3LPNoWQZP/PTq+Kn5EqIsLei4V8k=" User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:91.0) Gecko/20100101 Thunderbird/91.8.1 Cancel-Lock: sha1:1h35+xgo0NlgB6Yqhrnbd3FDhcM= In-Reply-To: <slrnt77lek.1n0.lhh+news-no_spam@hercule.home.arpa> Content-Language: fr Bytes: 3469 Le 05/05/2022 à 15:49, Jacques L'helgoualc'h a écrit : > Le 05-05-2022, Ghost-Raider a écrit : > [ Banques + PDF = :/ ] > > Ce que je crains le plus, ce sont les *.pdf-images, où tu auras besoin d'OCR. J'ai tout numérisé en PDF indexés. > > Sinon, il y a les convertisseurs pdf2qqch ou pdftoqqch ... Oui, celui-ci est le seul que j'ai trouvé qui crée des zones numériques exploitables : www.ilovepdf.com/pdf_to_excel Mais j'ai des milliers de PDF à retranscrire, ça m'étonnerais que je puisse les traiter tous sans passer à la caisse: "Les fonctionnalités gratuites comprennent : Accès aux outils iLovePDF Traitement de documents limité Travailler sur le web" Il me faudrait un logiciel en local, éventuellement payant d'ailleurs. > >> Donc, si quelqu'un connaît la perle rare qui sait repérer et créer >> les zones monétaires dans les PDF éventuellement convertis en TXT ou XLS >> ou autre, je suis preneur. > > Le language *Perl* est ce qu'il te faut pour triturer les textes --- > mais tu devras t'intéresser aux expressions régulières :) Oui, je viens de regarder mais je n'ai trouvé aucun module Perl qui ressemble même de loin à ce que je recherche. -- Envoyé depuis mon PC Linux Mint 20.3 Cinnamon 5.2.7