[ Thread Index |
Date Index
| More lists.tuxfamily.org/carrefourblinux Archives
]
Bonjour a tous
Pour ma part j'utilise geditpdf qui fait très bien le travail encore faut il qu'il y ait du text dans le pdf
Aldo <info@xxxxxxxxxxxx> a écrit :
>On Sat, Oct 12, 2013 at 11:50:20AM +0200, Dominique Lambert wrote:
>> Bonjour,
>> Dominique et Philippe, vous m'avez répondu de manière à m'aider. Je viens
>> d'essayer avec pdftohtml, et là, ça a fonctionné. Seulement, je me suis
>> aperçu qu'il s'agissait d'une photo et, qu'il n'y avait pas de texte.
>> Pdftohtml m'a sorti 2 fichiers. Un avec une .jpg et un autre avec .html.
>> Dans le fichier .html apparaît :
>> [document jpg]. Je ne pourvais évidemment pas le savoir.
>
>Attention, avec pdftohtml tu as toujours plusieurs fichiers, vu que le but
>est de redistiler le tout en texte + images s'i la lieu; il se fait
>malheureusemenet qu'ici en effet le pdf ne contenait QUE du contenu scanné
>en graphique, en image donc.
>Donc peu importe que tu tentes de convertir avec l'un ou l'autre, le
>résultat sera toujours soit un document blanco soit comme ici un fichier
>d'index ***ind.html + un fichier .jpg
>Seul un scan avec un outil hardware genre Clear Reader ou Reporter permet de
>lire le contenu vu que le logiciel fais de la reconnaissance de caractères.
>
>Si tu sait scanner sous LInux et que tu as un OCR, possible que tu puisses
>arriver au même résultat; mais si tu as un Reporter autant l'utiliser, ça
>ira plus vite!
>
>Aldo.
>
>
>--
>==
> CarrefourBLinuX MailingListe
> Pour obtenir de l'aide, envoyez le sujet help à:
> carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
> Archives:
> http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>