Re: [CBLX] tesseract-ocr

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Bsoir Jean-Philippe:

On Sat, Apr 16, 2011 at 03:33:49AM +0200, Jean-Philippe MENGUAL wrote:
> J'ai personnellement testé tesseract il y a 1-2 semaines, pour
> réactualiser ma très mauvaise impression de 2008. Eh bien j'ai été
> agréablement surpris. Certes, il faut la feuille dans le bon sens, 

Dommage que Linux n'apprend jamais bien vite les "bonnes" choses des deux
autres O S pas libres, des choses qui ailleur sont déjà
off-topic/ready-and-done depuis dix, parfois ving ans !
Mais l'essentiel et la bonne nouvelle c que ça progresse.

>il
> est limité, mais j'observe qu'il donne un bien meilleur rendu.
> D'ailleurs j'ai pu lire 90% du contenu de tous les doc que j'ai essayés.

Super!

> J'en ai été surpris et content.
> 
> Il faudrait aussi approfondir la façon d'entraîner l'application. Elle
> est complexe, mais des acharnés peuvent peut-être comprendre et
> vulgariser l'explication ou automatiser par une interface.

Et tu dois utiliser une syntaxe complexe ou ajouter pas mal de params pour
appliquer l'OCR ou c'est suffisant que de lancer 
tesseract-ocr avec_un_nom_de_fichier.mmm ?
Et tu appliques l'ocr sur un fichier de quel type (tiff, pnm, png, jpg, ps,
pdf, doc) ? 

Merci d'avance.

ald0:~$ 


---
-- 
   CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  à: 
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/