Re: [CBLX] tesseract-ocr

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Ald0 wrote on Sun, Apr 17, 2011 at 08:34:11PM +0200
> Bsoir Jean-Philippe:
> 
> On Sat, Apr 16, 2011 at 03:33:49AM +0200, Jean-Philippe MENGUAL wrote:
> > J'ai personnellement testé tesseract il y a 1-2 semaines, pour
> > réactualiser ma très mauvaise impression de 2008. Eh bien j'ai été
> > agréablement surpris. Certes, il faut la feuille dans le bon sens, 
> 
> Dommage que Linux n'apprend jamais bien vite les "bonnes" choses des deux
> autres O S pas libres, des choses qui ailleur sont déjà
> off-topic/ready-and-done depuis dix, parfois ving ans !

Ben oui.  Il faut juste savoir que la reconnaissance de caractères est
de la haute technologie logicielle qui demande beaucoup
d'investissement.  Ça se voit dans la synthèse de parole et
certainement encore plus dans la reconnaissance de la parole.

> Mais l'essentiel et la bonne nouvelle c que ça progresse.
> 
> >il
> > est limité, mais j'observe qu'il donne un bien meilleur rendu.
> > D'ailleurs j'ai pu lire 90% du contenu de tous les doc que j'ai essayés.
> 
> Super!
> 
> > J'en ai été surpris et content.
> > 
> > Il faudrait aussi approfondir la façon d'entraîner l'application. Elle
> > est complexe, mais des acharnés peuvent peut-être comprendre et
> > vulgariser l'explication ou automatiser par une interface.
> 
> Et tu dois utiliser une syntaxe complexe ou ajouter pas mal de params pour
> appliquer l'OCR ou c'est suffisant que de lancer 
> tesseract-ocr avec_un_nom_de_fichier.mmm ?
> Et tu appliques l'ocr sur un fichier de quel type (tiff, pnm, png, jpg, ps,
> pdf, doc) ? 

Ce sont les caractéristiques du scan qui comptent, pas le format.

dom
--

---
--
   CarrefourBLinuX MailingListe
   Pour obtenir de l'aide, envoyez le sujet  help  à:
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives:
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/