Re: [CBLX] tesseract-ocr

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Bonjour,

J'ai personnellement testé tesseract il y a 1-2 semaines, pour
réactualiser ma très mauvaise impression de 2008. Eh bien j'ai été
agréablement surpris. Certes, il faut la feuille dans le bon sens, il
est limité, mais j'observe qu'il donne un bien meilleur rendu.
D'ailleurs j'ai pu lire 90% du contenu de tous les doc que j'ai essayés..
J'en ai été surpris et content.

Il faudrait aussi approfondir la façon d'entraîner l'application. Elle
est complexe, mais des acharnés peuvent peut-être comprendre et
vulgariser l'explication ou automatiser par une interface.

Cordialement,

-  
       Jean-Philippe MENGUAL
       Président de l'association traduc.org 
       Coordinateur du projet Linux From Scratch
       Coordinateur au sein du projet Trad GNU de l'April
       Animateur suppléant du groupe de travail Accessibilité de l'April



Le vendredi 15 avril 2011 à 11:58 +0000, Pierre Lorenzon a écrit :
> From: Dominique Asselineau <asseline@xxxxxxxxxxxxxxxxxxxx>
> Subject: Re: [CBLX] tesseract-ocr
> Date: Thu, 14 Apr 2011 12:47:09 +0200
> 
> > Aldo wrote on Wed, Apr 13, 2011 at 10:08:29PM +0200
> >> Hello le forum,
> >> 
> >> je voudrais savoir par curiosité si parmi vous certains ont récemment
> >> utilisé l'un ou l'autre prog d'OCR sous Linux, ClaraOCR, OCRad, ou encore
> >> Tesseract-OCR, et sauraient me dire si la qualité de l'un ou l'autre a
> >> évolué, et si oui dans le bon sens: plus précis, plus fiable etc ?
> > 
> > Tout d'abord ce genre de logiciel évolue toujours dans le bon sens
> > sinon il n'y aurait pas de raison de le faire évoluer.
> > 
> > J'utilise Ocrad et le résultat reste très modéré.  Il est possible que
> > Tesseract-OCR soit meilleur mais je ne me souviens plus pourquoi je
> > n'ai pas insisté.  Il ne devait pas être packagé Debian à l'époque et
> > son install était laborieuse je crois bien.  Il faudrait voir de ce
> > côté-là si ça se passe correctement maintenant.  Quant à Clara, je me
> > souviens que Pierre l'avait cité il y a bien longtemps mais il me
> 
>   Moi ? Aïe ? Je dois perdre la mémoire alors. Ce n'est pas
>   impossible que j'ai pu assister à une démonstration et faire
>   un compte-rendu de quelques mots. Mais de fait je ne m'en
>   souviens pas. Ce qui est sûr en revanche c'est que je n'ai
>   jamais utilisé d'ocr.
> 
>   Pierre
> 
> 
> 
> 
> > semble que c'est un système à apprentissage de police de caractères,
> > pas sûr que ce soit utilisable quand on ne voit pas mais il faut voir
> > si c'est toujours le cas.
> > 
> >> 
> >> J'ai l'occasion d'obtenir un remboursement pour un appareil de lecture
> >> automatique, mais un PC + un scanner + un bon prog d'OCR ça peut encore
> >> servir ailleur où je n'ai pas l'appareil autonome;
> > 
> > Quel que soit la solution, il est essentiel que tu l'évalues par
> > toi-même.  À propos des machines à lire, il faut aller les voir avec
> > quelques documents significatifs (document admin., relevé, facture,
> > revue, bouquin...) et ne pas compter sur les documents que te
> > montrerait le marchand car là, ça marcherait toujours évidemment.
> > 
> > dom
> > --
> > 
> > ---
> > -- 
> >    CarrefourBLinuX MailingListe 
> >    Pour obtenir de l'aide, envoyez le sujet  help  à: 
> >    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
> >    Archives: 
> >    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> > 
> 
> ---


---
--
   CarrefourBLinuX MailingListe
   Pour obtenir de l'aide, envoyez le sujet  help  à:
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives:
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/