Re: [CBLX] tesseract-ocr

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Aldo wrote on Wed, Apr 13, 2011 at 10:08:29PM +0200
> Hello le forum,
> 
> je voudrais savoir par curiosité si parmi vous certains ont récemment
> utilisé l'un ou l'autre prog d'OCR sous Linux, ClaraOCR, OCRad, ou encore
> Tesseract-OCR, et sauraient me dire si la qualité de l'un ou l'autre a
> évolué, et si oui dans le bon sens: plus précis, plus fiable etc ?

Tout d'abord ce genre de logiciel évolue toujours dans le bon sens
sinon il n'y aurait pas de raison de le faire évoluer.

J'utilise Ocrad et le résultat reste très modéré.  Il est possible que
Tesseract-OCR soit meilleur mais je ne me souviens plus pourquoi je
n'ai pas insisté.  Il ne devait pas être packagé Debian à l'époque et
son install était laborieuse je crois bien.  Il faudrait voir de ce
côté-là si ça se passe correctement maintenant.  Quant à Clara, je me
souviens que Pierre l'avait cité il y a bien longtemps mais il me
semble que c'est un système à apprentissage de police de caractères,
pas sûr que ce soit utilisable quand on ne voit pas mais il faut voir
si c'est toujours le cas.

> 
> J'ai l'occasion d'obtenir un remboursement pour un appareil de lecture
> automatique, mais un PC + un scanner + un bon prog d'OCR ça peut encore
> servir ailleur où je n'ai pas l'appareil autonome;

Quel que soit la solution, il est essentiel que tu l'évalues par
toi-même.  À propos des machines à lire, il faut aller les voir avec
quelques documents significatifs (document admin., relevé, facture,
revue, bouquin...) et ne pas compter sur les documents que te
montrerait le marchand car là, ça marcherait toujours évidemment.

dom
--

---
--
   CarrefourBLinuX MailingListe
   Pour obtenir de l'aide, envoyez le sujet  help  à:
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives:
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/