Re: [CBLX] tesseract-ocr

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


coolbrother@xxxxxxxxxx wrote on Mon, Apr 18, 2011 at 06:45:35PM +0200
> Salut les gars, juste pour dire que j'étais en retard de plusieurs bouquins
> à lire,
> et donc j'ai voulus utiliser un OCR pour remédier à tout ça.
> Et donc, récemment j'ai comparer plusieurs OCR dont Tesseract et Abby
> Finereader.
> Je peux vous dire que Abby finereader laisse tesseract loin derrière.
> Certes, tesseract est libre et gratuit, mais il n'est vraiment pas prêt
> pour un non voyant.
> Peut-être qu'un mal-voyant peut s'en sortir, mais bon ...
> Abby Finereader est en ligne de commande, il y a une version de
> démo pour une centaine de pages,
> et la version complète pour linux coûte 149 euros pour 100 000 pages, ce
> qui est raisonnable.
> Maintenant le problème que je rencontre c'est qu'à force de scanner à tour
> de bras, mon scanner HP est tombé en pane, et pour trouver un scanner
> récent avec Sane, bon courage !
> Mais sinon, je le redis Abbyy finereader et tesseract, c'est le jour et la
> nuit pour un non-voyant !
> Car le mal-voyant saura dans quel sens mettre la page, 

Perso, le pb du sens n'est pas une gêne importante.  J'ai toujours
travaillé avec des scanners pour lesquels il fallait mettre les pages
dans le bon sens.  Il faut un peu de méthode pour ne pas perdre trop
de temps avec ça, bien qu'il faille essayer au moins une fois pour un
document.

> peut plus ou moins
> comparer et corriger les quelques lettres et mots que tesseract ne voit
> pas, 

Il ne faut pas oublier d'installer le paquet dédié au français ?  ça
aide considérablement à lever des ambiguïtés.

dom
--

---
--
   CarrefourBLinuX MailingListe
   Pour obtenir de l'aide, envoyez le sujet  help  à:
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives:
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/