Re: [CBLX] lecteur de fichiers pdf

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Bonsoir,


L'histoire de l'OCR, c'est autre chose.


C'est des PDF texte qu'Android ou Windows lit très bien.


Je ne parle pas du PDF image.


J'aurais du le préciser.



Le 17/06/2016 à 15:59, Dominique Asselineau a écrit :
Soufiane wrote on Fri, Jun 17, 2016 at 03:01:05PM +0200
Bonjour,


Il y a des moments où je dois un peu aller à l'essentiel et que me poser des
questions sur l'encodage ou je ne sais pas quoi d'autre sur la provenance du
fichier est totalement contre productif.

Sous les autres OS et même sur un mobile, j'ouvre et ca fonctionne.
Tu as beaucoup de chance.  J'utilise également un iPhone et il n'est
pas rare de se retrouver à devoir lancer l'OCR sur le fichier, même
quand ça n'est pas indispensable.

Adobe a édicté des règles et je ne comprends pas pourquoi la visionneuse PDF
sous Linux ne fonctionne pas en adéquation avec les normes d'accessibilité.
Donc, c'est Adobe qui a pêché parce qu'ils s'en foutent des normes
d'accessibilité.
Non, ce sont les logiciels d'édition en amont d'Adobe qui est
naturellement capable de traiter des images, y-compris quand le texte
est présenté dans une image.

dom




Le 17/06/2016 à 13:33, Philippe Delavalade a écrit :

Le vendredi 17 juin à 11:36, Dominique Asselineau a écrit :
Bonjour,

Tout d'abord pourquoi une galère spécialement sous Linux ?

Le principal problème de l'accessibilité des PDF ne vient pas d'Adobe
mais de la source qui a ensuite été convertie en PDF.  Quand la source
vient de LaTeX par exemple, ça marche parfaitement dans à peu près 90%
des cas et les problèmes restant sont dûs à l'utilisation de police
dont certains caractères, en particulier les caractères accentués
sont composés en plusieurs graphèmes.  Du coup lors de la conversion
du PDF en texte, ces caractères composés en plusieurs morceaux ne sont
pas reconnus comme tels et on se retrouve avec les morceaux séparés,
typiquement « e' » au lieu de « é ».
Et encore car il y a des options concernant l'encodage d'entrée ou de sortie.


--
   CBLX - CarrefourBLinuX MailingListe   Pour obtenir de l'aide, envoyez le
sujet  help  à:   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives:
http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
   ou   http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/



--
CBLX - CarrefourBLinuX MailingListe Pour obtenir de l'aide, envoyez le sujet help à: carrefourblinux-request@xxxxxxxxxxxxxxxxxxx Archives: http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux ou http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/

Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/