Re: [CBLX] lecteur de fichiers pdf

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Bonjour,

Tout d'abord pourquoi une galère spécialement sous Linux ?

Le principal problème de l'accessibilité des PDF ne vient pas d'Adobe
mais de la source qui a ensuite été convertie en PDF.  Quand la source
vient de LaTeX par exemple, ça marche parfaitement dans à peu près 90%
des cas et les problèmes restant sont dûs à l'utilisation de police
dont certains caractères, en particulier les caractères accentués
sont composés en plusieurs graphèmes.  Du coup lors de la conversion
du PDF en texte, ces caractères composés en plusieurs morceaux ne sont
pas reconnus comme tels et on se retrouve avec les morceaux séparés,
typiquement « e' » au lieu de « é ».  Le problème le plus sévère se
trouve être les PDF construits à partir de sources entièrement
graphiques et là, il n'y a rien d'autre qu'un OCR pour s'en sortir.
Sous Debian il y a déjà Tesseract qui ne marche pas trop mal, d'autres
sont plus performants je crois mais ne sont pas empaquetés Debian et il
faut donc les installer soi-même.

dom


Soufiane wrote on Fri, Jun 17, 2016 at 02:42:21AM +0200
> Je vous remercie tous pour vos réponses.
> 
> 
> Le PDF c'est une bonne petite galère sous Linux tout de même.
> 
> Adobe aurait pu faire un effort pour rendre accessible sa visionneuse. C'est
> une honte pour une grosse boîte comme la leur.
> 
> Le 16/06/2016 à 12:10, Dominique Asselineau a écrit :
> >Philippe Delavalade wrote on Thu, Jun 16, 2016 at 10:30:47AM +0200
> >>Le jeudi 16 juin à 10:12, soufiane a écrit :
> >>>salut,
> >>>je recherche un lecteur de fichiers pdf accessible sous Debian. Je ne
> >>>voudrais pas lancer Windows juste pour lire quelques docs.
> >>Voir pdftotext et les options.
> >et en particulier l'option -layout qui permet de retrouver assez
> >fidèlement la présentation, des tableaux notamment, ce qui permet de
> >parcourir aussi bien verticalement qu'horizontalement.  On peut
> >naturellement rediriger la sortie vers un fichier qu'on peut lier avec
> >un éditeur plus complet qu'un simple lecteur de page.
> >
> >A+
> >
> >dom
> >--
> >
> 
> 
> -- 
>   CBLX - CarrefourBLinuX MailingListe   Pour obtenir de l'aide, envoyez le
> sujet  help  à:   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>   Archives:
> http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>   ou   http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/
> 

-- 

-- 
   CBLX - CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  à: 
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
   ou 
   http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/