Re: [CBLX] pdftotext

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Le mardi 24 mars à 11:40, Raphaël POITEVIN a écrit :
> Philippe Delavalade <philippe.delavalade@xxxxxxxxx> writes:
> 
> > Bonjour tout le monde.
> >
> > Je viens d'avoir une surprise avec pdftotext. J'avais un fichier machin.pdf
> > que j'ai transformé en txt ; si je le lis avec emacs, il est marqué comme
> > fichier utf8 et sans problème apparent.
> >
> > Par contre, sur ce fichier, la commande
> > file -s machin.txt
> > me répond que c'est de type data et non text codé en utf8. C'est le seul
> > fichier examiné avec lequel j'ai ce résultat.
> >
> > Est-ce que mon pdf d'origine aurait une particularité ?
> 
> Commence déjà peut-être par faire un file sur le pdf. Compare avec un
> exiftools les méta données de ton pdf et un autre.

Bonjour Raphaël.

Merci pour les infos. Tout d'abord, un 'file -s' donne la même chose sur
des fichiers pdf donnant un bon résultat (enfin par rapport à celui qui me
pose problème).

Quant à ton outil exiftool, je ne sais pas trop à quoi il sert ni comment
m'en servir. Je vais l'installer et consulter le manuel, et puis je
reviendrai peut-être vers toi pour en savoir plus.

Merci.

-- 
Philippe

-- 
   CBLX - CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  �
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
   ou 
   http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/