Re: [CBLX] pdftotext

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Philippe Delavalade <philippe.delavalade@xxxxxxxxx> writes:

> Bonjour tout le monde.
>
> Je viens d'avoir une surprise avec pdftotext. J'avais un fichier machin.pdf
> que j'ai transformé en txt ; si je le lis avec emacs, il est marqué comme
> fichier utf8 et sans problème apparent.
>
> Par contre, sur ce fichier, la commande
> file -s machin.txt
> me répond que c'est de type data et non text codé en utf8. C'est le seul
> fichier examiné avec lequel j'ai ce résultat.
>
> Est-ce que mon pdf d'origine aurait une particularité ?

Commence déjà peut-être par faire un file sur le pdf. Compare avec un
exiftools les méta données de ton pdf et un autre.

J’en sais pas plus.
-- 
Raphaël
Hypra S.A.S.

--
   CBLX - CarrefourBLinuX MailingListe
   Pour obtenir de l'aide, envoyez le sujet  help  �   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives:
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
   ou
   http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/