[ Thread Index |
Date Index
| More lists.tuxfamily.org/carrefourblinux Archives
]
- To: carrefourblinux@xxxxxxxxxxxxxxxxxxx
- Subject: Re: [CBLX] pdftotext
- From: raphael.poitevin@xxxxxxxxx (Raphaël POITEVIN)
- Date: Tue, 24 Mar 2015 11:40:47 +0100
- Dkim-signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=20120113; h=from:to:subject:references:date:in-reply-to:message-id:user-agent :mime-version:content-type:content-transfer-encoding; bh=dpgB+Neun3TDpUCDR5++mIKUUq6gb8BoTB1O8dFN4C4=; b=fybPD/OWu2nELDNjWtwdR7noSS+k1DDGAuSeERCHT2FAdeWqOaPcNw8ziGp9WQ8Cvk uY8xqmQYNxViI5cfJcMXKJd51B3QHV9Zx6xqJoBVCPuTuwnLugQhglHArBYFzxZInJZh IiwhtnFFsAeb7iLg269D0wy+VyAZosvEVFUVCn7oy3/7WN+fMIlfFeRHVtYMh8QPEMS2 OCgQiyQjILvm2tze/dC/WhQUCGZmKEC/x6hZAPi+zfpcQRAow45IYscW/KCi07Vw99nB GddgKUUTIZ2ED+M8eE+XZOhBcvF4dIcZvAEy+FwJRP0P3ADRPCeL4nCEgvfi+1dBOkF3 jqpw==
Philippe Delavalade <philippe.delavalade@xxxxxxxxx> writes:
> Bonjour tout le monde.
>
> Je viens d'avoir une surprise avec pdftotext. J'avais un fichier machin.pdf
> que j'ai transformé en txt ; si je le lis avec emacs, il est marqué comme
> fichier utf8 et sans problème apparent.
>
> Par contre, sur ce fichier, la commande
> file -s machin.txt
> me répond que c'est de type data et non text codé en utf8. C'est le seul
> fichier examiné avec lequel j'ai ce résultat.
>
> Est-ce que mon pdf d'origine aurait une particularité ?
Commence déjà peut-être par faire un file sur le pdf. Compare avec un
exiftools les méta données de ton pdf et un autre.
J’en sais pas plus.
--
Raphaël
Hypra S.A.S.
--
CBLX - CarrefourBLinuX MailingListe
Pour obtenir de l'aide, envoyez le sujet help � carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
Archives:
http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
ou
http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/