Re: [CBLX] LaTeX et lecture pdf |
[ Thread Index |
Date Index
| More lists.tuxfamily.org/carrefourblinux Archives
]
From: Gilles Touzé <gilles.touze@xxxxxxxxxxx>
Subject: Re: [CBLX] LaTeX et lecture pdf
Date: Sat, 30 May 2015 16:59:01 +0200
> Le 28/05/2015 17:12, Dominique Asselineau a écrit :
>> Mathieu Barbe wrote on Thu, May 28, 2015 at 04:48:40PM +0200
>>> Salut Philippe,
>>>
>>> Le 28/05/2015 11:22, Philippe Delavalade a écrit :
>>>> Bonjour.
>>>>
>>>> Le jeudi 28 mai à 11:04, Mathieu Barbe a écrit :
>>>>> Salut,
>>>>> j'ai rédigé un document pro en LaTeX et j'ai deux trois
>>>>> questions sur votre
>>>>> manière d'utiliser cette outils:
>>>>> * Utilisez-vous bien TeXlive?
>>>> Oui.
>>>>
>>>>> * Je me sers d'Emacs et de AucTeX pour m'assister dans mon
>>>>> * écriture,
>>>>> sûrement vous aussi?
>>>> Bof, rarement. Auctex n'est même plus installé sur ma machine
>>>> actuelle.
>>>>
>>>>> * Arrivez-vous à lire des pdf sous Linux?
>>>> Oui. Utilisation de pdftotext mais ça ne remplace pas un voyant
>>>> pour faire
>>>> la dernière vérification...
>>>>
>>>>> * Comment arrivez-vous à lire le résultat final de votre
>>>>> * document?
>>>> Donc, pdftotext.
>>>>
>>>>> Pour ma part, j'ai essayé:
>>>>> pdflatex qui me donne un pdf puis pdftotext, mais beaucoup
>>>>> d'erreur de
>>>>> conversion!
>>>> Qu'entends-tu par « erreur de conversion » ?
>>>
>>> C'est pas des erreurs d'encodages
>>> par exemple le mots configuration donne
>>> con guration
>>> je crois qu'il n'aime pas trop les double f ou la lettre f puis
>>> i.
>>
>> En effet, là je ne sais pas si c'est récupérable. Le problème
>> est que
>> pour certaines polices, des lettres à chasse courte comme les
>> f, i et
>> l, peuvent être regroupées au niveau de la fonte. Il me semble
>> qu'en
>> Unicode, ces caractères doubles sont répertoriés et pourraient
>> donc
>> être traités mais il faut approfondir.
>>
>> dom
>>
> Selon mes souvenirs, TeX utilise des fontes où les ligature
> (i.e. les combinaisons "fi", "fl", "ffi", "ffl") ou encore
> "---", bref, certaines suites de caractères produisent un
> caractère spécial de la fonte utilisée à ce moment. De toutes
> façons, la gestion par LaTeX des polices de caractères est
> tellement compliquée que des packages sont dédiés à leur
> gestion automatiques. Pour pouvoir écrire en français, ce qui
> est ton cas je pense, il faut vraiment dans tous les en-têtes
> de tes documents insérer :
>
> \usepackage[utf8]{inputenc} %CODAGE UTF8 DES CARACTERES
Optionel et à remplacer par latin1 si on n'a toujours pas
passer son système en utf8 (ce qui est mon cas).
> \usepackage[T1]{fontenc} %CESURE DES MOTS EN FRANCAIS
> \usepackage[francais]{babel} %STYLE FRANCAIS
french et frenchb sont équivalents à francais ici mais une
récente discussion sur gut a fait apparaître que frenchb et
francais n'étaient maintenues que comme des alias de french
pour des questions de backward compatibility mais la bonne
option à passer à babel pour avoir du français désormais
c'est french.
>
> La dernière n'est pas obligatoire, il existe d'ailleurs une
> alternative (je crois).
Il existait mais je crois qu'en définitive aujourd'hui tout a
été fondu et que comme je le disais plus haut les diverses
options ne sont maintenues que pour des raisons de
compatibilités et font toutes la même chose. Cependant à
termes celle qui a le plus de chance de subsister c'est
french et il est donc conseillé de n'utiliser qu'elle à
partir de maintenant.
Pierre
>
> Je viens de compiler avec ces trois lignes les différentes
> ligatures pour voir, avec pdflatex, et le pdf obtenu est
> parfaitement lisible ; j'ai essayé 4 lecteurs différents :
> evince, okular, imagemagick et the gimp ; tous lisent ces
> caractères spéciaux sans problème (je n'ai pas essayé acrobat
> reader, dont le nom linux est "acroread", car je l'ai viré
> récemment de mon ordinateur, mais il doit fonctionner également
> à mon avis.
>
> Je n'ai pas essayé la conversion de dvi en pdf (dvitopdf).
>
> De plus, l'opération inverse avec pdftotext redonne bien le
> texte en entrée (texte brut, sans aucun formatage).
>
> Ceci dit, le problème des pdf déborde largement le cadre de ces
> petits essais : en effet, un texte dans un pdf peut très bien
> être en fait une image, et dans ce cas, aucun logiciel ne sera
> capable de le lire, à moins de faire une reconnaissance de
> caractère auparavant dans le document. Sous linux, l'opération
> reste assez aléatoire, car les OCR ne sont pas nombreux, ni
> très développés. Par ailleurs, je ne sais pas si leurs
> interfaces sont accessibles ou non, il faudrait faire des
> tests.
>
> Avec Windows, les OCR sont en général fournis avec un scanner,
> mais il existe quelques logiciels excellents ("Fine reader" ou
> "Omnipage"). Pour linux, je te recommande la page :
> https://doc.ubuntu-fr.org/ocr
> qui fait assez bien le tour de la question.
>
> Gilles
>
> --
> CBLX - CarrefourBLinuX MailingListe Pour obtenir de l'aide,
> envoyez le sujet help à:
> carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
> Archives:
> http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> ou
> http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/
>
--
CBLX - CarrefourBLinuX MailingListe
Pour obtenir de l'aide, envoyez le sujet help à:
carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
Archives:
http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
ou
http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/