Re: [CBLX] LaTeX et lecture pdf

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Merci pour tour vos messages,
donc, c'est pas forcement con, c'était pas vraiment juste de dire cela sans l'historique et l'ensemble des éléments.

J'ai donc essayé avec la config suivante :
Debian 8.0
texlive 2014.20141024-2, récupéré avec apt-get
pdftotext 0.26.5

J'ai compilé le fichier tex très simple en PJ avec pdflatex.
J'ai repris les ligne de Gilles, pour la configuration de
fontenc, inputenc et babel

puis j'ai fait un
pdftotext test.pdf
J'ai tous mis en PJ.
Avez-vous encore une idée qui pourrait ne pas générer d'erreur à la sortie?
Merci d'avance.
Mathieu

Le 30/05/2015 17:13, Gilles Touzé a écrit :

C'est trop con de regrouper des caractères pour l'accessibilité ainsi
que pour le référencement web.
Mathieu

Ben oui, on peut dire que c'est trop con, mais un petit historique de LaTeX premettra de comprendre pourquoi c'est ainsi : LaTeX utilise comme moteur de composition de page le langage TeX créé par Donald Knuth dans les années 70 ; à l'époque, il n'existait aucun programme capable de faire de l'édition de qualité professionnelle, et Knuth voulait composer lui-même le livre qu'il venait d'écrire, "The art of programming" (de mémoire). Il voulait la même qualité que les typographes manuels obtenaient depuis des siècles à la main. Or les ligatures, en typographie, existent bel et bien, donc Knuth les a incorporées à son programme TeX. Depuis, la situation a beaucoup évolué, mais on a conservé les ligatures, car il ne faut pas oublié que TeX ou LaTeX ne sont pas des traitements de textes, mais bien des logiciels de composition professionnels, aucun compromis n'est donc admis. Cet aspect rend un peu ardu l'utilisation de LaTeX par moment, mais quel bonheur de produire des documents irréprochables !

Pour ce qui est de l'accessibilité, il n'y a en fait pas de problème : si tu tapes par exemple "ffi" dans ton texte source, tu accède au contenu. Tu compile et obtient soir un dvi, soit un pdf : tu n'accède plus directement au contenu, le pdf n'est pas lisible de toute façon (sauf par un voyant, qui verra de belles ligatures) ; pour accéder au contenu de ton pdf, tu est obligé d'utiliser un moyen quelconque qui le transforme en texte ; j'ai fait l'essai avec pdftotext, et j'ai bien récupéré les chaînes de caractère originales ("ffi" dans mon exemple). Il faut seulement bien mettre les lignes d'en-tête que j'ai indiquées dans un autre mail.

Gilles


--
Mathieu Barbe
Research Engineer at CEA-LETI
DRT/LETI/DACLE/ LIALP
Laboratoire Infrastructures et Ateliers pour le Logiciel sur Puces

Commissariat à l’énergie atomique et aux énergies alternatives
MINATEC Campus | 17 rue des Martyrs | 38054 Grenoble Cedex 9
Tel : +33 (0)4 38 78 30 08
mathieu.barbe@xxxxxx

Attachment: test.pdf
Description: Adobe PDF document

\documentclass{article}

\usepackage[utf8]{inputenc} 
\usepackage[T1]{fontenc} 
\usepackage[francais]{babel}

\begin{document}
je fais un test sur les lettres. 

Deux lettre f à la suite : ff.

f puis i : fi.

Voilà, c'est terminé.
\end{document}
je fais un test sur les lettres.
Deux lettre f à la suite : .
f puis i : .
Voilà, c'est terminé.

1




Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/