Re: [SSFR] Histoires d'encodages (was: quel langage ?)

[ Thread Index | Date Index | More debianworld.org/shellscript-fr Archives ]


On 2005-12-02 13:21:52 +0000, Sébastien Aperghis-Tramoni wrote:
> Selon Vincent Lefevre <vincent@xxxxxxxxxx>:
> > Si, aussi la manière dont les données d'entrée doivent être interprétées
> > (par souci de cohérence). Si j'écris "echo abcdé > fichier", alors le
> > fichier contiendra une ligne "abcdé" encodée dans les locales courantes
> > (encodage donné par LC_CTYPE).
> 
> Non, l'encodage des données est déterminé par le terminal.

L'encodage de sortie utilisé par le terminal doit être le même que
celui spécifié par les locales, sinon les messages des diverses
applications respectant les locales ne s'afficheront pas correctement
dans le terminal. D'autre part, l'encodage d'entrée et l'encodage de
sortie du terminal doivent correspondre, sinon le fait d'entrer un
caractère non ASCII ne provoquera pas l'affichage de ce caractère
(sauf si les codes correspondent dans les deux encodages).

> Ton terminal est visiblement en UTF-8, le mien est en Latin1.
> 
>   $ locale
>   LANG=fr_FR.UTF-8
>   ...
>   LC_ALL=fr_FR.UTF-8
>   $ echo abcdé | od -Ax -txC -v
>   000000 61 62 63 64 e9 0a
>   000006
> 
> Tu vois ? Mon "é" est codé par "e9" alors que le tien est codé par "c3 a9".

Et alors? Qu'est-ce que tu entends prouver par là? Avec une config
buggée, tu peux raconter n'importer quoi, mais évite d'en tirer des
conclusions.

Par exemple, avec ta config (terminal en latin1 et locales en UTF-8),
on obtient ce genre de choses:

ay:~> ls blah
ls: blah: Aucun fichier ou répertoire de ce type

Noter le mauvais affichage des caractères accentués...

> La documentation indique justement que Perl 5.8.0 détectait les locales
> en cours pour savoir quel encoding sélectionner. D'autres programmes
> peuvent faire pareil, mais c'est une heuristique, pas une données sûre.
> Les locales concernent l'affichage, alors que les données en entrées
> sont fournies par le terminal.

Avec une config buggée, rien n'est sûr.

-- 
Vincent Lefèvre <vincent@xxxxxxxxxx> - Web: <http://www.vinc17.org/>
100% accessible validated (X)HTML - Blog: <http://www.vinc17.org/blog/>
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/