Re: [ssfr] Script de migration latin1 vers utf8 |
[ Thread Index |
Date Index
| More debianworld.org/shellscript-fr Archives
]
----- "giggzounet" <giggzounet@xxxxxxxxx> a écrit :
> Bonjour à tous,
Bonjour à tous,
>
> je cherche à faire un script de migration des données latin1 vers
> utf8.
[...]
>
>
> En fait il marche pas mal. sauf que par exemple les pdf sont par la
> suite inutilisables. Si vous savez pourquoi...ben je suis tout ouï! :D
Pas de réponse spécifique sur PDF car je n'ai pas de connaissance précise
de ce format. MAIS, faire une conversion globale de tous les fichiers me
semble particulièrement dangereux pour les raisons suivantes (sauf si tu
sais précisément ce que tu convertis, mais ton interrogation sur les PDF
laisse penser que ce n'est peut-être pas le cas) :
- tu risques de convertir des exécutables qui ne fonctionneront plus
puisque tu risques de convertir des séquences de code machine que iconv
considérera comme du texte à convertir ;
- tu vas modifier des données qui doivent être conservées en LATIN1 parce
que les programmes qui les utilisent s'attendent à trouver du LATIN1 et
ne savent pas exploiter de l'UTF8 ;
- tu vas modifier des données LATIN1 qui sont parfaitement identifiées
comme du LATIN1, par exemple : des fichiers XML qui contiennent l'entête
« <?xml version="1.0" encoding="ISO-8859-1"?> ;
- tu vas modifier des données déjà encodées en UTF8 (ce qui va corrompre
certains code points), toujours par exemple des fichiers XML :
« <?xml version="1.0" encoding="UTF-8"?>.
Une conversion au cas par cas, lorsque des dysfonctionnements sont avérés
semble moins hasardeuse.
>
> Merci d'avance
> Guillaume