Re: [ssfr] Script de migration latin1 vers utf8

[ Thread Index | Date Index | More debianworld.org/shellscript-fr Archives ]




Le 28 novembre 2009 13:44, <ppercot@xxxxxxx> a écrit :

----- "giggzounet" <giggzounet@xxxxxxxxx> a écrit :

> Bonjour à tous,

Bonjour à tous,

>
> je cherche à faire un script de migration des données latin1 vers
> utf8.
[...]
>
>
> En fait il marche pas mal. sauf que par exemple les pdf sont par la
> suite inutilisables. Si vous savez pourquoi...ben je suis tout ouï! :D

Pas de réponse spécifique sur PDF car je n'ai pas de connaissance précise
de ce format. MAIS, faire une conversion globale de tous les fichiers me
semble particulièrement dangereux pour les raisons suivantes (sauf si tu
sais précisément ce que tu convertis, mais ton interrogation sur les PDF
laisse penser que ce n'est peut-être pas le cas) :
- tu risques de convertir des exécutables qui ne fonctionneront plus
 puisque tu risques de convertir des séquences de code machine que iconv
 considérera comme du texte à convertir ;
- tu vas modifier des données qui doivent être conservées en LATIN1 parce
 que les programmes qui les utilisent s'attendent à trouver du LATIN1 et
 ne savent pas exploiter de l'UTF8 ;
- tu vas modifier des données LATIN1 qui sont parfaitement identifiées
 comme du LATIN1, par exemple : des fichiers XML qui contiennent l'entête
 « <?xml version="1.0" encoding="ISO-8859-1"?> ;
- tu vas modifier des données déjà encodées en UTF8 (ce qui va corrompre
 certains code points), toujours par exemple des fichiers XML :
 « <?xml version="1.0" encoding="UTF-8"?>.

Une conversion au cas par cas, lorsque des dysfonctionnements sont avérés
semble moins hasardeuse.


Bonjour,

Oui c'est ce que l'on a décidé en fin de compte... :D mais sinon le script trouvé sur ce site :
http://sebdeblinux.free.fr/
donne de bons résultats...c'est un peu long mais ça marche.

Bye bye et merci
Guillaume

 



Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/