Re: [wikiss-users] Problème de conversion UTF-8 lors de la migration depuis TigerWiki |
[ Thread Index |
Date Index
| More lists.tuxfamily.org/wikiss-users Archives
]
- To: wikiss-users@xxxxxxxxxxxxxxxxxxx
- Subject: Re: [wikiss-users] Problème de conversion UTF-8 lors de la migration depuis TigerWiki
- From: "Charles-Henri d'Adhémar" <cdadhemar@xxxxxxxxx>
- Date: Mon, 17 Sep 2007 21:46:48 +0200
- Dkim-signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=beta; h=domainkey-signature:received:received:message-id:date:from:to:subject:in-reply-to:mime-version:content-type:content-transfer-encoding:content-disposition:references; bh=vXVqj15Mn+0EmKD8IF+954GRam9HUZwvZY3zXvdmefk=; b=CA5ROeK2GsUaIdrlZxAnbo8yMh0G2TOm285KSv2gulxshFcwt3vAmNZyxmxNAR7Ftf+XDzyCtSA3ja5ns7IJl4TGmRlFLIcesVg5mDzoOlvKF7FtQrX2QAJS8+dH5C3iPqRp0UN5rPNpGzeuvVs7R8tGt/F314ontayL1TWTMgc=
- Domainkey-signature: a=rsa-sha1; c=nofws; d=gmail.com; s=beta; h=received:message-id:date:from:to:subject:in-reply-to:mime-version:content-type:content-transfer-encoding:content-disposition:references; b=UXUH9wmz/kCtM36NfZmUrGnXCG6muExASgWR+mtZUhe0wCU+yl6wkVe1gfurme9+bkZe3WUVSEAfAXZNwY8eYLNs1oQqrZKRoCTebDHtd2Bz5Ts696vLommm7PH5ZN9JZzpgA1GroZ/HLwvAgBwBu/MCfhTjpFv8s0YQq/VUdWE=
Salut,
Merci de ta réponse complète :-)
Je comprend très bien le problème.
Malheureusement je pense qu'un outils complet pour la conversion
serait bien lourd à faire, quand un coup de sed ou un coup de "Replace
all" dans un éditeur de texte fait le boulot très bien.
En ce qui me concerne je m'accomode très bien de ton outils de
conversion, mais il faut dire que j'ai peu de pages à traiter ...
Merci encore,
à+
Chicha
Le 17/09/07, JJL<buggerone@xxxxxxxxx> a écrit :
> Salut,
>
> > Version de TigerWiki utilisée : 2.21
> > En utilisant l'outil de migration "tigerwiki2wikiss.php", mes pages
> > sont détectées comme étant UTF8.
> > Je lance la conversion (Do It). Mes pages sont toujours en UTF8 mais
> > les caractères accentués sont changés en caractères bizarres que
> > connaissent bien tous ceux qui ont eut un jour à faire avec l'encodage
> > UTF8 - Iso8859-15 etc ...
> Le problème vient de TigerWiki (depuis la version 2.20). En fait je
> l'avais déjà remarqué quand j'ai étudié la 2.21 (mais ça m'est sorti
> de la tête :( )
> La fonction utf8_encode est systématiquement utilisée. Hors cette
> fonction encode de l'iso-8859 vers de l'utf8 quel que soit le charset
> en entrée. Donc si ton système est déjà en utf-8, les caractères sont
> doublements encodés.
> J'avais évoqué ce problème à l'époque ici :
> http://kubuntu.free.fr/TigerWiki/?page=UTF-8#%20Probl%C3%A8mes (3ème
> point)
>
> Pour preuve il suffit d'ouvrir une de tes pages avec un éditeur réglé
> en utf-8. Les caractères apparaissent comme s'ils étaient de l'utf-8
> affiché en iso-8859. Pour corriger cela, on peut convertir la page
> d'utf-8 vers iso-8859, par exemple :
> $> iconv -c -f utf-8 -t iso-8859-15 < StingySpecs.txt > StingySpecs.txt.utf
> StingySpecs.txt.utf est maintenant encodé en utf-8 "simple"
> Le problème est que WiKiss se comporte comme l'éditeur ci-dessus
>
> Pour s'en sortir manuellement (sous Linux) on peut adapter la
> procédure décrite ici :
> http://wikiss.tuxfamily.org/?page=Developpement#TestUTF-8
>
> Maintenant mon outil automatique n'est pas adapté pour cela. La
> procédure dépend de bcp trop de paramètres (charset du système client,
> charset du système serveur, version de TW) Actuellement il n'est en
> fait adapté qu'aux versions de TW < 2.20
>
> La solution serait peut-être d'avoir un outil plus flexible et de
> laisser l'utilisateur faire ses conversions selon son besoin.
>
> ++
> JJL
> --
> http://kubuntu.free.fr/blog
>
> ---
> http://wikiss.tuxfamily.org
>
---
http://wikiss.tuxfamily.org