Re: [wikiss-users] Problème de conversion UTF-8 lors de la migration depuis TigerWiki |
[ Thread Index |
Date Index
| More lists.tuxfamily.org/wikiss-users Archives
]
- To: wikiss-users@xxxxxxxxxxxxxxxxxxx
- Subject: Re: [wikiss-users] Problème de conversion UTF-8 lors de la migration depuis TigerWiki
- From: JJL <buggerone@xxxxxxxxx>
- Date: Mon, 17 Sep 2007 20:18:46 +0200
- Dkim-signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=beta; h=domainkey-signature:received:received:message-id:date:from:to:subject:in-reply-to:mime-version:content-type:content-transfer-encoding:content-disposition:references; bh=3R/SanQWxSX3cfxCjJaVy2klpxQyqiS30wnzQdWsZVc=; b=P8asogja5bNVpiiuRubLUDnh/lkTNlwYghAmrMZ9JsVTtsAdb9dUnVh+JlvHlq5wt+KAFFVG037tJQJ0QjhiI5fsBYwjLrUkIL81KnzZRYeTjILGjUHfCUFtDcVrRtfRUq5nNvKWqksoyw2dpPzAGqXP5aiifYtXkvffduShUKc=
- Domainkey-signature: a=rsa-sha1; c=nofws; d=gmail.com; s=beta; h=received:message-id:date:from:to:subject:in-reply-to:mime-version:content-type:content-transfer-encoding:content-disposition:references; b=K9PdhtyS6SJwFocKa0kcX+cjofg3Lg+mNNtFIWOiSLAS3NvCWLROF2i2x6ZfghuglPVmI51FSCVv1tCpgP1E3jsBMQ7rDTEJ1qzZczoWsz6jJcFktcECF5kCETfVbxSuiLv79nUnZ8eWmiTaNFWl7dHzT/OqLcEG5Pag6DTowNo=
Salut,
> Version de TigerWiki utilisée : 2.21
> En utilisant l'outil de migration "tigerwiki2wikiss.php", mes pages
> sont détectées comme étant UTF8.
> Je lance la conversion (Do It). Mes pages sont toujours en UTF8 mais
> les caractères accentués sont changés en caractères bizarres que
> connaissent bien tous ceux qui ont eut un jour à faire avec l'encodage
> UTF8 - Iso8859-15 etc ...
Le problème vient de TigerWiki (depuis la version 2.20). En fait je
l'avais déjà remarqué quand j'ai étudié la 2.21 (mais ça m'est sorti
de la tête :( )
La fonction utf8_encode est systématiquement utilisée. Hors cette
fonction encode de l'iso-8859 vers de l'utf8 quel que soit le charset
en entrée. Donc si ton système est déjà en utf-8, les caractères sont
doublements encodés.
J'avais évoqué ce problème à l'époque ici :
http://kubuntu.free.fr/TigerWiki/?page=UTF-8#%20Probl%C3%A8mes (3ème
point)
Pour preuve il suffit d'ouvrir une de tes pages avec un éditeur réglé
en utf-8. Les caractères apparaissent comme s'ils étaient de l'utf-8
affiché en iso-8859. Pour corriger cela, on peut convertir la page
d'utf-8 vers iso-8859, par exemple :
$> iconv -c -f utf-8 -t iso-8859-15 < StingySpecs.txt > StingySpecs.txt.utf
StingySpecs.txt.utf est maintenant encodé en utf-8 "simple"
Le problème est que WiKiss se comporte comme l'éditeur ci-dessus
Pour s'en sortir manuellement (sous Linux) on peut adapter la
procédure décrite ici :
http://wikiss.tuxfamily.org/?page=Developpement#TestUTF-8
Maintenant mon outil automatique n'est pas adapté pour cela. La
procédure dépend de bcp trop de paramètres (charset du système client,
charset du système serveur, version de TW) Actuellement il n'est en
fait adapté qu'aux versions de TW < 2.20
La solution serait peut-être d'avoir un outil plus flexible et de
laisser l'utilisateur faire ses conversions selon son besoin.
++
JJL
--
http://kubuntu.free.fr/blog
---
http://wikiss.tuxfamily.org