Re: [wesnothfr] script d’auto correction #outil

[ Thread Index | Date Index | More lists.tuxfamily.org/wesnothfr Archives ]


Bonjour demario (et aussi bonjour à tous),

Il est possible d'ignorer les messages en commentaire, il suffit
d'utiliser l'option -b dans posieve. J'y penserai la prochaine fois, et
je le met par défaut dans mes autres scripts qui l'utilisent.
Pour ce qui est des ..., c'est fort possible que ayant bidouillé
pendant un moment avec les outils, j'ai passé certains fichier avec la
version qui convertissait en Unicode et pas pour d'autre. Entre-temps,
j'ai ajouté deux options à mon sieve : une pour tout convertir les
trois points ascii vers unicode, et l'inverse.

Pour la chaîne de #wesnoth-po, c'est un cas que je n'avais pas prévus,
l'usage des caractère pour dire : « regardez ces caractères, voyez les
biens ! ». J'ai corrigé mon sieve pour qu'il regarde si il y a bien un
mot avant les espaces à rendre insécable.

Le temps d'exécution de l'ensemble des scripts est négligeable, une
dizaine de seconde pour corriger l'ensemble des domaines.


Je me rends comte que jusque là j'ai été assez peu clair sur comment
j'organisais mes scripts, voici des explications.

Tout d'abord, il faut savoir que la suite pology fournis un ensemble
d'outils pour interagir avec les fichiers PO, dont l'outil posieve.
posieve permet de lancer de petits scripts sur les messages des
fichiers PO. Ces scripts sont appelés des sieves.
J'utilise actuellement deux sieves : le sieve check-tp-wesnoth (check
technical problem) qui vérifie que les fichiers ne comportent pas
d'erreurs techniques, telles que des balises de formatage mal fermées,
des incohérences avec la traduction (balises pas présentent dans la
traduction et l'original, espaces manquant ou surnuméraires dans la
traduction par rapport à l'original). Ce sieve est par défaut intégré à
pology, et n'apporte pas de mofifications à la traduction. Il se
contente de pointer les erreurs.
J'ai également développé mon sieve personnel que j'appelle fr:wesnoth
qui s'occupe de corriger directement la typographie, mais qui peut
faire ce que je veux qu'il fasse. Actuellement, il corrige les espaces
insécables, les apostrophes. Il peut également en lui passant des
options changer les points de suspension en ascii ou unicode, et aussi
modifier les espaces au début ou à la fin d'un message en espaces de
ponctuation pour que le sieve check-tp-wesnoth ne détecte plus une
erreur quand on a une bonne raison d'être différent de la version
anglaise.

Pour appliquer ces deux sieve, j'utilise ce qui s'appelle un hook git.
C'est un script bash qui s'exécute juste avant chaque commit, et qui
vas dans cet ordre :
- corriger la typo avec le sieve fr:wesnoth
- vérifier que tout est conforme avec le sieve check-tp-wesnoth
- uniformiser la mise en page interne des fichiers PO avec msgcat

Voilà, j'espère que c'est un peu plus clair.

Je vais maintenant commenter les propositions de demario :

> > Si possible,je diviserais tes propositions en trois classes de
> > correction :
Je pense également que ça peux être une bonne chose. J'aime bien l'idée
d'avoir plusieurs « niveaux » de correction.

> > 1. corrections d'erreurs : espaces insécables, double espaces et ce
> > qui est détecté par check-tp-wesnoth
Je ne corrigeais pas les doubles espaces, mais c'est une très bonne
idée. Je met sur ma todolist.
Par contre, je craint ne pas pouvoir corriger automatiquement ce qui
est relevé par check-tp-wesnoth, il s'agit souvent d'erreur demandant
un jugement parfois complexe, je préfère ne pas prendre le risque de
faire une fausse correction. Les erreurs relevées par check-tp-wesnoth
sont assez peu nombreuses, j'en ai eu une dizaine sur tous les fichiers
testés. C'est parfaitement à l'échelle de correction humaine..

> > J'y ajouterai les incohérences par rapport à la
> > pratique la plus répandue concernant les parenthèses, les
> > guillemets…
> > (ce qui me contrarie plus que l'utilisation d'ascii)
Qu'entends-tu par « incohérences par rapport à la pratique la plus
répandue concernant les parenthèses, les guillemets… » ? Veux tu parler
de si on met des espaces avant ou après les parenthèses, selon s'il y a
des autres ponctuations autours et tout ? Ou parles-tu d'autre chose ?

> > 2. améliorations typographiques : apostrophes et/ou guillemets
> > unicode, autres(?)
Je ne corrige pas encore non plus les guillemets '' en « », j'ajoute
sur ma todolist.

> > 3. améliorations additionnelles : principalement autour des …
Du coup, je mettrais bien aussi ici le remplacement des espaces en
espaces typographiques quand il y a besoin.
Je pense que chacune de ces amélioration de niveau 3 devraient être
activé manuellement au cas par cas lors de l'exécution du sieve.

> > L'idéal serait qu'on les applique indépendamment l'une après
> > l'autre
> > dans l'ordre. Je pense aussi que les utilisations actuelles de ’ et
> > …
> > (unicode) devraient être reconverties en ' et ... (ascii) dans le
> > cadre de la première passe (en tant qu'incohérences).
En effet, ce serai cohérent. J'approuve.

Si je dois résumer, tu voudrais qu'on puisse dire au script : corrige
les erreurs de niveau 1 (erreurs, normalisation des traduction) ou au
niveau 2 (changements typographiques) et enfin des corrections
exceptionnelles et on précise lesquelles.


Je vais essayer d'intégrer ses changements au plus vite, pour vous
envoyer une version mieux corrigé et si possible re-lisible avant la
sortie de la 1.18.
Si vous avez des questions, des remarques, surtout demandez-moi des
explications.

Sur ce, bonne journée !
-- 
alberic89 <alberic89@xxxxxxx>

Le vendredi 08 mars 2024 à 16:05 +0000, dembot organizer a écrit :
> > Bonjour alberic89,
> > tu as fait beaucoup de travail sur ce sujet. Ce serait bien de
> > pouvoir inclure ces changements dans la traduction.
> > 
> > Je vois quelques erreurs. Sans trop m'attarder dessus, il y a la
> > modification des chaînes en bas de fichier qui sont en commentaire
> > ;
> > l'idéal, ce serait de les ignorer. Par ailleurs il semble que sur
> > certains fichiers les '...' soient convertis en … (#did) tandis que
> > dans d'autres ils ne le sont pas (#tsg). Finalement dans #wesnoth-
> > po,
> > il ne faudrait pas convertir la chaîne « [...]un des symboles
> > suivants, ne sont pas autorisés :[...] » ni « [...]contenir deux
> > points ou l'un des caractères suivants :[...] ».
> > Je cite le premier point (chaînes en commentaire) car comme tu le
> > dis, le fichier .diff résultat de la conversion est bien trop grand
> > pour être vérifié par un humain. Donc toutes réduction de la taille
> > serait bonne à prendre.
> > 
> > Je me demande si ton outil est paramétrable : est-ce qu'on peut
> > facilement activer ou désactiver certaines règles ? Je me demande
> > aussi combien de temps il faut pour générer les changements sur les
> > fichiers po de wesnoth (secondes, minutes ou heures).
> > Si possible,je diviserais tes propositions en trois classes de
> > correction :
> > 1. corrections d'erreurs : espaces insécables, double espaces et ce
> > qui est détecté par check-tp-wesnoth (je ne comprends pas vraiment
> > les détails). J'y ajouterai les incohérences par rapport à la
> > pratique la plus répandue concernant les parenthèses, les
> > guillemets…
> > (ce qui me contrarie plus que l'utilisation d'ascii)
> > 2. améliorations typographiques : apostrophes et/ou guillemets
> > unicode, autres(?)
> > 3. améliorations additionnelles : principalement autour des …
> > L'idéal serait qu'on les applique indépendamment l'une après
> > l'autre
> > dans l'ordre. Je pense aussi que les utilisations actuelles de ’ et
> > …
> > (unicode) devraient être reconverties en ' et ... (ascii) dans le
> > cadre de la première passe (en tant qu'incohérences).
> > 
> > Enfin, je crois que les conditions de conversion des fichiers .po
> > devraient au moins couvrir :
> > 1. conversion uniquement pour les fichiers des domaines 100 %
> > traduits et relus
> > 2. conversion sur base d'une version non-modifiée venant de github
> > (en excluant tout autre changement de traduction, orthographe ou
> > fuzzy)
> > 3. conversion faite par une seule personne (toi ? mdr)
> > 4. conversion uniquement avant la publication d'une nouvelle
> > version
> > (1.18.1, 1.18.2…)
> > 
> > Voilà, pardonne-moi pour les nombreux commentaires assez tardifs.
> > J'avais besoin de mettre mes idées en place.
> > Bonne journée, 
> > -^ ^ - demario
> > > 

Attachment: signature.asc
Description: This is a digitally signed message part



Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/