Re: [wesnothfr] script d’auto correction #outil

Merci pour les explications alberic89, je crois qu'on est d'accord sur la majorité des points.

Si tu sais me passer les avertissements de check-tp-wesnoth, je peux y jeter un coup d'œil.

Pour les incohérences, je faisais référence à toute déviation typographique par rapport au standard de la traduction française. Un autre exemple serait justement « œil » et « oeil », « cœur » et « coeur ».

Par contre la référence à github me fait un peu peur. En pratique notre processus de traduction n'est pas très automatisé (par exemple utilisation de la liste, liquider les fuzzy avant les nouvelles traductions). Imagine qu'une personne envoie la correction des fuzzy (par email) puis continue son travail sur les nouvelles traductions. Si entre-temps ces corrections sont passées par les scripts automatiques, la version sur laquelle elle travaillait diverge de la version dans github, créant des conflits à chaque fois qu'elle envoie ses progrès. C'est pourquoi je préférerais une application uniquement sur les domaines traduits à 100 % et en fin de cycle (avant une nouvelle version).

Je pense qu'il est aussi important que nous conservions un processus qui ne requiert pas de nos traducteurs une connaissance de github. Tout un chacun peut décider, comme toi, de l'utiliser mais ça ne devrait pas être obligatoire. On veut toujours augmenter nos chances de trouver de nouveaux contributeurs.

Bon travail et bon week-end,

-^^- demario

On Saturday, March 9th, 2024 at 12:08 PM, alberic89 alberic89@xxxxxxx wrote:

Bonjour demario (et aussi bonjour à tous),

Il est possible d'ignorer les messages en commentaire, il suffit
d'utiliser l'option -b dans posieve. J'y penserai la prochaine fois, et
je le met par défaut dans mes autres scripts qui l'utilisent.
Pour ce qui est des ..., c'est fort possible que ayant bidouillé
pendant un moment avec les outils, j'ai passé certains fichier avec la
version qui convertissait en Unicode et pas pour d'autre. Entre-temps,
j'ai ajouté deux options à mon sieve : une pour tout convertir les
trois points ascii vers unicode, et l'inverse.

Pour la chaîne de #wesnoth-po, c'est un cas que je n'avais pas prévus,
l'usage des caractère pour dire : « regardez ces caractères, voyez les
biens ! ». J'ai corrigé mon sieve pour qu'il regarde si il y a bien un
mot avant les espaces à rendre insécable.

Le temps d'exécution de l'ensemble des scripts est négligeable, une
dizaine de seconde pour corriger l'ensemble des domaines.

Je me rends comte que jusque là j'ai été assez peu clair sur comment
j'organisais mes scripts, voici des explications.

Tout d'abord, il faut savoir que la suite pology fournis un ensemble
d'outils pour interagir avec les fichiers PO, dont l'outil posieve.
posieve permet de lancer de petits scripts sur les messages des
fichiers PO. Ces scripts sont appelés des sieves.
J'utilise actuellement deux sieves : le sieve check-tp-wesnoth (check
technical problem) qui vérifie que les fichiers ne comportent pas
d'erreurs techniques, telles que des balises de formatage mal fermées,
des incohérences avec la traduction (balises pas présentent dans la
traduction et l'original, espaces manquant ou surnuméraires dans la
traduction par rapport à l'original). Ce sieve est par défaut intégré à
pology, et n'apporte pas de mofifications à la traduction. Il se
contente de pointer les erreurs.
J'ai également développé mon sieve personnel que j'appelle fr:wesnoth
qui s'occupe de corriger directement la typographie, mais qui peut
faire ce que je veux qu'il fasse. Actuellement, il corrige les espaces
insécables, les apostrophes. Il peut également en lui passant des
options changer les points de suspension en ascii ou unicode, et aussi
modifier les espaces au début ou à la fin d'un message en espaces de
ponctuation pour que le sieve check-tp-wesnoth ne détecte plus une
erreur quand on a une bonne raison d'être différent de la version
anglaise.

Pour appliquer ces deux sieve, j'utilise ce qui s'appelle un hook git.
C'est un script bash qui s'exécute juste avant chaque commit, et qui
vas dans cet ordre :
- corriger la typo avec le sieve fr:wesnoth
- vérifier que tout est conforme avec le sieve check-tp-wesnoth
- uniformiser la mise en page interne des fichiers PO avec msgcat

Voilà, j'espère que c'est un peu plus clair.

Je vais maintenant commenter les propositions de demario :

Si possible,je diviserais tes propositions en trois classes de
correction :

Je pense également que ça peux être une bonne chose. J'aime bien l'idée
d'avoir plusieurs « niveaux » de correction.

1. corrections d'erreurs : espaces insécables, double espaces et ce
qui est détecté par check-tp-wesnoth

Je ne corrigeais pas les doubles espaces, mais c'est une très bonne
idée. Je met sur ma todolist.
Par contre, je craint ne pas pouvoir corriger automatiquement ce qui
est relevé par check-tp-wesnoth, il s'agit souvent d'erreur demandant
un jugement parfois complexe, je préfère ne pas prendre le risque de
faire une fausse correction. Les erreurs relevées par check-tp-wesnoth
sont assez peu nombreuses, j'en ai eu une dizaine sur tous les fichiers
testés. C'est parfaitement à l'échelle de correction humaine.

J'y ajouterai les incohérences par rapport à la
pratique la plus répandue concernant les parenthèses, les
guillemets…
(ce qui me contrarie plus que l'utilisation d'ascii)

Qu'entends-tu par « incohérences par rapport à la pratique la plus
répandue concernant les parenthèses, les guillemets… » ? Veux tu parler
de si on met des espaces avant ou après les parenthèses, selon s'il y a
des autres ponctuations autours et tout ? Ou parles-tu d'autre chose ?

2. améliorations typographiques : apostrophes et/ou guillemets
unicode, autres(?)

Je ne corrige pas encore non plus les guillemets '' en « », j'ajoute
sur ma todolist.

3. améliorations additionnelles : principalement autour des …

Du coup, je mettrais bien aussi ici le remplacement des espaces en
espaces typographiques quand il y a besoin.
Je pense que chacune de ces amélioration de niveau 3 devraient être
activé manuellement au cas par cas lors de l'exécution du sieve.

L'idéal serait qu'on les applique indépendamment l'une après
l'autre
dans l'ordre. Je pense aussi que les utilisations actuelles de ’ et
…
(unicode) devraient être reconverties en ' et ... (ascii) dans le
cadre de la première passe (en tant qu'incohérences).

En effet, ce serai cohérent. J'approuve.

Si je dois résumer, tu voudrais qu'on puisse dire au script : corrige
les erreurs de niveau 1 (erreurs, normalisation des traduction) ou au
niveau 2 (changements typographiques) et enfin des corrections
exceptionnelles et on précise lesquelles.

Je vais essayer d'intégrer ses changements au plus vite, pour vous
envoyer une version mieux corrigé et si possible re-lisible avant la
sortie de la 1.18.
Si vous avez des questions, des remarques, surtout demandez-moi des
explications.

Sur ce, bonne journée !
--
alberic89 alberic89@xxxxxxx

Le vendredi 08 mars 2024 à 16:05 +0000, dembot organizer a écrit :

Bonjour alberic89,
tu as fait beaucoup de travail sur ce sujet. Ce serait bien de
pouvoir inclure ces changements dans la traduction.

Je vois quelques erreurs. Sans trop m'attarder dessus, il y a la
modification des chaînes en bas de fichier qui sont en commentaire
;
l'idéal, ce serait de les ignorer. Par ailleurs il semble que sur
certains fichiers les '...' soient convertis en … (#did) tandis que
dans d'autres ils ne le sont pas (#tsg). Finalement dans #wesnoth-
po,
il ne faudrait pas convertir la chaîne « [...]un des symboles
suivants, ne sont pas autorisés :[...] » ni « [...]contenir deux
points ou l'un des caractères suivants :[...] ».
Je cite le premier point (chaînes en commentaire) car comme tu le
dis, le fichier .diff résultat de la conversion est bien trop grand
pour être vérifié par un humain. Donc toutes réduction de la taille
serait bonne à prendre.

Je me demande si ton outil est paramétrable : est-ce qu'on peut
facilement activer ou désactiver certaines règles ? Je me demande
aussi combien de temps il faut pour générer les changements sur les
fichiers po de wesnoth (secondes, minutes ou heures).
Si possible,je diviserais tes propositions en trois classes de
correction :
1. corrections d'erreurs : espaces insécables, double espaces et ce
qui est détecté par check-tp-wesnoth (je ne comprends pas vraiment
les détails). J'y ajouterai les incohérences par rapport à la
pratique la plus répandue concernant les parenthèses, les
guillemets…
(ce qui me contrarie plus que l'utilisation d'ascii)
2. améliorations typographiques : apostrophes et/ou guillemets
unicode, autres(?)
3. améliorations additionnelles : principalement autour des …
L'idéal serait qu'on les applique indépendamment l'une après
l'autre
dans l'ordre. Je pense aussi que les utilisations actuelles de ’ et
…
(unicode) devraient être reconverties en ' et ... (ascii) dans le
cadre de la première passe (en tant qu'incohérences).

Enfin, je crois que les conditions de conversion des fichiers .po
devraient au moins couvrir :
1. conversion uniquement pour les fichiers des domaines 100 %
traduits et relus
2. conversion sur base d'une version non-modifiée venant de github
(en excluant tout autre changement de traduction, orthographe ou
fuzzy)
3. conversion faite par une seule personne (toi ? mdr)
4. conversion uniquement avant la publication d'une nouvelle
version
(1.18.1, 1.18.2…)

Voilà, pardonne-moi pour les nombreux commentaires assez tardifs.
J'avais besoin de mettre mes idées en place.
Bonne journée,
-^ ^ - demario