Re: [wesnothfr] script d’auto correction #outil

[ Thread Index | Date Index | More lists.tuxfamily.org/wesnothfr Archives ]

To: wesnothfr@xxxxxxxxxxxxxxxxxxx
Subject: Re: [wesnothfr] script d’auto correction #outil
From: alberic89 <alberic89@xxxxxxx>
Date: Sat, 09 Mar 2024 12:08:19 +0100
Dkim-signature: v=1; a=rsa-sha256; c=relaxed/simple; d=gmx.com; s=s31663417; t=1709982501; x=1710587301; i=alberic89@xxxxxxx; bh=n0wD/3ouYo2GUIGaZ7xSNpYrx/A8ciG9AKi/V3OXVzQ=; h=X-UI-Sender-Class:Subject:From:To:Date:In-Reply-To:References; b=RB3zEenuhc2Kq0sHAXSbzFKDLOWBb+FtBpM1YddydiI1XUqfEOn7wHg7qqf9sTje RGZZ7T+zBTZKArxX0txlLxT85c4aVdOxSNLRWYuFii/WrrLMH4GIYV5J9gYveUBFf EYeJQN2qeDFpSyB6OeyAiZvBAmzn3IVjmZ1HmIhQHCKG7hRet/KdysCtY/RErUFxx Ciz7W4wP0hFWZmqiRvSrBp/R7e1eBhz8nPbza3bOWMFpqlMJeRu2fTQ3aj2LsiHpq WGCSbI17mAhRBeLicOR5E9r/5duImRc+iBtgQLO2au26y+nBZZTZTu7v0gFFqAyhV i6fpkvYRXJ8lZBqVgg==
Ui-outboundreport: notjunk:1;M01:P0:eoR3iMBZ9DI=;dmwtouyjU5BUm2nJTvluVcTFXWV uPbQg5H9t22gFJu52oMt/9RBlINP9pB3rFmyIQQCmgklWuby4cyqGL/aTir52jdg4O3faW9mt Yu+EKEM6KPHc/n5WPmeaSxoUJwf9Pc6M+uGU+u0tkEXzWTOA1ZjMEopjY+TBKMmoQhVmejfkd j7qk84WHnf1HH7sTQxyMOYs30ia7up386013QPvKRmkvMf6d4UEhiI3q1++pb+TtFcIhsOrce Tg/YHr4dFKVJST+zFC049az6N3VMT00eKfx58NPjar2ngyTJTPbXdOjQzjuHf5EeyntOCOcBU yDhczibtMzydpvln/hSYjXD2WdnjHf92WKVAUBu+wl3mMCT+iPlNqr3+5IOB2st6dtgnG8fGT zM8ZmfdaY5MCBLfnqAhGiPIRKDc4MffkmbukO5X9b2wCBRccXEyGOlJxfIeeGt41A8yp7ZL/i AqBcMBIolJoP3swD20Kvt8GZgiTUOgZF9I6KV83MusJ8BkG/MmFOsYXTvtwutAETafqCHBl4J iZLPB7mGntyvxfdF3FlcBM99n37/L4WeBqgaUfFHio9D15F/+LO476JeULoTkMWX1JZA45C9D EDoQ4a+dSSppzulN98MQGIkpqUEzExqpU9EVwz9J/3rv1bKOEzztyPEg05NLvLzlse5VymT0q 4hG8E706eDimuecgABereq7zbM9oVcCGc7bJD9ilEex4NTVN1B6V9g3YSlhfpEK1hxkvm0S9B Nw5vqj4VU7pCKg9yPAL2CY7tzwEMRBoLEBDyBlILjV6VWBNpoEj5qzGkF7UgN83wKngkNZC9q k0XR7FLYr0tgjqJWJsja/tQuIr1Za6w2wARB/kL/OsVpE=

Bonjour demario (et aussi bonjour à tous),

Il est possible d'ignorer les messages en commentaire, il suffit
d'utiliser l'option -b dans posieve. J'y penserai la prochaine fois, et
je le met par défaut dans mes autres scripts qui l'utilisent.
Pour ce qui est des ..., c'est fort possible que ayant bidouillé
pendant un moment avec les outils, j'ai passé certains fichier avec la
version qui convertissait en Unicode et pas pour d'autre. Entre-temps,
j'ai ajouté deux options à mon sieve : une pour tout convertir les
trois points ascii vers unicode, et l'inverse.

Pour la chaîne de #wesnoth-po, c'est un cas que je n'avais pas prévus,
l'usage des caractère pour dire : « regardez ces caractères, voyez les
biens ! ». J'ai corrigé mon sieve pour qu'il regarde si il y a bien un
mot avant les espaces à rendre insécable.

Le temps d'exécution de l'ensemble des scripts est négligeable, une
dizaine de seconde pour corriger l'ensemble des domaines.


Je me rends comte que jusque là j'ai été assez peu clair sur comment
j'organisais mes scripts, voici des explications.

Tout d'abord, il faut savoir que la suite pology fournis un ensemble
d'outils pour interagir avec les fichiers PO, dont l'outil posieve.
posieve permet de lancer de petits scripts sur les messages des
fichiers PO. Ces scripts sont appelés des sieves.
J'utilise actuellement deux sieves : le sieve check-tp-wesnoth (check
technical problem) qui vérifie que les fichiers ne comportent pas
d'erreurs techniques, telles que des balises de formatage mal fermées,
des incohérences avec la traduction (balises pas présentent dans la
traduction et l'original, espaces manquant ou surnuméraires dans la
traduction par rapport à l'original). Ce sieve est par défaut intégré à
pology, et n'apporte pas de mofifications à la traduction. Il se
contente de pointer les erreurs.
J'ai également développé mon sieve personnel que j'appelle fr:wesnoth
qui s'occupe de corriger directement la typographie, mais qui peut
faire ce que je veux qu'il fasse. Actuellement, il corrige les espaces
insécables, les apostrophes. Il peut également en lui passant des
options changer les points de suspension en ascii ou unicode, et aussi
modifier les espaces au début ou à la fin d'un message en espaces de
ponctuation pour que le sieve check-tp-wesnoth ne détecte plus une
erreur quand on a une bonne raison d'être différent de la version
anglaise.

Pour appliquer ces deux sieve, j'utilise ce qui s'appelle un hook git.
C'est un script bash qui s'exécute juste avant chaque commit, et qui
vas dans cet ordre :
- corriger la typo avec le sieve fr:wesnoth
- vérifier que tout est conforme avec le sieve check-tp-wesnoth
- uniformiser la mise en page interne des fichiers PO avec msgcat

Voilà, j'espère que c'est un peu plus clair.

Je vais maintenant commenter les propositions de demario :

> > Si possible,je diviserais tes propositions en trois classes de
> > correction :
Je pense également que ça peux être une bonne chose. J'aime bien l'idée
d'avoir plusieurs « niveaux » de correction.

> > 1. corrections d'erreurs : espaces insécables, double espaces et ce
> > qui est détecté par check-tp-wesnoth
Je ne corrigeais pas les doubles espaces, mais c'est une très bonne
idée. Je met sur ma todolist.
Par contre, je craint ne pas pouvoir corriger automatiquement ce qui
est relevé par check-tp-wesnoth, il s'agit souvent d'erreur demandant
un jugement parfois complexe, je préfère ne pas prendre le risque de
faire une fausse correction. Les erreurs relevées par check-tp-wesnoth
sont assez peu nombreuses, j'en ai eu une dizaine sur tous les fichiers
testés. C'est parfaitement à l'échelle de correction humaine..

> > J'y ajouterai les incohérences par rapport à la
> > pratique la plus répandue concernant les parenthèses, les
> > guillemets…
> > (ce qui me contrarie plus que l'utilisation d'ascii)
Qu'entends-tu par « incohérences par rapport à la pratique la plus
répandue concernant les parenthèses, les guillemets… » ? Veux tu parler
de si on met des espaces avant ou après les parenthèses, selon s'il y a
des autres ponctuations autours et tout ? Ou parles-tu d'autre chose ?

> > 2. améliorations typographiques : apostrophes et/ou guillemets
> > unicode, autres(?)
Je ne corrige pas encore non plus les guillemets '' en « », j'ajoute
sur ma todolist.

> > 3. améliorations additionnelles : principalement autour des …
Du coup, je mettrais bien aussi ici le remplacement des espaces en
espaces typographiques quand il y a besoin.
Je pense que chacune de ces amélioration de niveau 3 devraient être
activé manuellement au cas par cas lors de l'exécution du sieve.

> > L'idéal serait qu'on les applique indépendamment l'une après
> > l'autre
> > dans l'ordre. Je pense aussi que les utilisations actuelles de ’ et
> > …
> > (unicode) devraient être reconverties en ' et ... (ascii) dans le
> > cadre de la première passe (en tant qu'incohérences).
En effet, ce serai cohérent. J'approuve.

Si je dois résumer, tu voudrais qu'on puisse dire au script : corrige
les erreurs de niveau 1 (erreurs, normalisation des traduction) ou au
niveau 2 (changements typographiques) et enfin des corrections
exceptionnelles et on précise lesquelles.


Je vais essayer d'intégrer ses changements au plus vite, pour vous
envoyer une version mieux corrigé et si possible re-lisible avant la
sortie de la 1.18.
Si vous avez des questions, des remarques, surtout demandez-moi des
explications.

Sur ce, bonne journée !
-- 
alberic89 <alberic89@xxxxxxx>

Le vendredi 08 mars 2024 à 16:05 +0000, dembot organizer a écrit :
> > Bonjour alberic89,
> > tu as fait beaucoup de travail sur ce sujet. Ce serait bien de
> > pouvoir inclure ces changements dans la traduction.
> > 
> > Je vois quelques erreurs. Sans trop m'attarder dessus, il y a la
> > modification des chaînes en bas de fichier qui sont en commentaire
> > ;
> > l'idéal, ce serait de les ignorer. Par ailleurs il semble que sur
> > certains fichiers les '...' soient convertis en … (#did) tandis que
> > dans d'autres ils ne le sont pas (#tsg). Finalement dans #wesnoth-
> > po,
> > il ne faudrait pas convertir la chaîne « [...]un des symboles
> > suivants, ne sont pas autorisés :[...] » ni « [...]contenir deux
> > points ou l'un des caractères suivants :[...] ».
> > Je cite le premier point (chaînes en commentaire) car comme tu le
> > dis, le fichier .diff résultat de la conversion est bien trop grand
> > pour être vérifié par un humain. Donc toutes réduction de la taille
> > serait bonne à prendre.
> > 
> > Je me demande si ton outil est paramétrable : est-ce qu'on peut
> > facilement activer ou désactiver certaines règles ? Je me demande
> > aussi combien de temps il faut pour générer les changements sur les
> > fichiers po de wesnoth (secondes, minutes ou heures).
> > Si possible,je diviserais tes propositions en trois classes de
> > correction :
> > 1. corrections d'erreurs : espaces insécables, double espaces et ce
> > qui est détecté par check-tp-wesnoth (je ne comprends pas vraiment
> > les détails). J'y ajouterai les incohérences par rapport à la
> > pratique la plus répandue concernant les parenthèses, les
> > guillemets…
> > (ce qui me contrarie plus que l'utilisation d'ascii)
> > 2. améliorations typographiques : apostrophes et/ou guillemets
> > unicode, autres(?)
> > 3. améliorations additionnelles : principalement autour des …
> > L'idéal serait qu'on les applique indépendamment l'une après
> > l'autre
> > dans l'ordre. Je pense aussi que les utilisations actuelles de ’ et
> > …
> > (unicode) devraient être reconverties en ' et ... (ascii) dans le
> > cadre de la première passe (en tant qu'incohérences).
> > 
> > Enfin, je crois que les conditions de conversion des fichiers .po
> > devraient au moins couvrir :
> > 1. conversion uniquement pour les fichiers des domaines 100 %
> > traduits et relus
> > 2. conversion sur base d'une version non-modifiée venant de github
> > (en excluant tout autre changement de traduction, orthographe ou
> > fuzzy)
> > 3. conversion faite par une seule personne (toi ? mdr)
> > 4. conversion uniquement avant la publication d'une nouvelle
> > version
> > (1.18.1, 1.18.2…)
> > 
> > Voilà, pardonne-moi pour les nombreux commentaires assez tardifs.
> > J'avais besoin de mettre mes idées en place.
> > Bonne journée, 
> > -^ ^ - demario
> > >

Attachment: signature.asc
Description: This is a digitally signed message part

Follow-Ups:
- Re: [wesnothfr] script d’auto correction #outil
  - From: dembot organizer

References:
- Re: [wesnothfr] script d’auto correction #outil
  - From: dembot organizer
- Re: [wesnothfr] script d’auto correction #outil
  - From: alberic89
- Re: [wesnothfr] script d’auto correction #outil
  - From: dembot organizer

Messages sorted by: [ date | thread ]
Prev by Date: [wesnothfr] Re: Mes « plans » personnels de traduction
Next by Date: Re: [wesnothfr] script d’auto correction #outil
Previous by thread: Re: [wesnothfr] script d’auto correction #outil
Next by thread: Re: [wesnothfr] script d’auto correction #outil

Mail converted by MHonArc 2.6.19+

http://listengine.tuxfamily.org/