Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0

[ Thread Index | Date Index | More ergodis.org/discussions Archives ]



Le 17/06/14 02:57, Jean-François Colson a écrit :

Le 17/06/14 00:00, sinma a écrit :
On 2014-06-16 23:41, Jean-François Colson wrote:

Le 16/06/14 23:26, sinma a écrit :

C’est qu’ils vont réussir à nous les remplir les 32 bits les salauds!

32 bits ‽ Souviens-toi que, à cause du système des paires d’indirection (un seizet d’indirection supérieur parmi 1024 suivi d’un seizet d’indirection inférieur parmi 1024) utilisé en UTF-16 pour coder les caractères de numéro > 0xFFFF et dans un souci de « codabilité » de tout caractère quel que soit le codage utilisé, l’espace de définition d’Unicode a été réduit à l’indervalle [0 ; 10FFFF].

J’ai rien compris mais je pense que j’ai compris ce que tu voulais dire — mais je voulais dire 32 bits en comptant les astuces utilisées pour le codage.

T’as rien compris mais tu penses que t’as compris… Je ne comprends pas. ☺

Ce que je voulais dire, en résumé, c’est que l’UTF-16 tel qu’il est défini aujourd’hui ne permet pas de coder des caractères dont le numéro dépasse 10FFFF. Donc, pour s’assurer de pouvoir coder tout caractère quel que soit l’encodage utilisé, il a été décidé de limiter Unicode à l’intervalle [0 ; 10FFFF].
10FFFF, ça tient sur 21 bits. 32 bits, on y arrivera peut-être dans quelques siècles. Il doit rester environ 800 000 points de code disponibles. Même si on en ajoute quelques milliers à chaque nouvelle version *.0, il y a encore de la marge.


Et sinon pour le rouble, on l’ajoute au Bépo ou bien? :p

Je crois qu’il faudrait revoir en profondeur le fonctionnement de la touche morte monéraire.

C’est-à-dire?

Pour le moment, on s’en tient à
     touche morte monétaire + un seul caractère → symbole monétaire.
On a un nombre limité de lettres.
Parmi les unités dont le nom commence par r, on a déjà le riel (៛) et le rial (﷼ ) mappés sur I et sur i, la roupie (૱ et ௹), sur O et o, la roupie (₨), sur R, la roupie indienne (₹), sur r (mise à jour requise) et, maintenant, le rouble (₽). Ça fait beaucoup.
Ne pourrait-on pas imaginer quelque chose du genre
     touche morte monétaire + 2 caractères,
dans certains cas ? Genre ¤ r s pour la roupie ₨, ¤ r i pour la roupie indienne, ¤ r r pour le rouble, ¤ R majuscule suivi d’un autre caractère pour les autres.
À la limite, serait-il utile / envisageable de supprimer les symboles qui ne sont pas destinés à être utilisés dans un texte en lettres latines ?

  Paix et prospérité     (U+1F596    raised hand with part between middle and ring fingers)



Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/