Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0

[ Thread Index | Date Index | More ergodis.org/discussions Archives ]

To: discussions@xxxxxxxxxxx
Subject: Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0
From: Jean-François Colson <bepo@xxxxxxxxx>
Date: Tue, 17 Jun 2014 02:57:05 +0200

Le 17/06/14 00:00, sinma a écrit :

On 2014-06-16 23:41, Jean-François Colson wrote:

Le 16/06/14 23:26, sinma a écrit :

C’est qu’ils vont réussir à nous les remplir les 32 bits les salauds!

32 bits ‽ Souviens-toi que, à cause du système des paires d’indirection (un seizet d’indirection supérieur parmi 1024 suivi d’un seizet d’indirection inférieur parmi 1024) utilisé en UTF-16 pour coder les caractères de numéro > 0xFFFF et dans un souci de « codabilité » de tout caractère quel que soit le codage utilisé, l’espace de définition d’Unicode a été réduit à l’indervalle [0 ; 10FFFF].

J’ai rien compris mais je pense que j’ai compris ce que tu voulais dire — mais je voulais dire 32 bits en comptant les astuces utilisées pour le codage.

T’as rien compris mais tu penses que t’as compris… Je ne comprends pas. ☺

Ce que je voulais dire, en résumé, c’est que l’UTF-16 tel qu’il est défini aujourd’hui ne permet pas de coder des caractères dont le numéro dépasse 10FFFF. Donc, pour s’assurer de pouvoir coder tout caractère quel que soit l’encodage utilisé, il a été décidé de limiter Unicode à l’intervalle [0 ; 10FFFF].
10FFFF, ça tient sur 21 bits. 32 bits, on y arrivera peut-être dans quelques siècles. Il doit rester environ 800 000 points de code disponibles. Même si on en ajoute quelques milliers à chaque nouvelle version *.0, il y a encore de la marge.

Et sinon pour le rouble, on l’ajoute au Bépo ou bien? :p

Je crois qu’il faudrait revoir en profondeur le fonctionnement de la touche morte monéraire.

C’est-à-dire?

Pour le moment, on s’en tient à
touche morte monétaire + un seul caractère → symbole monétaire.
On a un nombre limité de lettres.
Parmi les unités dont le nom commence par r, on a déjà le riel (៛) et le rial (﷼ ) mappés sur I et sur i, la roupie (૱ et ௹), sur O et o, la roupie (₨), sur R, la roupie indienne (₹), sur r (mise à jour requise) et, maintenant, le rouble (₽). Ça fait beaucoup..
Ne pourrait-on pas imaginer quelque chose du genre
touche morte monétaire + 2 caractères,
dans certains cas ? Genre ¤ r s pour la roupie ₨, ¤ r i pour la roupie indienne, ¤ r r pour le rouble, ¤ R majuscule suivi d’un autre caractère pour les autres.
À la limite, serait-il utile / envisageable de supprimer les symboles qui ne sont pas destinés à être utilisés dans un texte en lettres latines ?

Follow-Ups:
- Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0
  - From: Jean-François Colson

References:
- [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0
  - From: Jean-François Colson
- Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0
  - From: sinma
- Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0
  - From: Jean-François Colson
- Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0
  - From: sinma

Messages sorted by: [ date | thread ]
Prev by Date: Re: [EGD-discu] Une adresse sur Paris pour Ergodis
Next by Date: Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0
Previous by thread: Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0
Next by thread: Re: [EGD-discu] Fwd: Announcing The Unicode Standard, Version 7.0

Mail converted by MHonArc 2.6.19+

http://listengine.tuxfamily.org/