Le 17/06/14 02:57, Jean-François Colson
a écrit :
Le 17/06/14 00:00, sinma a écrit :
On 2014-06-16 23:41, Jean-François
Colson wrote:
Le 16/06/14 23:26, sinma a
écrit :
C’est qu’ils vont réussir à nous les remplir les 32 bits les
salauds!
32 bits ‽ Souviens-toi que, à cause du système des paires
d’indirection (un seizet d’indirection supérieur parmi 1024
suivi d’un seizet d’indirection inférieur parmi 1024) utilisé
en UTF-16 pour coder les caractères de numéro > 0xFFFF et
dans un souci de « codabilité » de tout caractère quel que
soit le codage utilisé, l’espace de définition d’Unicode a été
réduit à l’indervalle [0 ; 10FFFF].
J’ai rien compris mais je pense que j’ai compris ce que tu
voulais dire — mais je voulais dire 32 bits en comptant les
astuces utilisées pour le codage.
T’as rien compris mais tu penses que t’as compris… Je ne comprends
pas. ☺
Ce que je voulais dire, en résumé, c’est que l’UTF-16 tel qu’il
est défini aujourd’hui ne permet pas de coder des caractères dont
le numéro dépasse 10FFFF. Donc, pour s’assurer de pouvoir coder
tout caractère quel que soit l’encodage utilisé, il a été décidé
de limiter Unicode à l’intervalle [0 ; 10FFFF].
10FFFF, ça tient sur 21 bits. 32 bits, on y arrivera peut-être
dans quelques siècles. Il doit rester environ 800 000 points de
code disponibles. Même si on en ajoute quelques milliers à chaque
nouvelle version *.0, il y a encore de la marge.
Et sinon pour le rouble, on l’ajoute au Bépo ou bien? :p
Je crois qu’il faudrait revoir en profondeur le fonctionnement
de la touche morte monéraire.
C’est-à-dire?
Pour le moment, on s’en tient à
touche morte monétaire + un seul caractère → symbole
monétaire.
On a un nombre limité de lettres.
Parmi les unités dont le nom commence par r, on a déjà le riel (៛)
et le rial (﷼ ) mappés sur I et sur i, la roupie (૱ et ௹), sur O
et o, la roupie (₨), sur R, la roupie indienne (₹), sur r (mise à
jour requise) et, maintenant, le rouble (₽). Ça fait beaucoup.
Ne pourrait-on pas imaginer quelque chose du genre
touche morte monétaire + 2 caractères,
dans certains cas ? Genre ¤ r s pour la roupie ₨, ¤ r i pour la
roupie indienne, ¤ r r pour le rouble, ¤ R majuscule suivi d’un
autre caractère pour les autres.
À la limite, serait-il utile / envisageable de supprimer les
symboles qui ne sont pas destinés à être utilisés dans un texte en
lettres latines ?
Paix et prospérité (U+1F596 raised hand with part
between middle and ring fingers)
|