Unicode

Une définition du Jargon Français.
Aller à : Navigation, rechercher

Dr enus.png marque déposée nom propre.  [marque déposée]  [norme]  [caractère]. Nom d'une norme décrivant comment traiter les caractères afin de gérer de nombreuses langues, y compris mortes, et cela même si elles sont employées dans un même document.

En réalité il s'agit de gérer des « systèmes d'écriture », donc des ensembles de conventions déterminant comment stocker de l'écrit (alphabets, signes, sens d'écriture...).

Unicode associe chaque caractère à une valeur numérique (un code, au sens 6) tenant dans un à quatre octets.

Apparu au milieu des années 1980, il remplace sur le terrain depuis environ 1995 de plus en plus rapidement l'encodage ASCII, historiquement tout d'abord limité aux caractères non accentués, et est conçu afin de ménager la compatibilité avec lui car le caractère associé à un code ASCII donné est le même en Unicode.

Il définit comment fournir des informations relatives au sens d'écriture (traiter un document recelant des phrases écrites de gauche à droite et d'autres de droite à gauche, par exemple, pose divers problèmes amusants).

Cela ne résout pas tous les défis car il faut pouvoir saisir ces caractères donc disposer des claviers adéquats, afficher et imprimer donc disposer des polices (donc glyphes) nécessaires...

Définit plusieurs modes d'encodage des caractères, la plus commune est UTF-8. Voir aussi GB 18030.

Il a été unifié avec la norme ISO 10646, qui définit l'UCS (Universal Character Set).

https://www.unicode.org