Membre : Connexion |Inscription |Ajouter connaissances
Rechercher
Caractères de jeu de caractères universels [Modification ]
Le Consortium Unicode (UC) et l'Organisation internationale de normalisation (ISO) collaborent sur l'Universal Character Set (UCS). L'UCS est une norme internationale permettant de mapper des caractères utilisés dans le langage naturel, les mathématiques, la musique et d'autres domaines pour obtenir des valeurs lisibles par machine. En créant ce mappage, l'UCS permet aux fournisseurs de logiciels informatiques d'interopérer et de transmettre des chaînes de caractères codées UCS d'un à l'autre. Parce que c'est une carte universelle, il peut être utilisé pour représenter plusieurs langues en même temps. Cela évite la confusion d'utiliser plusieurs codages de caractères hérités, ce qui peut avoir pour résultat que la même séquence de codes ait plusieurs significations et soit ainsi décodée de façon incorrecte si la mauvaise est choisie.
UCS a une capacité potentielle pour encoder plus de 1 million de caractères. Chaque caractère UCS est abstraitement représenté par un point de code, entier compris entre 0 et 1 114 111, utilisé pour représenter chaque caractère dans la logique interne du logiciel de traitement de texte (1 114 112 = 220 216 ou 17 × 216, ou 110000 points de code hexadécimaux). Depuis l'Unicode 10.0, publié en juin 2017, 280 016 (25%) de ces codes sont attribués, dont 136 755 (12%), 137 468 (12,3%) réservés à un usage privé, 2 048 pour les substituts et 66 non désignés caractères, laissant 834 096 (75%) non affectés. Le nombre de caractères codés est composé comme suit:

136 537 caractères graphiques (dont certains n'ont pas de glyphe visible, mais sont toujours comptés comme graphiques)
218 caractères spéciaux pour le contrôle et le formatage.
ISO conserve le mappage de base des caractères du nom du personnage au point de code. Souvent, les termes "caractère" et "point de code" seront utilisés de manière interchangeable. Cependant, quand une distinction est faite, un point de code se rapporte à l'entier du caractère: ce que l'on pourrait considérer comme son adresse. Alors qu'un caractère dans UCS 10646 inclut la combinaison du point de code et de son nom, Unicode ajoute de nombreuses autres propriétés utiles au jeu de caractères, telles que block, category, script et directionnalité.
En plus de l'UCS, Unicode fournit également d'autres détails d'implémentation tels que:

transcender les mappages entre UCS et d'autres jeux de caractères
différents classements de caractères et de chaînes de caractères pour différentes langues
un algorithme pour la mise en page de texte bidirectionnel, où le texte sur la même ligne peut se déplacer entre gauche-droite et droite-à-gauche
un algorithme de pliage de cas

Les utilisateurs finaux de logiciels informatiques entrent ces caractères dans des programmes par le biais de diverses méthodes de saisie. Les méthodes de saisie peuvent être à l'aide du clavier ou d'une palette de caractères graphique.
Le SCU peut être divisé de diverses manières, par exemple par un plan, un bloc, une catégorie de caractère ou une propriété de caractère.
[Logogramme][Syllabary][Script latin][Hangul][Kanji][Hanja][arabe][hébreu][Thaana]
1.Présentation des références de personnage
2.Avions
3.Blocs
4.Catégories
5.Caractères spéciaux
5.1.Marque de commande Byte
5.2.Invisibles mathématiques
5.3.Fraction de fraction
5.4.Formatage neutre bidirectionnel
5.5.Formatage général bidirectionnel
5.6.Caractères d'annotation interlinéaires
5.7.Spécifique au script
5.8.Autres
6.Espace blanc, menuisiers et séparateurs
6.1.Menuisiers Grapheme et non-menuisiers
6.2.Menuisiers et séparateurs de mots
6.3.Autres séparateurs
6.4.Les espaces
6.5.Caractères de contrôle de saut de ligne
7.Points de code spéciaux
7.1.Non-caractères
7.2.Surrogates
7.3.Usage privé
8.Clusters graphe de caractères et glyphes
8.1.Caractères de compatibilité
9.Propriétés du caractère
[Télécharger Plus Contenu ]


Droit d'auteur @2018 Lxjkh