Définition Unicode

Qu’est ce que : Définition Unicode

Pour transmettre une information, il faut d’abord se mettre d’accord sur la manière dont elle doit être transmise. C’est la fonction des langues pour parler, des alphabets pour écrire, ou des protocoles de communication pour les ordinateurs et les appareils électroniques.Pour transmettre des informations textuelles entre différents matériels et différents systèmes d’exploitation, nous serons confrontés au problème que ces machines peuvent être configurées dans des langages très différents (par exemple, l’une écrite en alphabet, et l’autre en idéogrammes), et qu’elles peuvent même avoir un nombre de lettres plus ou moins important les unes par rapport aux autres.

Dans ce contexte, la création d’une norme de codage de texte indépendante du matériel et des logiciels, valable pour une utilisation avec de multiples langues, ce qu’est précisément Unicode, est essentielle.

Né à la fin de l’année 1987, Unicode cherchait à résoudre, précisément, l’échange de documents entre différents systèmes informatiques, afin que les utilisateurs n’aient pas à se soucier de la langue dans laquelle les documents sont écrits.

La clé d’Unicode est l’attribution d’un code unique pour chaque symbole, invariant sur toutes les plates-formes qui le supportent (matériel et logiciel).

Pour ce faire, Unicode utilise deux octets (16 bits), ce qui lui donne un espace d’adressage de 65 536 caractères. Ceux qui sont partagés par plusieurs alphabets ne sont pas répétés. Ainsi, par exemple, il n’existe qu’un seul caractère Ç, qui est partagé par des langues telles que le portugais, le catalan, le turc ou l’albanais.
De cette façon, il y a suffisamment d’espace pour accueillir tous les caractères nécessaires correspondant aux langues qui nécessitent une plus grande gamme, comme le chinois ou le japonais.

Unicode a été créé par Apple et Xerox, d’autres entreprises telles que Sun Microsystems et Microsoft ayant rejoint l’initiative par la suite.

En plus des caractères de base, les mêmes caractères sont inclus avec des accents, des accents circonflexes et d’autres modificateurs couramment utilisés, comme les voyelles accentuées en espagnol.
Outre les caractères appartenant à des systèmes d’écriture de langues vivantes, Unicode comprend également des caractères correspondant à des langues mortes, comme le grec ancien, le cunéiforme et le runique.

En outre, il existe des caractères qui ne correspondent pas à des lettres et des chiffres, tels que des notes de musique, des icônes, des flèches ou des cadres et des bordures.

Lors de l’ouverture d’un document contenant des caractères qui ne correspondent pas au système d’écriture de la langue dans laquelle le logiciel système est configuré, le logiciel système récupère le caractère correspondant dans la norme Unicode, affichant ainsi la représentation appropriée à tout moment, et non un symbole étrange résultant d’une mauvaise interprétation de l’encodage.
Actuellement, tous les systèmes d’exploitation prennent en charge Unicode.