À la découverte d'Unicode — Wikilivres Aller au contenu

À la découverte d'Unicode

Un livre de Wikilivres.
À la découverte d'Unicode

Initialement écrit sous le nom « Introduction à Unicode »

Un livre-guide appartenant à la série Programmation tout comme à l'étagère Informatique de Wikilivres.

Il s'adresse aux personnes qui travaillent avec des logiciels qui manipulent du texte et autres chaînes de caractères comme aux utilisateurs de tels systèmes curieux d'en connaître les arcanes.

De par sa nature technique, cet ouvrage utilise un vocabulaire très spécifique. Le Glossaire vise à rendre ce vocabulaire compréhensible du néophyte.

Ce wikilivre porte les indices CDU suivants :


Une version imprimable du livre « À la découverte d'Unicode » est disponible. (voir/modifier)

Une version PDF de ce livre est disponible.

Le nom initial de ce livre était en conflit avec un autre livre préalablement publié. Il a donc paru souhaitable de rebaptiser ce livre. La suggestion retenue a été : À la découverte d'Unicode

Les autres idées étaient : Aperçu d'Unicode ; L'ISO 10646 en pratique ; Unicode mis à nu; Les entrailles des caractères ; Introduction à Unicode

L' objectif de ce livre est de fournir une compréhension pratique d'Unicode — standard informatique de représentation abstraite de texte — qui s'adresse tant aux utilisateurs d'informatique qu'aux développeurs de logiciel.

Ce livre est nécessaire car le sujet est trop technique pour être détaillé dans Wikipédia ou Wikisource, cependant ce standard est d'une importance sans précédent puisqu'il sert à coder le texte et donc à échanger des idées à travers le monde tout en étant incontournable dans les technologies de l'information.

Ce livre est d'autant plus nécessaire que les textes traitant du sujet se trouvent trop fréquemment être en langue anglaise.

Unicode est un standard industriel basé sur une norme publique (ISO-10646). Ce standard et cette norme permettent une représentation abstraite et universelle du texte. Ils unifient la jungle des moyens préalablement utilisés pour représenter le texte dans différentes langues, dans différents pays, dans différentes technologies et par des vendeurs différents. Au siècle dernier, les premiers standards étaient limités à 32 caractères (Baudot) et à 256 caractères (EBCDIC puis ASCII). Ces standards se sont avérés être insuffisants pour le monde relié en réseau qui s'est démocratisé au travers d'Internet.

Unicode les dépasse.

De ce fait, Unicode est devenu le standard de référence sur internet (utf-8), dans les logiciels Linux, Android et Macintosh (utf-8), et aussi dans les logiciels Windows (utf-16).

À titre d'illustration, vous trouverez ci-après, un petit sous-ensemble des caractères qu'Unicode permet de gérer :

¢ € £ ¥ © ® ™ ← ↑ ↓ → ↖ ↗ ↙ ↘ ↔ ⇐ ⇑ ⇓ ⇒ ⇔ ◀ ▲ ▼ ▶ ◁ △ ▽ ▷ ↤ ↥ ↦ ↧ ↞ ↟ ↠ ↡ ⇤ ⇥ ⇞ ⇟ ↺ ↻ ↶ ↷ ‘ ’ “ ” ‹ › « » 【 】 〖 〗 「 」 『 』 〈 〉 《 》 § ¶ † ‡ ⁎ ※ • ‣ ‐ ‑ ‒ – — ― … ❦ ✓ ● ■ ◆ ᴂ ᴈ ɝ ʊ ᴧ ◇ α β γ δ ε θ κ λ μ π σ φ ψ µ ° ℓ ∡ ∀ ¬ ∧ ∨ ∃ ∵ ∴ ∅ ∈ ∉ ⊂ ⊃ ⊆ ⊇ ⊄ ⋂ ⋃ ≠ ≤ ≥ ≈ ≡ ℕ ℤ ℚ ℝ ℂ ⌈ ⌉ ⌊ ⌋ ∏ ∑ ∫ × ⊗ ⊕ ⊙ × ∂ √ ≔ ± ² ℵ ∞ ∎ ′ ★ ☆ ♠ ♣ ♥ ♦ ➀ ➁ ➂ ➃ ➄ ➅ ➆ ➇ ➈ ➉ ☯ 卐 卍 ✝ ✚ ✡ ⎈ ☭ ☪ ♀ ♂ ☥ ☮ ☺ ☹ ♨ ☠ ☢ ☣ ☤ ♲ ☉ ☼ ☾ ☿ ♁ ♄ ♅ ♆ ♇ ☄ ♩ ♪ ♫ ♬ ♭ ♮ ♯ ⌘ ⌫ ⌦ ⏏ ⌤ ⌥ ⏎ ⎇ 、 。 &林花謝了 春紅 太匆匆 無奈朝來寒雨 晚來風 胭脂淚 留人醉 幾時重 自是人生長恨 水長東


¢ € £ ¥ © ® ™ ← ↑ ↓ →
↖ ↗ ↙ ↘ ↔ ⇐ ⇑ ⇓ ⇒ ⇔ ◀ ▲ ▼ ▶ ◁ △ ▽ ▷ ↤ ↥ ↦ ↧ ↞ ↟ ↠ ↡ ⇤ ⇥ ⇞ ⇟ ↺ ↻ ↶ ↷
‘ ’ “ ” ‹ › « » 【 】 〖 〗 「 」 『 』 〈 〉 《 》
§ ¶ † ‡ ⁎ ※
• ‣ ‐ ‑ ‒ – — ―
… ❦ ✓ ● ■ ◆
ᴂ ᴈ ɝ ʊ ᴧ ◇
α β γ δ ε θ κ λ μ π σ φ ψ µ ° ℓ ∡
∀ ¬ ∧ ∨ ∃ ∵ ∴ ∅ ∈ ∉ ⊂ ⊃ ⊆ ⊇ ⊄ ⋂ ⋃ ≠ ≤ ≥ ≈ ≡ ℕ ℤ ℚ ℝ ℂ
⌈ ⌉ ⌊ ⌋ ∏ ∑ ∫ × ⊗ ⊕ ⊙ × ∂ √ ≔ ± ² ℵ ∞ ∎ ′
★ ☆ ♠ ♣ ♥ ♦ ➀ ➁ ➂ ➃ ➄ ➅ ➆ ➇ ➈ ➉
☯ 卐 卍 ✝ ✚ ✡ ⎈ ☭ ☪ ♀ ♂ ☥ ☮ ☺ ☹ ♨ ☠ ☢ ☣ ☤ ♲
☉ ☼ ☾ ☿ ♁ ♄ ♅ ♆ ♇ ☄ ♩ ♪ ♫ ♬ ♭ ♮ ♯
⌘ ⌫ ⌦ ⏏ ⌤ ⌥ ⏎ ⎇ 、 。 &
林花謝了 春紅 太匆匆 無奈朝來寒雨 晚來風 胭脂淚 留人醉 幾時重 自是人生長恨 水長東

Révisions récentes

[modifier | modifier le wikicode]

En raison de la nature interactive du site wikibooks, le livre peut être sujet à mise à jour. Les plus récentes de ces modifications peuvent être suivies par la page suivante qui donne les modifications récentes ayant eu lieu sur les deux derniers mois environ.

Révisions récentes