ISO/CEI 8859 - ISO/IEC 8859

Famille de codage ISO 8859
Standard ISO/CEI 8859
Classification ASCII étendu 8 bits , ISO 4873 niveau 1
S'étend US-ASCII
Précédé par ISO 646
succédé par ISO/CEI 10646 ( Unicode )
Autre(s) encodage(s) associé(s) ISO/CEI 10367 , Windows-125x

ISO/IEC 8859 est une série conjointe de normes ISO et IEC pour les codages de caractères 8 bits . La série de normes se compose de parties numérotées, telles que ISO/IEC 8859-1 , ISO/IEC 8859-2 , etc. Il y a 15 parties, à l'exclusion de l' ISO/IEC 8859-12 abandonnée . Le groupe de travail ISO maintenant cette série de normes a été dissous.

ISO/IEC 8859 parties 1, 2, 3 et 4 étaient à l'origine la norme Ecma International ECMA-94 .

introduction

Alors que les modèles de bits des 95 caractères ASCII imprimables sont suffisants pour échanger des informations en anglais moderne , la plupart des autres langues qui utilisent des alphabets latins ont besoin de symboles supplémentaires non couverts par l'ASCII. ISO/IEC 8859 a cherché à remédier à ce problème en utilisant le huitième bit dans un octet de 8 bits pour permettre des positions pour 96 autres caractères imprimables. Les premiers encodages étaient limités à 7 bits en raison des restrictions de certains protocoles de transmission de données, et en partie pour des raisons historiques. Cependant, plus de caractères étaient nécessaires que ne pouvait en contenir un seul codage de caractères à 8 bits, de sorte que plusieurs mappages ont été développés, dont au moins dix adaptés à divers alphabets latins.

Les parties de la norme ISO/IEC 8859 ne définissent que des caractères imprimables, bien qu'elles distinguent explicitement les plages d'octets 0x00–1F et 0x7F–9F en tant que « combinaisons qui ne représentent pas des caractères graphiques » (c'est-à-dire qui sont réservées pour être utilisées comme caractères de contrôle ) conformément avec ISO/CEI 4873 ; ils ont été conçus pour être utilisés en conjonction avec une norme distincte définissant les fonctions de contrôle associées à ces octets, comme l' ISO 6429 ou l' ISO 6630 . À cette fin, une série de codages enregistrés auprès de l' IANA ajoutent l' ensemble de contrôle C0 (caractères de contrôle mappés sur les octets 0 à 31) de l' ISO 646 et l' ensemble de contrôle C1 (caractères de contrôle mappés sur les octets 128 à 159) de l'ISO 6429, résultant en des cartes de caractères complètes de 8 bits avec la plupart, sinon la totalité, des octets attribués. Ces ensembles ont ISO-8859- n comme nom MIME préféré ou, dans les cas où un nom MIME préféré n'est pas spécifié, leur nom canonique. De nombreuses personnes utilisent les termes ISO/IEC 8859- n et ISO-8859- n de manière interchangeable. ISO/IEC 8859-11 n'a pas obtenu un tel jeu de caractères, probablement parce qu'il était presque identique à TIS 620 .

Personnages

La norme ISO/IEC 8859 est conçue pour un échange d'informations fiable, pas de typographie ; la norme omet les symboles nécessaires à une typographie de haute qualité, tels que les ligatures facultatives, les guillemets bouclés, les tirets, etc. En conséquence, les systèmes de composition de haute qualité utilisent souvent des extensions propriétaires ou idiosyncratiques en plus des normes ASCII et ISO/IEC 8859 , ou utilisez Unicode à la place.

Une règle inexacte basée sur l'expérience pratique stipule que si un caractère ou un symbole ne faisait pas déjà partie d'un jeu de caractères informatique largement utilisé et n'était pas non plus généralement fourni sur les claviers de machines à écrire pour une langue nationale, il n'y était pas entré. Les guillemets doubles « et » utilisés pour certaines langues européennes ont été inclus, mais pas les guillemets doubles directionnels « et » utilisés pour l'anglais et certaines autres langues.

Le français n'a pas obtenu ses ligatures œ et Œ parce qu'elles pouvaient être tapées comme « oe ». De même, Ÿ , nécessaire pour le texte en majuscules, a également été supprimé. Bien que sous des points de code différents, ces trois caractères ont ensuite été réintroduits avec ISO/IEC 8859-15 en 1999, qui a également introduit le nouveau caractère de signe euro €. De même, le néerlandais n'a pas obtenu les lettres ij et IJ , car les néerlandophones s'étaient habitués à les taper en deux lettres à la place.

Roumaine n'a pas obtenu d' abord son Þ / ş et Ţ / ţ ( avec virgule ) lettres, parce que ces lettres ont été initialement unifiée avec Þ / ş et Ţ / ţ ( cédille ) par le Consortium Unicode , compte tenu des formes avec des virgules dessous pour être variantes de glyphes des formes avec cédille. Cependant, les lettres avec une virgule explicite ci-dessous ont été ajoutées plus tard à la norme Unicode et sont également dans ISO/IEC 8859-16 .

La plupart des codages ISO/IEC 8859 fournissent les signes diacritiques requis pour diverses langues européennes utilisant l'écriture latine. D'autres proposent des alphabets non latins : grec , cyrillique , hébreu , arabe et thaï . La plupart des encodages ne contiennent que des caractères d'espacement , bien que ceux en thaï, en hébreu et en arabe contiennent également des caractères de combinaison .

La norme ne prévoit aucune disposition pour les écritures des langues d'Asie de l'Est ( CJK ), car leurs systèmes d'écriture idéographique nécessitent plusieurs milliers de points de code. Bien qu'il utilise des caractères latins, le vietnamien ne tient pas non plus dans 96 positions (sans utiliser de combinaisons diacritiques comme dans Windows-1258 ). Chaque alphabet syllabique japonais (hiragana ou katakana, voir Kana ) conviendrait, comme dans JIS X 0201 , mais comme plusieurs autres alphabets du monde, ils ne sont pas codés dans le système ISO/IEC 8859.

Les parties de l'ISO/CEI 8859

L'ISO/CEI 8859 est divisée en les parties suivantes :

Partie Nom Révisions Autres normes La description
Partie 1 Latin-1
Europe occidentale
1987 , 1998 ECMA-94 ( 1985 , 1986) Peut-être la partie la plus largement utilisée de la norme ISO/IEC 8859, couvrant la plupart des langues d'Europe occidentale : danois (partiel), néerlandais (partiel), anglais , féroïen , finnois (partiel), français (partiel), allemand , islandais , irlandais , italien , norvégien , portugais , rhéto-roman , gaélique écossais , espagnol , catalan et suédois . Des langues d'autres parties du monde sont également couvertes, notamment : l' albanais d' Europe de l'Est , l' indonésien d' Asie du Sud-Est , ainsi que les langues africaines, l' afrikaans et le swahili .

Une modification de DEC MCS ; la première version standard (1985) au niveau de l'ECMA manquait du signe temporel et de la division obelus , qui ont été ajoutés l'année suivante. Le manque signe euro et le capital Ÿ sont dans la version révisée ISO / CEI 8859-15 (voir ci - dessous). Le jeu de caractères IANA correspondant est ISO-8859-1.

Partie 2 Latin-2
Europe centrale
1987 , 1999 ECMA-94 (1986) Prend en charge les langues d'Europe centrale et orientale qui utilisent l'alphabet latin, notamment le bosniaque , le polonais , le croate , le tchèque , le slovaque , le slovène , le serbe et le hongrois . Le signe euro manquant se trouve dans la version ISO/IEC 8859-16.
Partie 3 Latin-3
Europe du Sud
1988 , 1999 Turc , Maltais et Espéranto . Largement remplacé par ISO/IEC 8859-9 pour le turc.
Partie 4 Latin-4
Europe du Nord
1988 , 1998 estonien , letton , lituanien , groenlandais et sami .
Partie 5 Latin/Cyrillique 1988 , 1999 ECMA-113 (1988, 1999) Couvre principalement les langues slaves qui utilisent un alphabet cyrillique , notamment le biélorusse , le bulgare , le macédonien , le russe , le serbe et l' ukrainien (partiel).
Partie 6 Latin/Arabe 1987 , 1999 ASMO 708 (1986) / ECMA-114 (1986, 2000) Couvre les caractères les plus courants de la langue arabe . Ne prend pas en charge d'autres langues utilisant l' écriture arabe . Doit être BiDi et jointure cursive traitée pour l'affichage.
Partie 7 latin/grec 1987 , 2003 ELOT 928 (1986) / ECMA-118 (1986) Couvre la langue grecque moderne ( orthographe monotone ). Peut également être utilisé pour le grec ancien écrit sans accents ou en orthographe monotone, mais il manque les signes diacritiques pour l' orthographe polytonique . Ceux-ci ont été introduits avec Unicode. Mise à jour 2003 pour ajouter le signe euro , drachme signe et l' espacement IOTA SOUSCRIT .
Partie 8 Latin/Hébreu 1988 , 1999 ECMA-121 (1987, 2000) / SI 1311 ( 2002 ) Couvre l' alphabet hébreu moderne tel qu'il est utilisé en Israël. En pratique, deux encodages différents existent, l'ordre logique (doit être traité par BiDi pour l'affichage) et l'ordre visuel (de gauche à droite) (en effet, après traitement bidi et saut de ligne). Mise à jour 1999 pour ajouter LRM et RLM . Mise à jour au niveau de la norme nationale en 2002 pour ajouter des signes d'euro et de shekel et plus d'effecteurs de format bidirectionnel ; les ajouts de 2002 n'ont jamais été intégrés dans la version standard ISO.
Partie 9 Latin-5
Turc
1989 , 1999 ECMA-128 (1988, 1999) Largement identique à ISO/IEC 8859-1, remplaçant les lettres islandaises rarement utilisées par des lettres turques .
Partie 10 Latin-6
Nordique
1992 , 1998 ECMA-144 (1990, 1992, 2000) Un réarrangement de Latin-4. Considéré plus utile pour les langues nordiques. Les langues baltes utilisent davantage le latin-4.
Partie 11 Latin/Thaï 2001 TIS-620 (1986, 1990) Contient les caractères nécessaires à la langue thaï . Première révision établie en 1986 au niveau de la norme nationale en tant que TIS 620 . Élevé au statut de norme ISO dans le cadre de la norme ISO 8859 en 2001, avec l'ajout d'un espace insécable .
Partie 12 Latin/Devanagari N / A - Le travail de fabrication d'une partie de 8859 pour Devanagari a été officiellement abandonné en 1997. ISCII et Unicode/ISO/IEC 10646 couvrent Devanagari.
Partie 13 Bordure Baltique Latin-7
1998 - Ajout de quelques caractères pour les langues baltes qui manquaient dans Latin-4 et Latin-6. Lié au Windows-1257 publié précédemment .
Partie 14 Latin-8
Celtique
1998 - Couvre les langues celtiques telles que le gaélique et la langue bretonne . Les lettres galloises correspondent à la précédente (1994) ISO-IR-182 .
Partie 15 Latin-9 1999 - Une révision de 8859-1 qui supprime certains symboles peu utilisés, en les remplaçant par le signe euro et les lettres © , š , Ž , ž , Œ , œ et Ÿ , qui complète la couverture française , finlandaise et estonienne .
Partie 16 Latin-10
Europe du Sud-Est
2001 RS 14111 (1998) Destiné à l' albanais , croate , hongrois , italien , polonais , roumain et slovène , mais aussi finnois, français, allemand et gaélique irlandais (nouvelle orthographe). L'accent est mis davantage sur les lettres que sur les symboles. Le signe de la devise est remplacé par le signe de l' euro .

Chaque partie de l'ISO/CEI 8859 est conçue pour prendre en charge des langues qui s'empruntent souvent les unes aux autres, de sorte que les caractères nécessaires à chaque langue sont généralement pris en charge par une seule partie. Cependant, certains caractères et combinaisons de langues ne sont pas acceptés sans transcriptions. Des efforts ont été faits pour rendre les conversions aussi fluides que possible. Par exemple, l'allemand a tous ses sept caractères spéciaux aux mêmes positions dans toutes les variantes latines (1–4, 9, 10, 13–16), et dans de nombreuses positions, les caractères ne diffèrent que par les signes diacritiques entre les ensembles. En particulier, les variantes 1 à 4 ont été conçues conjointement et ont la propriété que chaque caractère codé apparaît soit à une position donnée, soit pas du tout.

Table

Comparaison des différentes parties (1–16) de l'ISO/CEI 8859
Binaire oct déc Hex 1 2 3 4 5 6 7 8 9 dix 11 13 14 15 16
1010 0000 240 160 A0 Espace insécable (NBSP)
1010 0001 241 161 A1 ?? UNE ?? UNE ??   '   ?? UNE ?? " ?? ?? UNE
1010 0010 242 162 A2 ?? ?? ?? ??   ' ?? ?? ?? ?? ?? ?? ?? une
1010 0011 243 163 A3 £ ?? £ ?? ??   £ G ?? £ ??
1010 0100 244 164 A4 ?? ?? ?? ?? JE ?? ?? ??
1010 0101 245 165 A5 ?? ??   JE ??   ?? ?? JE ?? ?? ??
1010 0110 246 166 A6 ?? ?? ?? ?? ??   ?? ?? ?? ?? ??
1010 0111 247 167 A7 § ??   § ?? §
1010 1000 250 168 A8 ?? ??   ?? ?? ?? Ø ?? ??
1010 1001 251 169 A9 © ?? JE ?? ??   © ?? ?? ©
1010 1010 252 170 AA ?? ?? ?? ??   ?? × ?? ?? ?? ?? ?? ?? ??
1010 1011 253 171 UN B « ?? G G ??   « ?? ?? « «
1010 1100 254 172 CA ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ??
1010 1101 255 173 UN D Trait d'union souple (SHY) ?? TIMIDE
1010 1110 256 174 AE ® ??   ?? ??     ® ?? ?? ® ??
1010 1111 257 175 UN F ?? ?? ?? ??   ?? ?? ?? ?? ?? ?? ?? ??
1011 0000 260 176 B0 ° ??   ° ?? ° F °
1011 0001 261 177 B1 ± une ?? une ??   ± une ?? ± F ±
1011 0010 262 178 B2 ² ?? ² ?? ??   ² ?? ?? ² G ² ??
1011 0011 263 179 B3 ?? ?? ?? ?? ??   ?? g ?? ?? g ?? ??
1011 0100 264 180 B4 ´ ??   ?? ´ je ?? " ?? ??
1011 0101 265 181 B5 µ ?? µ je ??   ?? µ je ?? µ ?? µ "
1011 0110 266 182 B6 ?? ?? ?? ?? ??   ?? ?? ?? ?? ??
1011 0111 267 183 B7 · ?? · ?? ??   · ?? · ?? ·
1011 1000 270 184 B8 ?? ??   ?? ?? ?? ?? ?? ?? ??
1011 1001 271 185 B9 ?? ?? je ?? ??   ?? ?? ?? ?? ?? ?? ?? è
1011 1010 272 186 BA º ?? ?? ??   ?? ?? º ?? ?? ?? ?? º ??
1011 1011 273 187 BB » ?? g g ?? ?? » ?? ?? » ?? »
1011 1100 274 188 avant JC ?? ?? ?? ?? ??   ?? ?? ?? ?? ?? ?? ??
1011 1101 275 189 BD ½ ?? ½ ?? ??   ½ ?? ?? ½ ?? œ
1011 1110 276 190 ÊTRE ?? ??   ?? ??   ?? ?? ?? ?? ?? ?? ??
1011 1111 277 191 BF ?? ?? ?? ?? ?? ??   ?? ?? ?? ?? ?? ?? ??
1100 0000 300 192 C0 UNE ?? UNE UNE ??   ??   UNE UNE ?? UNE UNE
1100 0001 301 193 C1 UNE ?? ?? ??   UNE ?? JE UNE
1100 0010 302 194 C2 UNE ?? ?? ??   UNE ?? UNE UNE
1100 0011 303 195 C3 UNE UNE   UNE ?? ?? ??   UNE ?? ?? UNE UNE
1100 0100 304 196 C4 UNE ?? ?? ??   UNE ?? UNE
1100 0101 305 197 C5 UNE ?? ?? UNE ?? ?? ??   UNE ?? UNE ??
1100 0110 306 198 C6 ?? ?? ?? ?? ?? ?? ??   ?? ?? ?? ??
1100 0111 307 199 C7 Ç JE ?? ا ??   Ç JE ?? ?? Ç
1100 1000 310 200 C8 È ?? È ?? ?? ?? ??   È ?? ?? ?? È
1100 1001 311 201 C9 É ?? ?? ??   É ?? É
1100 1010 312 202 Californie Ê ?? Ê ?? ?? ?? ??   Ê ?? ?? ?? Ê
1100 1011 313 203 CB ?? ?? ?? ??   ?? ?? ?? ??
1100 1100 314 204 CC JE ?? JE ?? ?? ?? ??   JE ?? ?? G JE
1100 1101 315 205 CD JE ?? ?? ??   JE ?? ?? JE
1100 1110 316 206 CE JE ?? ?? ??   JE ?? JE JE
1100 1111 317 207 FC JE JE JE ?? ?? ??   JE ?? ?? JE
Binaire oct déc Hex 1 2 3 4 5 6 7 8 9 dix 11 13 14 15 16
1101 0000 320 208 J0 ??   ?? un ?? ??   G ?? ?? ??
1101 0001 321 209 D1 ?? ?? ?? ?? ?? ?? ??   ?? ?? ?? ?? ?? ??
1101 0010 322 210 D2 ?? ?? ?? ?? ?? ??     ?? ?? ?? ?? ??
1101 0011 323 211 D3 ?? ?? ?? ?? ??   ?? ?? ??
1101 0100 324 212 D4 ?? ?? ?? ??   ?? ?? ?? ??
1101 0101 325 213 D5 ?? ?? G ?? e ?? ??   ?? ?? ??
1101 0110 326 214 D6 ?? ?? ?? ??   ?? ?? ??
1101 0111 327 215 D7 × ?? ?? ??   × ?? ?? × ?? × ??
1101 1000 330 216 D8 Ø ?? G Ø et ?? ??   Ø ?? ?? Ø ??
1101 1001 331 217 D9 ?? ?? ?? ?? ?? ?? ??   ?? ?? ?? ?? ??
1101 1010 332 218 AD ?? ?? ?? ??   ?? ?? ?? ??
1101 1011 333 219 BD ?? ?? ?? ??   ??   ??   ?? ??
1101 1100 334 220 CC ?? ??   ??   ??   ??
1101 1101 335 221 JJ ?? ?? ?? н   ??   JE ??   ?? ?? ??
1101 1110 336 222 DE E ?? ?? ?? о   ??   ?? E   ?? ?? E ??
1101 1111 337 223 DF ?? ??   ?? ?? ?? ?? ??
1110 0000 340 224 E0 une ?? une une р ?? ?? ?? une une ?? une une
1110 0001 341 225 E1 une с ?? ?? ?? une ?? je une
1110 0010 342 226 E2 une т ?? ?? ?? une ?? une une
1110 0011 343 227 E3 une une   une ?? ?? ?? ?? une ?? ?? une une
1110 0100 344 228 E4 une ?? ل ?? ?? une ?? une
1110 0101 345 229 E5 une ?? ?? une ?? ?? ?? ?? une ?? une ??
1110 0110 346 230 E6 ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ??
1110 0111 347 231 E7 ç je ?? ?? ?? ?? ç je ?? ?? ç
1110 1000 350 232 E8 è è è è ?? ?? ?? ?? è è ?? è è
1110 1001 351 233 E9 é ?? ?? ?? ?? é ?? é
1110 1010 352 234 EA ê ?? ê ?? ?? ?? ?? ?? ê ?? ?? ?? ê
1110 1011 353 235 CE ë ?? ?? ?? ?? ë ?? ?? ë
1110 1100 354 236 CE je ?? je ?? ?? ?? ?? ?? je ?? ?? g je
1110 1101 355 237 DE je ?? ?? ?? ?? je ?? ?? je
1110 1110 356 238 EE je ?? ?? ?? ?? je ?? je je
1110 1111 357 239 EF je je je ?? ?? ?? ?? je ?? ?? je
1111 0000 360 240 F0 ??   ?? ?? ?? ?? ?? g ?? ?? ?? ??
1111 0001 361 241 F1 ñ ?? ñ ?? ?? ?? ?? ?? ñ ?? ?? ?? ñ ??
1111 0010 362 242 F2 ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ??
1111 0011 363 243 F3 ó ?? ??   ?? ?? ó ?? ó
1111 0100 364 244 F4 ô ??   ?? ?? ô ?? ?? ô
1111 0101 365 245 F5 ?? ?? g ?? ??   ?? ?? ?? ?? ??
1111 0110 366 246 F6 ö ??   ?? ?? ö ?? ö
1111 0111 367 247 F7 ?? ??   ?? ?? ?? ?? ?? ?? ?? ?? ??
1111 1000 370 248 F8 ?? ?? g ?? ??   ?? ?? ?? ?? ?? ?? ??
1111 1001 371 249 F9 ù ?? ù ?? ??   ?? ?? ù ?? ?? ?? ù
1111 1010 372 250 FA ú ??   ?? ?? ú ?? ?? ú
1111 1011 373 251 FB û ?? û ??   ??   û ?? ?? û
1111 1100 374 252 FC ü ??   ??   ü   ü
1111 1101 375 253 FD ?? ?? ?? §   ?? LRM je ??   ?? ?? ??
1111 1110 376 254 EF e ?? ?? ?? ??   ?? RLM ?? e   ?? ?? e ??
1111 1111 377 255 FF ?? ?? ??       ?? ??   ' ??
Binaire oct déc Hex 1 2 3 4 5 6 7 8 9 dix 11 13 14 15 16

À la position 0xA0, il y a toujours l'espace insécable et 0xAD est principalement le trait d'union souple , qui ne s'affiche qu'aux sauts de ligne . Les autres champs vides sont soit  non affectés ou que le système utilisé n'est pas en mesure de les afficher.

Il y a   nouveaux ajouts en tant que versions ISO/IEC 8859-7:2003 et ISO/IEC 8859-8:1999 . LRM signifie marque de gauche à droite (U+200E) et RLM signifie marque de droite à gauche (U+200F).

Relation avec Unicode et l'UCS

Depuis 1991, le Consortium Unicode travaille avec l'ISO et la CEI pour développer la norme Unicode et ISO/IEC 10646 : le jeu de caractères universel (UCS) en tandem. Les éditions les plus récentes de la norme ISO/IEC 8859 expriment les caractères en termes de leurs noms Unicode/UCS et de la notation U+nnnn , ce qui fait que chaque partie de la norme ISO/IEC 8859 est un schéma de codage de caractères Unicode/UCS qui mappe un très petit sous-ensemble du UCS en octets simples de 8 bits. Les 256 premiers caractères d'Unicode et de l'UCS sont identiques à ceux d'ISO/IEC-8859-1 ( Latin-1 ).

Les jeux de caractères à un octet comprenant les parties de l'ISO/CEI 8859 et leurs dérivés ont été privilégiés tout au long des années 1990, ayant l'avantage d'être bien établis et plus facilement implémentés dans le logiciel : l'équation d'un octet à un caractère est simple et adéquate pour la plupart des applications monolingues, et il n'y a pas de combinaison de caractères ni de variantes de formes. Au fur et à mesure que les systèmes d'exploitation compatibles Unicode se sont répandus, ISO/IEC 8859 et d'autres codages hérités sont devenus moins populaires. Alors que les vestiges de la norme ISO 8859 et des modèles de caractères à un octet restent ancrés dans de nombreux systèmes d'exploitation, langages de programmation, systèmes de stockage de données, applications réseau, matériel d'affichage et logiciels d'application pour l'utilisateur final, la plupart des applications informatiques modernes utilisent Unicode en interne et reposent sur la conversion. tables à mapper vers et depuis d'autres encodages, si nécessaire.

Statut actuel

La norme ISO/IEC 8859 a été maintenue par le comité technique mixte ISO/IEC 1, sous-comité 2, groupe de travail 3 (ISO/IEC JTC 1/SC 2/WG 3). En juin 2004, le GT 3 a été dissous et les tâches d'entretien ont été transférées au SC 2 . La norme n'est pas actuellement mise à jour, car le seul groupe de travail restant du sous-comité , le GT 2, se concentre sur le développement du jeu de caractères codés universel d'Unicode .

La norme de codage WHATWG , qui spécifie les codages de caractères autorisés dans HTML5 que les navigateurs compatibles doivent prendre en charge, comprend la plupart des parties de la norme ISO/IEC 8859, à l'exception des parties 1, 9 et 11, qui sont plutôt interprétées comme Windows-1252 , Windows-1254 et Windows-874 respectivement. Les auteurs de nouvelles pages et les concepteurs de nouveaux protocoles sont invités à utiliser UTF-8 à la place.

Voir également

Remarques

Les références

  • Les versions publiées de chaque partie de l'ISO/IEC 8859 sont disponibles, moyennant des frais, sur le site du catalogue ISO et sur la boutique en ligne IEC .
  • Les versions PDF des versions finales de certaines parties de l'ISO/IEC 8859 telles que soumises à l'ISO/IEC JTC 1/SC 2/WG 3 pour examen et publication sont disponibles sur le site Web du WG 3 : Jeux de caractères graphiques codés sur un seul octet, Partie 4 : alphabet latin n° 4 (projet du 12 février 1998, publié le 1er juillet 1998)
  • ISO/CEI 8859-7:1999 - Jeux de caractères graphiques codés sur un seul octet, Partie 7 : alphabet latin/grec (projet du 10 juin 1999 ; remplacé par ISO/CEI 8859-7:2003, publié le 10 octobre 2003)
  • ISO/CEI 8859-10:1998 - Jeux de caractères graphiques codés sur un seul octet, Partie 10 : alphabet latin n° 6 (projet du 12 février 1998, publié le 15 juillet 1998)
  • ISO/CEI 8859-11:1999 - Jeux de caractères graphiques codés sur un octet à 8 bits, Partie 11 : Jeu de caractères latins/thaï (projet du 22 juin 1999 ; remplacé par ISO/CEI 8859-11:2001, publié le 15 décembre 2001)
  • ISO/CEI 8859-13:1998 - Jeux de caractères graphiques codés sur un seul octet, Partie 13 : alphabet latin n° 7 (projet du 15 avril 1998, publié le 15 octobre 1998)
  • ISO/CEI 8859-15:1998 - Jeux de caractères graphiques codés sur un seul octet, Partie 15 : alphabet latin n° 9 (projet du 1er août 1997 ; remplacé par ISO/CEI 8859-15:1999, publié le 15 mars , 1999)
  • ISO/CEI 8859-16:2000 - Jeux de caractères graphiques codés sur un seul octet, Partie 16 : alphabet latin n° 10 (projet du 15 novembre 1999 ; remplacé par ISO/CEI 8859-16:2001, publié le 15 juillet) , 2001)
  • Les normes ECMA , dont l'intention correspond exactement aux normes de jeu de caractères ISO/IEC 8859, peuvent être consultées à l'adresse :
    • Norme ECMA-94 : Jeux de caractères graphiques codés sur un seul octet 8 bits - Alphabets latins n° 1 à n° 4 2e édition (juin 1986)
    • Norme ECMA-113 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin/cyrillique 3e édition (décembre 1999)
    • Norme ECMA-114 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin/arabe 2e édition (décembre 2000)
    • Norme ECMA-118 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin/grec (décembre 1986)
    • Norme ECMA-121 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin/hébreu 2e édition (décembre 2000)
    • Norme ECMA-128 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin n° 5 2e édition (décembre 1999)
    • Norme ECMA-144 : Jeux de caractères codés à un octet 8 bits - Alphabet latin n° 6 3e édition (décembre 2000)
  • Les tables de mappage ISO/IEC 8859-1 vers Unicode sous forme de fichiers en texte brut se trouvent sur le site FTP Unicode.
  • Des descriptions informelles et des tableaux de codes pour la plupart des normes ISO/IEC 8859 sont disponibles dans ISO/IEC 8859 Alphabet Soup (Miroir)