ISO/CEI 8859-15 - ISO/IEC 8859-15
MIME / IANA | ISO-8859-15 |
---|---|
Pseudo(s) | latin-9, latin-0 |
Standard | ISO/CEI 8859 |
Classification | ISO 8859 ( ASCII étendu , ISO 4873 niveau 1) |
S'étend | US-ASCII |
Basé sur | ISO-8859-1 |
Précédé par | ISO-8859-1 |
ISO/CEI 8859-15:1999 , Technologies de l'information — Jeux de caractères graphiques codés sur un seul octet à 8 bits — Partie 15 : Alphabet latin n° 9 , fait partie de la série ISO/CEI 8859 de codages de caractères normalisés basés sur ASCII , première édition publiée en 1999. Il est officieusement appelé Latin-9 (et pendant un certain temps Latin-0 ). Elle est similaire à la norme ISO 8859-1 , et donc également destinée aux langues « d'Europe occidentale », mais remplace certains symboles moins courants par le signe euro et certaines lettres qui ont été jugées nécessaires :
A4 | A6 | A8 | B4 | B8 | avant JC | BD | ÊTRE | |
---|---|---|---|---|---|---|---|---|
8859-1 | ¤ | | | ¨ | ´ | ļ | ¼ | ½ | ¾ |
8859-15 | € | © | š | Ž | ž | Œ | œ | Ÿ |
ISO-8859-15 est le nom de jeu de caractères préféré de l' IANA pour cette norme lorsqu'il est complété par les codes de contrôle C0 et C1 de l' ISO/IEC 6429 .
Microsoft a attribué la page de codes 28605 alias Windows-28605 à ISO-8859-15. IBM a attribué la page de codes 923 ( CCSID 923) à ISO 8859-15.
Tous les caractères imprimables de l'ISO/IEC 8859-1 et de l'ISO/IEC 8859-15 se trouvent également dans Windows-1252 . Depuis octobre 2016, 0,1% de tous les sites Web utilisent ISO-8859-15.
Histoire
L'identifiant ISO 8859-15 a été proposé pour les langues Sami en 1996, qui a finalement été rejeté, mais a été adopté comme ISO-IR 197 .
Une proposition appelée ISO 8859-0 a été faite en 1997, pour remplacer 4 caractères ISO 8859-1 inutilisés ou rarement utilisés ( ¤ , ¨ , ´ et ¸ ) par € , Œ , œ , et Ÿ . L'euro est devenu nécessaire avec l' introduction de l' euro . Œ et œ sont des ligatures françaises, et Ÿ est nécessaire pour que le texte français puisse être converti de minuscules en majuscules et inversement sans perte. Ironiquement, les trois derniers étaient déjà présents dans le jeu de caractères multinational (MCS) du DEC en 1983, un jeu de caractères à partir duquel ECMA-94 (1985) et ISO-8859-1 (1987) ont été dérivés. Étant donné que leurs points de code d'origine étaient désormais occupés par d'autres caractères, des points de code moins logiques ont dû être choisis pour leur réintroduction.
La même proposition a également recommandé de remplacer 6 autres caractères ( ¢ , | , ± , ¼ , ½ , ¾ ) avec "d'autres caractères pour couvrir un maximum de langues". Pour le signe euro, certains voulaient remplacer le signe plus-moins au lieu du signe monétaire. Le signe de la devise est utilisé dans certaines applications comme séparateur de champs et dans d'autres pour indiquer le sous - total . Il y avait une forte opposition à cela. Une personne a dit « Le « +- » proposé n'est pas une solution de repli adéquate, car cette séquence, bien que rarement utilisée, a déjà un sens mathématique fixe, tout à fait différent du « ± » ; et, même si un lecteur en déduirait le sens voulu ce qui signifie, «±», du contexte, «+ -» au lieu de «±» va faire mal de sentiments esthétiques au moins autant que «oe» au lieu d'un oe ligatures francophone du physicien .. » au bout du compte ± et ¢ ne sont pas remplacés. Finalement , quatre personnages ont été sélectionnés: © , š , Ž et ž , qui sont utilisés en finnois et l' estonien pour la translittération du russe loanwords et noms. La proposition a été renommée ISO 8859-15.
Il y a eu des tentatives pour faire de l'ISO 8859-15 le jeu de caractères par défaut pour la communication 8 bits, mais il n'a jamais réussi à supplanter le populaire ISO 8859-1. Il a été utilisé comme jeu de caractères par défaut pour la console de texte et les programmes de terminal sous Linux lorsque le signe euro était nécessaire, mais l'utilisation d' Unicode complet n'était pas pratique, mais elle a depuis été remplacée par UTF-8 .
Couverture
L'ISO 8859-15 encode ce qu'elle appelle " l'alphabet latin n° 9". Ce jeu de caractères est utilisé dans les Amériques , en Europe occidentale , en Océanie et dans une grande partie de l' Afrique . Il est également couramment utilisé dans la plupart des romanisations standard des langues est-asiatiques.
Chaque caractère est codé sous la forme d'une seule valeur de code à huit bits. Ces valeurs de code peuvent être utilisées dans presque tous les systèmes d'échange de données pour communiquer dans les langues suivantes :
- Langues modernes avec une couverture complète de leur alphabet
|
|
|
|
|
- Remarques
Couverture des signes de ponctuation et des apostrophes
Pour certaines langues énumérées ci-dessus, les guillemets typographiques corrects sont manquants, car seuls «, », " et ' sont inclus.
De plus, cet encodage ne fournit pas le caractère correct pour l'apostrophe et oriente les guillemets simples hauts, bien que certains textes utilisent l'accent grave d'espacement et l'accent aigu d'espacement, qui font tous deux partie de l'ISO 8859-1, au lieu de la forme 6 guillemets ou apostrophes en forme de /9 (et cela fonctionne de manière fiable avec certains styles de police, où tous ces caractères sont affichés sous forme de glyphes de coin inclinés).
Mise en page de la page de codes
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
||||||||||||||||
1_ 16 |
||||||||||||||||
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
un 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
je 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
avec 0077 |
x 0078 |
et 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
|
8_ 128 |
||||||||||||||||
9_ 144 |
||||||||||||||||
A_ 160 |
NBSP 00A0 |
¡ 00A1 |
¢ 00A2 |
£ 00A3 |
€ 20AC |
¥ 00A5 |
© 0160 |
§ 00A7 |
š 0161 |
© 00A9 |
ª 00AA |
« 00AB |
¬ 00AC |
TIMIDE 00AD |
® 00AE |
¯ 00AF |
B_ 176 |
° 00B0 |
± 00B1 |
² 00B2 |
³ 00B3 |
Ž 017D |
μ 00B5 |
¶ 00B6 |
· 00B7 |
ž 017E |
¹ 00B9 |
º 00BA |
» 00BB |
Œ 0152 |
œ 0153 |
Ÿ 0178 |
¿ 00BF |
C_ 192 |
À 00C0 |
Á 00C1 |
 00C2 |
à 00C3 |
Ä 00C4 |
Å 00C5 |
Æ 00C6 |
Ç 00C7 |
È 00C8 |
É 00C9 |
Ê 00CA |
Ë 00CB |
Ì 00CC |
Í 00CD |
Î 00CE |
Ï 00CF |
D_ 208 |
Ð 00D0 |
Ñ 00D1 |
Ò 00D2 |
Ó 00D3 |
Ô 00D4 |
Õ 00D5 |
Ö 00D6 |
× 00D7 |
Ø 00D8 |
Ù 00D9 |
Ú 00DA |
Û 00dB |
Ü 00DC |
Ý 00DD |
Þ 00DE |
ß 00DF |
E_ 224 |
à 00E0 |
à 00E1 |
â 00E2 |
ã 00E3 |
à 00E4 |
å 00E5 |
æ 00E6 |
ç 00E7 |
è 00E8 |
é 00E9 |
ê 00EA |
ë 00EB |
ì 00EC |
í 00ED |
î 00EE |
ï 00EF |
F_ 240 |
ð 00F0 |
ñ 00F1 |
ò 00F2 |
ó 00F3 |
ô 00F4 |
õ 00F5 |
ö 00F6 |
÷ 00F7 |
ø 00F8 |
ù 00F9 |
ú 00FA |
û 00FB |
ü 00FC |
ý 00FD |
þ 00FE |
ÿ 00FF |
Lettre Nombre Ponctuation symbole Autre Indéfini Différences par rapport à ISO-8859-1
Alias
ISO 8859-15 a également les alias suivants, spécifiques au fournisseur :
- WE8ISO8859P15 ( base de données Oracle )
Voir également
Les références
Liens externes
- ISO/CEI 8859-15:1999
- ISO/CEI 8859-15:1998 - Jeux de caractères graphiques codés sur un seul octet, Partie 15 : alphabet latin n° 9 (projet du 1er août 1997 ; remplacé par ISO/CEI 8859-15:1999, publié le 15 mars , 1999)
- ISO Latin 9 par rapport à ISO Latin 1
- Ensemble latin complémentaire européen ISO-IR 203 (16 septembre 1998)