ISO / CEI 8859-6 - ISO/IEC 8859-6

ISO-8859-6 (ASMO 708)
MIME / IANA ISO-8859-6
Alias ​​(s) iso-ir-127, ECMA-114, ASMO-708, arabe, csISOLatinArabic
Standard ASMO 708, ECMA-114, ISO / CEI 8859-6
Classification ASCII étendu , ISO 8859
Extensions OEM-708 , Mac OS arabe (presque)
Précédé par ASMO 449
Autre (s) codage (s) associé (s) Windows-1256 (incompatible, déplace plusieurs lettres)

ISO / CEI 8859-6: 1999 , Technologies de l'information - Jeux de caractères graphiques codés sur un octet à 8 bits - Partie 6: Alphabet latin / arabe , fait partie de la série ISO / CEI 8859 de codages de caractères standard basés sur ASCII , première édition publié en 1987. Il est officieusement appelé latin/arabe . Il a été conçu pour couvrir l' arabe . Seules les lettres nominales sont codées, pas de formes préformées des lettres, un traitement de mise en forme est donc nécessaire pour l'affichage. Il n'inclut pas les lettres supplémentaires nécessaires pour écrire la plupart des langues de script arabe autres que l'arabe lui-même (comme le persan, l'ourdou, etc.).

ISO-8859-6 est le nom de jeu de caractères préféré de l' IANA pour cette norme lorsqu'elle est complétée par les codes de contrôle C0 et C1 de l' ISO / CEI 6429 . Le texte est dans l'ordre logique, le traitement BiDi est donc nécessaire pour l'affichage. Nominalement ISO-8859-6 ( page de code 28596 ) est pour "l'ordre visuel", et ISO-8859-6-I ( page de code 38596 ) est pour l'ordre logique. Mais dans la pratique, et obligatoire pour les documents HTML et XML, ISO-8859-6 est également synonyme de texte d'ordre logique. Il existe également l' ISO-8859-6-E qui exige supposément que la directionnalité soit explicitement spécifiée avec des caractères de contrôle spéciaux; cette dernière variante est en pratique inutilisée. IBM a attribué la page de codes / CCSID 1089 à ISO 8859-6. Il s'agit d'une émulation pour leur système d'exploitation AIX .

ISO-8859-6 est désormais obsolète sur le plan technologique , et Unicode est préféré dans les applications modernes, en particulier sur Internet; c'est-à-dire l' encodage UTF-8 dominant pour les pages Web (voir aussi le script arabe en Unicode , pour une couverture complète, contrairement à par exemple ISO-8859-6 ou Windows 1256 qui ne couvrent pas les extras). 0,1% de toutes les pages Web utilisent ISO-8859-6.

Histoire

L'ASMO 708 a été conçu par la défunte Organisation arabe de normalisation et de métrologie en 1986 pour être la norme 8 bits à utiliser dans les pays arabophones. La conception de ce jeu de caractères a été inspirée par la norme 7 bits précédente - ASMO 449 - mais ce n'est pas simplement le jeu de caractères 7 bits déplacé vers la partie supérieure ; il y a quelques différences.

ASMO 708 est un jeu de caractères bidirectionnel . La partie inférieure du jeu de caractères diffère de la norme ISO 646 par les chiffres et par certains signes de ponctuation. Selon le contexte (que les nombres soient en caractères latins ou en caractères arabes), les chiffres sont rendus sous forme de chiffres latins ou de chiffres arabes. De plus, selon le contexte, les signes de ponctuation symétriques sont inversés, c'est-à-dire que chaque fois qu'il y a un signe de ponctuation d'ouverture, la forme est rendue différemment selon la direction du script.

La partie supérieure du jeu de caractères ne contient que les lettres arabes, la ponctuation arabe différente de la ponctuation latine, ainsi que quelques autres caractères.

ASMO 708 a été conçu en étroite coopération avec l' ECMA , qui l'a adopté comme sa propre norme ECMA-114 en 1986. Il a également été approuvé comme norme ISO en tant qu'ISO 8859-6 . Il a également été inscrit au Registre international des jeux de caractères codés sous le numéro IR 127 en 1986.

Relation avec d'autres jeux de caractères

Certains autres jeux de caractères sont liés à l'ASMO 708 :

  • ASMO 708 / French 1 ajoute des caractères minuscules français;
  • French 1 / ASMO 708 ajoute des caractères minuscules français dans leurs points de code ISO 8859-1 et disloque les caractères arabes;
  • ISO / IR 167 ajoute des caractères français et allemands;
  • La page de code 708 de Microsoft , pour MS-DOS, ajoute des caractères français dans leurs points de code typiques de la page de code 437 et ajoute des caractères de dessin de boîte;
  • La page de code 710 de Microsoft (arabe transparent) et la page de code 720 de Microsoft (ASMO transparent), pour MS-DOS, ajoutent des caractères français dans leurs points de code typiques à partir de la page de code 437 mais disloque les caractères arabes pour permettre les caractères de dessin de boîte à partir du code page 437 pour être dans leurs points de code d'origine ;
  • Windows 1256 de Microsoft ajoute des caractères minuscules français dans leurs points de code Windows 1252 et disloque les caractères arabes;

Tableau des codes

ISO / CEI 8859-6
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_
0
1_
16
2_
32
SP
0020
!
0021
"
0022
#
0023
0024 $
% / ٪
0025
&
0026
«
0027
(
0028
)
0029
* / *
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0/٠
0030
1/١
0031
2/٢
0032
3/٣
0033
4/٤
0034
5/٥
0035
6/٦
0036
7/٧
0037
8/٨
0038
9/٩
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
un
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
je
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
avec
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
8_
128
9_
144
A_
160
NBSP
00A0
¤
00A4
،
060C
TIMIDE
00AD
B_
176
؛
061B
؟
061F
C_
192
ء
0621
آ
0622
أ
0623
ؤ
0624
إ
0625
ئ
0626
ا
0627
ب
0628
ة
0629
ت
062A
ث
062B
ج
062C
ح
062D
خ
062E
د
062F
D_
208
ذ
0630
ر
0631
ز
0632
س
0633
ش
0634
ص
0635
ض
0636
ط
0637
ظ
0638
ع
0639
غ
063A
E_
224
0640
ف
0641
ق
0642
ك
0643
ل
0644
م
0645
ن
0646
ه
0647
و
0648
ى
0649
ي
064A

064B
◌ٌ
064C
◌ٍ
064D
◌َ
064E
◌ُ
064F
F_
240

0650
◌ّ
0651

0652

  Lettre  Nombre  Ponctuation  symbole  Autre  Indéfini

Les valeurs de code 0xEB–0xF2 sont affectées à la combinaison de caractères .

Voir également

Les références

Liens externes