Norme industrielle thaïlandaise 620-2533 - Thai Industrial Standard 620-2533

La norme industrielle thaïlandaise 620-2533 , communément appelée TIS-620 , est le jeu de caractères et le codage de caractères les plus courants pour la langue thaïlandaise . La norme est publiée par le Thai Industrial Standards Institute (TISI), un organe du ministère de l'Industrie relevant du gouvernement royal thaïlandais, et est la seule norme officielle pour l'encodage du thaï en Thaïlande .

Le nom descriptif de la norme est « Norme pour les codes de caractères thaïlandais pour les ordinateurs » (thaï : รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร์). « 2533 » fait référence à l'année 2533 de l' ère bouddhiste (1990), l'année où la version actuelle de la norme a été publiée ; une révision précédente, TIS 620-2529 (1986), est désormais obsolète. La mise en page de la page de code est la même entre les deux éditions.

TIS-620 est le nom de jeu de caractères préféré de l' IANA pour TIS-620, et ce nom de jeu de caractères est également utilisé pour ISO/IEC 8859-11 (qui ajoute un espace sans interruption à 0xA0, qui n'est pas attribué dans TIS-620). Lorsque le nom IANA est utilisé, les codes sont complétés par les codes de contrôle C0 et C1 de la norme ISO/IEC 6429 .

Structure

TIS-620 est un jeu de caractères nationaux ASCII étendu de structure conventionnelle qui conserve une compatibilité totale avec l' ASCII 7 bits et utilise la plage de 8 bits hexadécimale A1 à FB pour le codage de l' alphabet thaï . En raison de la nature complexe de la combinaison des voyelles et des signes diacritiques thaïlandais, le TIS-620 est destiné uniquement à l'échange d'informations et un moteur d'affichage supplémentaire est nécessaire pour composer correctement les caractères.

Variantes

Une version presque identique de TIS-620 a été adoptée en tant qu'ISO/IEC 8859-11 en 2001, la seule différence étant que ISO/IEC 8859-11 définit l'hexagone A0 comme un espace insécable , tandis que TIS-620 le laisse indéfini mais réservé. (En pratique, cette petite distinction est généralement ignorée.)

L'ensemble ISO/IEC 8859-11 a également été enregistré comme ISO-IR-166 par Ecma International , mais cette variante ajoute des codes d'échappement explicites pour signaler le début et la fin des séquences de caractères thaïlandais.

L'ordre du jeu de caractères TIS-620 a été utilisé essentiellement tel quel dans Unicode ( ISO/IEC 10646 ). Le bloc thaï d'Unicode est de U+0E01 à U+0E7F, et les caractères thaïs TIS-620 peuvent être convertis en UTF-16 simplement en préfixant chaque octet avec 0E et en soustrayant l'hexa A0 de la valeur.

Jeu de caractères

TIS-620
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_
0
1_
16
2_
32
SP
0020
!
0021
"
0022
#
0023
0024 $
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
un
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
je
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
avec
0077
x
0078
et
0079
z
007A
{
007B
|
007C
}
007D
~
007E
8_
128
9_
144
A_
160

0E01

0E02

0E03

0E04

0E05

0E06

0E07

0E08

0E09

0E0A

0E0B

0E0C

0E0D

0E0E

0E0F
B_
176

0E10

0E11

0E12

0E13

0E14

0E15

0E16

0E17

0E18

0E19

0E1A

0E1B

0E1C

0E1D

0E1E

0E1F
C_
192

0E20

0E21

0E22

0E23

0E24

0E25

0E26

0E27

0E28

0E29

0E2A

0E2B

0E2C

0E2D

0E2E

0E2F
D_
208

0E30
◌ ั
0E31

0E32

0E33
◌ ิ
0E34
◌ ี
0E35
◌ ึ
0E36
◌ ื
0E37
◌ ุ
0E38
◌ ู
0E39
◌ ฺ
0E3A
฿
0E3F
E_
224

0E40

0E41

0E42

0E43

0E44

0E45

0E46
◌ ็
0E47
◌ ่
0E48
◌ ้
0E49
◌ ๊
0E4A
◌ ๋
0E4B
◌ ์
0E4C
◌ ํ
0E4D
◌ ๎
0E4E

0E4F
F_
240
0
0E50
1
0E51
2
0E52
3
0E53
4
0E54
5
0E55
6
0E56
7
0E57
8
0E58
9
0E59

0E5A

0E5B

  Lettre  Nombre  Ponctuation  symbole  Autre  Indéfini

Dans le tableau ci-dessus, 20 est le caractère ESPACE normal. Les valeurs de code 00-1F, 7F, 80-9F, A0, DB-DE et FC-FF ne sont pas affectées aux caractères par TIS-620.

Les valeurs de code D1, D4-DA, E7-EE sont des caractères combinés .

Lectures complémentaires

  • Flohr, Guido (2016) [2006]. "Locale::RecodeData::TIS_620 - Routines de conversion pour TIS-620" . CPAN libintl-perl . 1.0. Archivé de l'original le 2017-01-14 . Récupéré le 14/01/2017 .

Les références

Liens externes