Norme industrielle thaïlandaise 620-2533 - Thai Industrial Standard 620-2533
La norme industrielle thaïlandaise 620-2533 , communément appelée TIS-620 , est le jeu de caractères et le codage de caractères les plus courants pour la langue thaïlandaise . La norme est publiée par le Thai Industrial Standards Institute (TISI), un organe du ministère de l'Industrie relevant du gouvernement royal thaïlandais, et est la seule norme officielle pour l'encodage du thaï en Thaïlande .
Le nom descriptif de la norme est « Norme pour les codes de caractères thaïlandais pour les ordinateurs » (thaï : รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร์). « 2533 » fait référence à l'année 2533 de l' ère bouddhiste (1990), l'année où la version actuelle de la norme a été publiée ; une révision précédente, TIS 620-2529 (1986), est désormais obsolète. La mise en page de la page de code est la même entre les deux éditions.
TIS-620 est le nom de jeu de caractères préféré de l' IANA pour TIS-620, et ce nom de jeu de caractères est également utilisé pour ISO/IEC 8859-11 (qui ajoute un espace sans interruption à 0xA0, qui n'est pas attribué dans TIS-620). Lorsque le nom IANA est utilisé, les codes sont complétés par les codes de contrôle C0 et C1 de la norme ISO/IEC 6429 .
Structure
TIS-620 est un jeu de caractères nationaux ASCII étendu de structure conventionnelle qui conserve une compatibilité totale avec l' ASCII 7 bits et utilise la plage de 8 bits hexadécimale A1 à FB pour le codage de l' alphabet thaï . En raison de la nature complexe de la combinaison des voyelles et des signes diacritiques thaïlandais, le TIS-620 est destiné uniquement à l'échange d'informations et un moteur d'affichage supplémentaire est nécessaire pour composer correctement les caractères.
Variantes
Une version presque identique de TIS-620 a été adoptée en tant qu'ISO/IEC 8859-11 en 2001, la seule différence étant que ISO/IEC 8859-11 définit l'hexagone A0 comme un espace insécable , tandis que TIS-620 le laisse indéfini mais réservé. (En pratique, cette petite distinction est généralement ignorée.)
L'ensemble ISO/IEC 8859-11 a également été enregistré comme ISO-IR-166 par Ecma International , mais cette variante ajoute des codes d'échappement explicites pour signaler le début et la fin des séquences de caractères thaïlandais.
L'ordre du jeu de caractères TIS-620 a été utilisé essentiellement tel quel dans Unicode ( ISO/IEC 10646 ). Le bloc thaï d'Unicode est de U+0E01 à U+0E7F, et les caractères thaïs TIS-620 peuvent être convertis en UTF-16 simplement en préfixant chaque octet avec 0E et en soustrayant l'hexa A0 de la valeur.
Jeu de caractères
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
||||||||||||||||
1_ 16 |
||||||||||||||||
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
un 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
je 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
avec 0077 |
x 0078 |
et 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
|
8_ 128 |
||||||||||||||||
9_ 144 |
||||||||||||||||
A_ 160 |
ก 0E01 |
ข 0E02 |
ฃ 0E03 |
ค 0E04 |
ฅ 0E05 |
ฆ 0E06 |
ง 0E07 |
จ 0E08 |
ฉ 0E09 |
ช 0E0A |
ซ 0E0B |
ฌ 0E0C |
ญ 0E0D |
ฎ 0E0E |
ฏ 0E0F |
|
B_ 176 |
ฐ 0E10 |
ฑ 0E11 |
ฒ 0E12 |
ณ 0E13 |
ด 0E14 |
ต 0E15 |
ถ 0E16 |
ท 0E17 |
ธ 0E18 |
น 0E19 |
บ 0E1A |
ป 0E1B |
ผ 0E1C |
ฝ 0E1D |
พ 0E1E |
ฟ 0E1F |
C_ 192 |
ภ 0E20 |
ม 0E21 |
ย 0E22 |
ร 0E23 |
ฤ 0E24 |
ล 0E25 |
ฦ 0E26 |
ว 0E27 |
ศ 0E28 |
ษ 0E29 |
ส 0E2A |
ห 0E2B |
ฬ 0E2C |
อ 0E2D |
ฮ 0E2E |
ฯ 0E2F |
D_ 208 |
ะ 0E30 |
◌ ั 0E31 |
า 0E32 |
ำ 0E33 |
◌ ิ 0E34 |
◌ ี 0E35 |
◌ ึ 0E36 |
◌ ื 0E37 |
◌ ุ 0E38 |
◌ ู 0E39 |
◌ ฺ 0E3A |
฿ 0E3F |
||||
E_ 224 |
เ 0E40 |
แ 0E41 |
โ 0E42 |
ใ 0E43 |
ไ 0E44 |
ๅ 0E45 |
ๆ 0E46 |
◌ ็ 0E47 |
◌ ่ 0E48 |
◌ ้ 0E49 |
◌ ๊ 0E4A |
◌ ๋ 0E4B |
◌ ์ 0E4C |
◌ ํ 0E4D |
◌ ๎ 0E4E |
๏ 0E4F |
F_ 240 |
0 0E50 |
1 0E51 |
2 0E52 |
3 0E53 |
4 0E54 |
5 0E55 |
6 0E56 |
7 0E57 |
8 0E58 |
9 0E59 |
๚ 0E5A |
๛ 0E5B |
Lettre Nombre Ponctuation symbole Autre Indéfini
Dans le tableau ci-dessus, 20 est le caractère ESPACE normal. Les valeurs de code 00-1F, 7F, 80-9F, A0, DB-DE et FC-FF ne sont pas affectées aux caractères par TIS-620.
Les valeurs de code D1, D4-DA, E7-EE sont des caractères combinés .
Lectures complémentaires
- Flohr, Guido (2016) [2006]. "Locale::RecodeData::TIS_620 - Routines de conversion pour TIS-620" . CPAN libintl-perl . 1.0. Archivé de l'original le 2017-01-14 . Récupéré le 14/01/2017 .
Les références
Liens externes
- Référence officielle (en thaï)
- Annonce dans la Gazette royale de TIS 620-2533 et TIS 620-2529
- Cartographie de TIS-620 à ISO 10646 à la Wayback Machine (archivé le 5 juin 2013)