Code de caractère à six bits - Six-bit character code

Un code de caractères à six bits est un codage de caractères conçu pour être utilisé sur des ordinateurs dont la longueur des mots est un multiple de 6. Six bits ne peuvent coder que 64 caractères distincts, de sorte que ces codes n'incluent généralement que les lettres majuscules, les chiffres, certains caractères de ponctuation. , et parfois des personnages de contrôle. Le format de bande magnétique à 7 pistes a été développé pour stocker des données dans de tels codes, ainsi qu'un bit de parité supplémentaire .

Types de codes à six bits

Un premier code binaire à six bits a été utilisé pour le braille , le système de lecture pour les aveugles qui a été développé dans les années 1820.

Les premiers ordinateurs ne traitaient que des données numériques et ne prévoyaient pas de données de caractères. Le BCD à six bits , avec plusieurs variantes, a été utilisé par IBM sur les premiers ordinateurs tels que l' IBM 702 en 1953 et l' IBM 704 en 1954. Les codages à six bits ont été remplacés par le code EBCDIC à 8 bits à partir de 1964, lorsque System/ 360 standardisé sur des octets 8 bits . Il existe quelques variantes de ce type de code (voir ci - dessous ).

Les codes de caractères à six bits succédaient généralement au code Baudot à cinq bits et précédaient l' ASCII à sept bits . Une variante populaire était DEC SIXBIT. Il s'agit simplement des codes de caractères ASCII de 32 à 95 codés de 0 à 63 en soustrayant 32 (c'est-à-dire les colonnes 2, 3, 4 et 5 du tableau ASCII (16 caractères par colonne), déplacés vers les colonnes 0 à 3, en soustrayant 2 aux bits de poids fort) ; il comprend l'espace, les caractères de ponctuation, les chiffres et les majuscules, mais aucun caractère de contrôle. Comme il ne comportait aucun caractère de contrôle, pas même de fin de ligne, il n'était pas utilisé pour le traitement de texte général. Cependant, des noms à six caractères tels que des noms de fichiers et des symboles d' assembleur pourraient être stockés dans un seul mot de 36 bits de PDP-10 , et trois caractères peuvent tenir dans chaque mot du PDP-1 et deux caractères dans chaque mot du PDP- 8 .

Les codes à six bits pouvaient coder plus de 64 caractères à l'aide des caractères Shift Out et Shift In , incorporant essentiellement deux ensembles distincts de 62 caractères et commutant entre eux. Par exemple, le populaire terminal de communication IBM 2741 prenait en charge une variété de jeux de caractères jusqu'à 88 caractères d'impression plus des caractères de contrôle.

Un codage UTF-6 a été proposé pour Unicode mais a été remplacé par Punycode .

Code BCD à six bits

Six bits BCD code a été l'adaptation du code de la carte perforée au code binaire . IBM a appliqué les termes décimal codé binaire et BCD aux variations des alpha-mères BCD utilisés dans la plupart des premiers ordinateurs IBM, y compris les séries IBM 1620 , IBM 1400 et les membres de l' architecture non décimale de la série IBM 700/7000 .

Code à six bits des bases de données COBOL

Un code à six bits était également utilisé dans les bases de données COBOL, où les informations de fin d'enregistrement étaient stockées séparément.

Code à six bits de la carte à bande magnétique

Un code à six bits, avec un bit de parité impaire ajouté , est utilisé sur la piste 1 des cartes à bande magnétique , comme spécifié dans la norme ISO/IEC 7811 -2.

Code DEC à six bits

Un code DEC SIXBIT comprenant quelques caractères de contrôle — ainsi que SO/SI , permettant l'extension de code — a été spécifié comme ECMA - 1 en 1963 (voir ci - dessous ). Une autre variante, moins courante, est obtenue en supprimant simplement le bit de poids fort d'un code ASCII dans la plage 32 - 95 (les codes 32 - 63 restent à leurs positions, les valeurs les plus élevées en ont 64 soustraites). Une telle variante a parfois été utilisée sur le PDP-8 de DEC (1965).

FIELDATA code à six bits

FIELDATA était un code à sept bits (avec parité facultative) dont seulement 64 positions de code (occupant six bits) étaient formellement définies. Une variante a été utilisée par les ordinateurs de la série 1100 d' UNIVAC . Traitant le code comme un code à six bits, ces systèmes utilisaient un mot de 36 bits (capable de stocker six de ces caractères FIELDATA réduits).

Code braille à six bits

Les caractères braille sont représentés à l'aide de six positions de points, disposées dans un rectangle. Chaque position peut contenir ou non un point en relief, de sorte que le braille peut être considéré comme un code binaire à six bits. Certains systèmes braille plus modernes ajoutent deux points supplémentaires, faisant de ces systèmes un code à huit bits à la place.

Codes à six bits pour l'encodage binaire-texte

La transmission de données binaires sur des systèmes conçus uniquement pour le texte peut parfois introduire des problèmes. Par exemple, les e - mails ne supportaient historiquement que les codes ASCII 7 bits et supprimaient le 8ème bit, corrompant ainsi les données binaires envoyées directement via n'importe quel serveur de messagerie problématique. D'autres systèmes peuvent causer des problèmes en interprétant de manière incorrecte les caractères de contrôle pendant le stockage ou la transmission. Un certain nombre de schémas existent pour emballer des données 8 bits dans des représentations textuelles uniquement qui peuvent passer par les systèmes de messagerie texte, pour être décodées à la destination. Des exemples de sous-ensembles de caractères 6 bits utilisés pour le conditionnement de données binaires incluent Uuencode et Base64 . Ces ensembles ne contiennent aucun caractère de contrôle (uniquement des chiffres, des lettres imprimables, de la ponctuation et peut-être de l'espace) et permettent la transmission de données sur tout support capable de transmettre du texte lisible par l'homme.

Exemples de codes BCD à six bits

IBM, qui dominait le traitement des données commerciales, utilise une variété de codes à six bits, qui étaient liés au jeu de caractères utilisé sur les cartes perforées , voir BCD (codage de caractères) .

D'autres codes de caractères de fournisseur sont indiqués ci-dessous, avec leurs équivalents Unicode .

CDC 1604 : Codes BCD de bande magnétique
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_ 1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
0
0030
#
0023
@
0040

MARQUE DE RUBAN
1_ SP
0020
/
002F
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A

MARQUE D' ENREGISTREMENT
,
002C
%
0025
2_ -
002D
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
P
0050
Q
0051
R
0052
-0
002D 0030
0024 $
*
002A
3_ &
0026
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
+0
002B 0030
.
002E
¤
00A4

MARQUE DE GROUPE

  Lettre  Nombre  Ponctuation  symbole  Autre  Indéfini


CDC 1604 : Codes de carte perforés
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_ 1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
0
0030
=
003D

2212
1_ SP
0020
/
002F
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
,
002C
(
0028
2_
2014
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
P
0050
Q
0051
R
0052
-0
002D 0030
0024 $
*
002A
3_ +
002B
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
+0
002B 0030
.
002E
)
0029


CDC 1612 : Codes imprimantes (applications métiers)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_ :
003A
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
0
0030
=
003D

2260

2264
!
0021
[
005B
1_ SP
0020
/
002F
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
]
005D
,
002C
(
0028

2192

2261
~
007E
2_
2212
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
P
0050
Q
0051
R
0052
%
0025
0024 $
*
002A

2191

2193
>
003E
3_ +
002B
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
<
003C
.
002E
)
0029

2265
?
003F
;
003B

Exemples de variantes ASCII à six bits

DÉC SIXBIT
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_ SP
0020
!
0021
"
0022
#
0023
0024 $
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
1_ 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
2_ @
0040
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
3_ P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F

  Lettre  Nombre  Ponctuation  symbole  Autre  Indéfini


ECMA-1
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_ SP
0020
HT
0009
BF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
1_ 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
2_ NUL
0000
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
3_ P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
ESC
001B
DEL
007F


Mainframes ICL
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_ 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
1_ SP
0020
!
0021
"
0022
#
0023
£
00A3
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
2_ @
0040
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
3_ P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
0024 $
]
005D

2191

2190


SixBit ASCII (utilisé par AIS )
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_ @
0040
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
1_ P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
2_ SP
0020
!
0021
"
0022
#
0023
0024 $
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_ 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F

Code GOST 6 bits

Code GOST 6 bits
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_ 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
+
002B
-
002D
/
002F
,
002C
.
002E
SP
0020
1_
23E8

2191
(
0028
)
0029
×
00D7
=
003D
;
003B
[
005B
]
005D
*
002A
'
2018
'
2019

2260
<
003C
>
003E
:
003A
2_ А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ж
0416
З
0417
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
П
041F
3_ Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ы
042B
Ь
042C
Э
042D
Ю
042E
Я
042F
DEL
007F

  Lettre  Nombre  Ponctuation  symbole  Autre  Indéfini

Exemple de codes braille à six bits

Le tableau suivant montre la disposition des caractères, avec la valeur hexadécimale, le caractère ASCII correspondant, les codes Braille 6 bits (combinaisons de points), le glyphe Braille Unicode et la signification générale (la signification réelle peut changer en fonction du contexte).

Hex Glyphe ASCII Points braille Glyphe braille Braille Signification
20 (espacer) ⠀ (motif braille vierge) (espacer)
21 ! 2-3-4-6 ⠮ (motif braille points-2346) les
22 " 5 ⠐ (motif braille points-5) (contraction)
23 # 3-4-5-6 ⠼ (motif braille points-3456) (numéro préfixe)
24 $ 1-2-4-6 ⠫ (motif braille points-1246) ed
25 % 1-4-6 ⠩ (motif braille points-146) sh
26 & 1-2-3-4-6 ⠯ (motif braille points-12346) et
27 ' 3 ⠄ (motif braille points-3) '
28 ( 1-2-3-5-6 ⠷ (motif braille points-12356) de
29 ) 2-3-4-5-6 ⠾ (motif braille points-23456) avec
2A * 1-6 ⠡ (motif braille points-16) ch
2B + 3-4-6 ⠬ (motif braille points-346) ment
2C , 6 ⠠ (motif braille points-6) (préfixe majuscule)
2D - 3-6 ⠤ (motif braille points-36) -
2E . 4-6 ⠨ (motif braille points-46) (préfixe italique)
2F / 3-4 ⠌ (motif braille points-34) st
30 0 3-5-6 ⠴ (motif braille points-356) "
31 1 2 ⠂ (motif braille points-2) ,
32 2 2-3 ⠆ (motif braille points-23) ;
33 3 2-5 ⠒ (motif braille points-25) :
34 4 2-5-6 ⠲ (motif braille points-256) .
35 5 2-6 ⠢ (motif braille points-26) fr
36 6 2-3-5 ⠖ (motif braille points-235) !
37 7 2-3-5-6 ⠶ (motif braille points-2356) ( ou )
38 8 2-3-6 ⠦ (motif braille points-236) " ou ?
39 9 3-5 ⠔ (motif braille points-35) dans
3A : 1-5-6 ⠱ (motif braille points-156) quoi
3B ; 5-6 ⠰ (motif braille points-56) (préfixe de lettre)
3C < 1-2-6 ⠣ (motif braille points-126) gh
3D = 1-2-3-4-5-6 ⠿ (motif braille points-123456) pour
3E > 3-4-5 ⠜ (motif braille points-345) ar
3F ? 1-4-5-6 ⠹ (motif braille points-1456) e
 
Hex Glyphe ASCII Points braille Glyphe braille Braille Signification
40 @ 4 ⠈ (motif braille points-4) (préfixe accentué)
41 UNE 1 ⠁ (motif braille points-1) une
42 B 1-2 ⠃ (motif braille points-12) b
43 C 1-4 ⠉ (motif braille points-14) c
44 1-4-5 ⠙ (motif braille points-145)
45 E 1-5 ⠑ (motif braille points-15) e
46 F 1-2-4 ⠋ (motif braille points-124) F
47 g 1-2-4-5 ⠛ (motif braille points-1245) g
48 H 1-2-5 ⠓ (motif braille points-125) h
49 je 2-4 ⠊ (motif braille points-24) je
4A J 2-4-5 ⠚ (motif braille points-245) j
4B K 1-3 ⠅ (motif braille points-13) k
4C L 1-2-3 ⠇ (motif braille points-123) je
4D M 1-3-4 ⠍ (motif braille points-134) m
4E N 1-3-4-5 ⠝ (motif braille points-1345) m
4F O 1-3-5 ⠕ (motif braille points-135) o
50 P 1-2-3-4 ⠏ (motif braille points-1234) p
51 Q 1-2-3-4-5 ⠟ (motif braille points-12345) q
52 R 1-2-3-5 ⠗ (motif braille points-1235) r
53 S 2-3-4 ⠎ (motif braille points-234) s
54 T 2-3-4-5 ⠞ (motif braille points-2345) t
55 U 1-3-6 ⠥ (motif braille points-136) vous
56 V 1-2-3-6 ⠧ (motif braille points-1236) v
57 W 2-4-5-6 ⠺ (motif braille points-2456) w
58 X 1-3-4-6 ⠭ (motif braille points-1346) X
59 Oui 1-3-4-5-6 ⠽ (points de motif braille-13456) oui
5A Z 1-3-5-6 ⠵ (motif braille points-1356) z
5B [ 2-4-6 ⠪ (motif braille points-246) ow
5C \ 1-2-5-6 ⠳ (motif braille points-1256) ous
5D ] 1-2-4-5-6 ⠻ (motif braille points-12456) euh
5E ^ 4-5 ⠘ (motif braille points-45) (contraction)
5F _ 4-5-6 ⠸ (motif braille points-456) (contraction)

Voir également

Les références

Liens externes