Code de caractère à six bits - Six-bit character code
Un code de caractères à six bits est un codage de caractères conçu pour être utilisé sur des ordinateurs dont la longueur des mots est un multiple de 6. Six bits ne peuvent coder que 64 caractères distincts, de sorte que ces codes n'incluent généralement que les lettres majuscules, les chiffres, certains caractères de ponctuation. , et parfois des personnages de contrôle. Le format de bande magnétique à 7 pistes a été développé pour stocker des données dans de tels codes, ainsi qu'un bit de parité supplémentaire .
Types de codes à six bits
Un premier code binaire à six bits a été utilisé pour le braille , le système de lecture pour les aveugles qui a été développé dans les années 1820.
Les premiers ordinateurs ne traitaient que des données numériques et ne prévoyaient pas de données de caractères. Le BCD à six bits , avec plusieurs variantes, a été utilisé par IBM sur les premiers ordinateurs tels que l' IBM 702 en 1953 et l' IBM 704 en 1954. Les codages à six bits ont été remplacés par le code EBCDIC à 8 bits à partir de 1964, lorsque System/ 360 standardisé sur des octets 8 bits . Il existe quelques variantes de ce type de code (voir ci - dessous ).
Les codes de caractères à six bits succédaient généralement au code Baudot à cinq bits et précédaient l' ASCII à sept bits . Une variante populaire était DEC SIXBIT. Il s'agit simplement des codes de caractères ASCII de 32 à 95 codés de 0 à 63 en soustrayant 32 (c'est-à-dire les colonnes 2, 3, 4 et 5 du tableau ASCII (16 caractères par colonne), déplacés vers les colonnes 0 à 3, en soustrayant 2 aux bits de poids fort) ; il comprend l'espace, les caractères de ponctuation, les chiffres et les majuscules, mais aucun caractère de contrôle. Comme il ne comportait aucun caractère de contrôle, pas même de fin de ligne, il n'était pas utilisé pour le traitement de texte général. Cependant, des noms à six caractères tels que des noms de fichiers et des symboles d' assembleur pourraient être stockés dans un seul mot de 36 bits de PDP-10 , et trois caractères peuvent tenir dans chaque mot du PDP-1 et deux caractères dans chaque mot du PDP- 8 .
Les codes à six bits pouvaient coder plus de 64 caractères à l'aide des caractères Shift Out et Shift In , incorporant essentiellement deux ensembles distincts de 62 caractères et commutant entre eux. Par exemple, le populaire terminal de communication IBM 2741 prenait en charge une variété de jeux de caractères jusqu'à 88 caractères d'impression plus des caractères de contrôle.
Un codage UTF-6 a été proposé pour Unicode mais a été remplacé par Punycode .
Code BCD à six bits
Six bits BCD code a été l'adaptation du code de la carte perforée au code binaire . IBM a appliqué les termes décimal codé binaire et BCD aux variations des alpha-mères BCD utilisés dans la plupart des premiers ordinateurs IBM, y compris les séries IBM 1620 , IBM 1400 et les membres de l' architecture non décimale de la série IBM 700/7000 .
Code à six bits des bases de données COBOL
Un code à six bits était également utilisé dans les bases de données COBOL, où les informations de fin d'enregistrement étaient stockées séparément.
Code à six bits de la carte à bande magnétique
Un code à six bits, avec un bit de parité impaire ajouté , est utilisé sur la piste 1 des cartes à bande magnétique , comme spécifié dans la norme ISO/IEC 7811 -2.
Code DEC à six bits
Un code DEC SIXBIT comprenant quelques caractères de contrôle — ainsi que SO/SI , permettant l'extension de code — a été spécifié comme ECMA - 1 en 1963 (voir ci - dessous ). Une autre variante, moins courante, est obtenue en supprimant simplement le bit de poids fort d'un code ASCII dans la plage 32 - 95 (les codes 32 - 63 restent à leurs positions, les valeurs les plus élevées en ont 64 soustraites). Une telle variante a parfois été utilisée sur le PDP-8 de DEC (1965).
FIELDATA code à six bits
FIELDATA était un code à sept bits (avec parité facultative) dont seulement 64 positions de code (occupant six bits) étaient formellement définies. Une variante a été utilisée par les ordinateurs de la série 1100 d' UNIVAC . Traitant le code comme un code à six bits, ces systèmes utilisaient un mot de 36 bits (capable de stocker six de ces caractères FIELDATA réduits).
Code braille à six bits
Les caractères braille sont représentés à l'aide de six positions de points, disposées dans un rectangle. Chaque position peut contenir ou non un point en relief, de sorte que le braille peut être considéré comme un code binaire à six bits. Certains systèmes braille plus modernes ajoutent deux points supplémentaires, faisant de ces systèmes un code à huit bits à la place.
Codes à six bits pour l'encodage binaire-texte
La transmission de données binaires sur des systèmes conçus uniquement pour le texte peut parfois introduire des problèmes. Par exemple, les e - mails ne supportaient historiquement que les codes ASCII 7 bits et supprimaient le 8ème bit, corrompant ainsi les données binaires envoyées directement via n'importe quel serveur de messagerie problématique. D'autres systèmes peuvent causer des problèmes en interprétant de manière incorrecte les caractères de contrôle pendant le stockage ou la transmission. Un certain nombre de schémas existent pour emballer des données 8 bits dans des représentations textuelles uniquement qui peuvent passer par les systèmes de messagerie texte, pour être décodées à la destination. Des exemples de sous-ensembles de caractères 6 bits utilisés pour le conditionnement de données binaires incluent Uuencode et Base64 . Ces ensembles ne contiennent aucun caractère de contrôle (uniquement des chiffres, des lettres imprimables, de la ponctuation et peut-être de l'espace) et permettent la transmission de données sur tout support capable de transmettre du texte lisible par l'homme.
Exemples de codes BCD à six bits
IBM, qui dominait le traitement des données commerciales, utilise une variété de codes à six bits, qui étaient liés au jeu de caractères utilisé sur les cartes perforées , voir BCD (codage de caractères) .
D'autres codes de caractères de fournisseur sont indiqués ci-dessous, avec leurs équivalents Unicode .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
# 0023 |
@ 0040 |
MARQUE DE RUBAN |
|||
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
MARQUE D' ENREGISTREMENT |
, 002C |
% 0025 |
|||
2_ |
- 002D |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
-0 002D 0030 |
0024 $ |
* 002A |
|||
3_ |
& 0026 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
+0 002B 0030 |
. 002E |
¤ 00A4 |
MARQUE DE GROUPE |
Lettre Nombre Ponctuation symbole Autre Indéfini
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
= 003D |
− 2212 |
||||
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
, 002C |
( 0028 |
||||
2_ |
— 2014 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
-0 002D 0030 |
0024 $ |
* 002A |
|||
3_ |
+ 002B |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
+0 002B 0030 |
. 002E |
) 0029 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
: 003A |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
= 003D |
≠ 2260 |
≤ 2264 |
! 0021 |
[ 005B |
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
] 005D |
, 002C |
( 0028 |
→ 2192 |
≡ 2261 |
~ 007E |
2_ |
− 2212 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
% 0025 |
0024 $ |
* 002A |
↑ 2191 |
↓ 2193 |
> 003E |
3_ |
+ 002B |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
< 003C |
. 002E |
) 0029 |
≥ 2265 |
? 003F |
; 003B |
Exemples de variantes ASCII à six bits
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
1_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
2_ |
@ 0040 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
Lettre Nombre Ponctuation symbole Autre Indéfini
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
SP 0020 |
HT 0009 |
BF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
1_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
2_ |
NUL 0000 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
ESC 001B |
DEL 007F |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
1_ |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
£ 00A3 |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
2_ |
@ 0040 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
0024 $ |
] 005D |
↑ 2191 |
← 2190 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
@ 0040 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
1_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
2_ |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
Code GOST 6 bits
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
+ 002B |
- 002D |
/ 002F |
, 002C |
. 002E |
SP 0020 |
1_ |
⏨ 23E8 |
↑ 2191 |
( 0028 |
) 0029 |
× 00D7 |
= 003D |
; 003B |
[ 005B |
] 005D |
* 002A |
' 2018 |
' 2019 |
≠ 2260 |
< 003C |
> 003E |
: 003A |
2_ |
А 0410 |
Б 0411 |
В 0412 |
Г 0413 |
Д 0414 |
Е 0415 |
Ж 0416 |
З 0417 |
И 0418 |
Й 0419 |
К 041A |
Л 041B |
М 041C |
Н 041D |
О 041E |
П 041F |
3_ |
Р 0420 |
С 0421 |
Т 0422 |
У 0423 |
Ф 0424 |
Х 0425 |
Ц 0426 |
Ч 0427 |
Ш 0428 |
Щ 0429 |
Ы 042B |
Ь 042C |
Э 042D |
Ю 042E |
Я 042F |
DEL 007F |
Lettre Nombre Ponctuation symbole Autre Indéfini
Exemple de codes braille à six bits
Le tableau suivant montre la disposition des caractères, avec la valeur hexadécimale, le caractère ASCII correspondant, les codes Braille 6 bits (combinaisons de points), le glyphe Braille Unicode et la signification générale (la signification réelle peut changer en fonction du contexte).
|
|
Voir également
- Décimal codé binaire
- BCD (codage de caractères)
- Code d'affichage CDC
- DEC RADIX 50 / MOD40
- IBM SQUOZE
- Transcodage IBM
- ASCII
- Code Baudot
- EBCDIC
- Unicode
- ANSI X3.64
- UTF-8
- UTF-16
Les références
Liens externes
- "Manuel de référence de l'ordinateur Control Data 1604-C" (PDF) . (7,44 Mo)
- "Norme ECMA pour un code de caractères d'entrée/sortie 6 bits" (PDF) . (1,53 Mo)
- Référence des codes de caractères SIXBIT Digital Equipment Corporation Système de codage des caractères SIXBIT