Encodages de caractères KOI - KOI character encodings

KOI ( КОИ ) est une famille de plusieurs pages de code pour le cyrillique . Le nom signifie Kod Obmena Informatsiey ( russe : Код Обмена Информацией ) qui signifie « Code pour l'échange d'informations ».

Une caractéristique particulière des pages de codes KOI est que le texte reste lisible par l'homme lorsque le bit le plus à gauche est supprimé, s'il passe par inadvertance à travers un équipement ou un logiciel qui ne peut traiter que des caractères de 7 bits de large. Cela est dû au fait que les caractères sont placés dans un ordre spécial (128 points de code en dehors de la lettre latine à laquelle ils ressemblent le plus), qui, cependant, ne correspond à l'ordre alphabétique dans aucune langue écrite en cyrillique et nécessite l'utilisation de tables de recherche pour effectuer le tri .

Ces codages sont dérivés de l' ASCII sur la base d'une certaine correspondance entre le latin et le cyrillique (presque phonétique), qui était déjà utilisé dans le dialecte russe du code Morse et dans le code télégraphique MTK-2 . Les 26 premiers caractères de А (0xE1) dans KOI8-R sont А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, , , , , , , , .

KOI-7

L'encodage KOI original (1967) était une page de code à 7 bits nommée KOI-7 ( -7 ), qui ne contenait pas de lettres minuscules. Dans KOI-7, les codes des 31 ou 32 lettres russes sont ordonnés selon les lettres latines. Les autres points de code sont les mêmes qu'en ASCII (cependant, le signe dollar $ (point de code 24 _hex ) peut être remplacé par le signe monétaire universel ¤).

KOI-8

KOI-8 (КОИ-8), normalisé en 1974 par GOST 19768, est une extension 8 bits de l'ASCII . À l'origine, il ne comprenait que 32 lettres russes minuscules et 31 lettres majuscules russes.

Les dérivés ultérieurs de KOI-8 constituent la famille de codages connus sous le nom de KOI8 , KOI 8 et KOI-8 .

Les membres de la famille sont :

KOI8-B (avec Ё ё et Ъ )
KOI8-R / KOI8-RUSSIA pour le russe et le bulgare (RFC 1489).
KOI8-U / KOI8-UKRAINE pour l' ukrainien (RFC 2319).
KOI8-RU pour l' ukrainien , le biélorusse et le russe .
KOI8-T pour le tadjik .
KOI8-C , également KOI8-CA , une proposition pour le Caucase et l'Asie centrale ; presque jamais été utilisé.
ISO-IR-111 / KOI8-E (ECMA-113 (1ère éd., 1986), multilingue pour les langues slaves).
KOI8-F , KOI-8 unifié. Comprend les allocations de lettres de KOI8-U et KOI8-E, avec un sous-ensemble des pseudographies de KOI8-R.
KOI8-K1 "Cyrillique-1" (défini dans CSN 36 9103, ST SEV 358-88)
KOI8-O (anciennement KOI8-C) pour l'orthographe russe ancienne .

De plus, GOST R 34.303-92 définit "KOI-8 V1" qui est ISO-IR-153 , et "KOI-8 N1" et "KOI-8 N2" qui sont des variantes de la page de code 866 . Ceux-ci ne suivent pas la disposition KOI-8.

DKOI

DKOI est un codage basé sur EBCDIC utilisé dans les mainframes ES EVM . Il a été défini par plusieurs normes : GOST 19768-74 / ST SEV 358-76, ST SEV 358-88 / GOST 19768-93, CSN 36 9103.

Il existe deux variantes :

DKOI K1 (ДКОИ К1), chaque lettre cyrillique reçoit son propre point de code.
DKOI K2 (ДКОИ К1), certaines lettres cyrilliques (А, В, Е, К, М, Н, О, Р, С, Т, Х, а, е, о, р, с, у, х) sont fusionnées avec lettres latines visuellement identiques.

variantes latines

Certains encodages sont appelés KOI, mais définissent des alphabets latins :

KOI8-CS / KOI8-CS2 pour le tchèque et le slovaque (ČSN (norme technique tchèque) 369103, conçue par le Comecon . Ce latin encodé avec des signes diacritiques , comme utilisé en tchèque et en slovaque, plutôt qu'en cyrillique, mais l'idée de base était la même - le texte doit rester lisible avec le 8ème bit effacé, ainsi par exemple Č est devenu C etc.).
KOI8-L2 "Latin-2" (défini dans CSN 36 9103), ISO IR 139 (presque identique à ISO 8859-2 (1987), mais a le signe dollar et le signe monétaire échangés)
DKOI CS2 (défini dans CSN 36 9103)
DKOI L2 (défini dans CSN 36 9103)

Les références

Lectures complémentaires

Kornaï, Andras ; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; Fowler, Georges ; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (1993-03-13). "FAQ SUR L'ENCODAGE CYRILLIQUE Version 1.3" . 1.3 . Récupéré le 18/02/2017 .
"Kodierungen und Zeichensätze" [Encodages et jeux de caractères]. Robotron Technik (Musée virtuel de l'informatique) (en allemand). 2016-11-29. Code ASCII / Code KOI . Récupéré le 21/02/2017 .

Liens externes

"La Maison du KOI8-R depuis 1995" . 1995 . Récupéré le 05/12/2016 .
Hohlov, Yu. E. "Représentation de l'information cyrillique sous forme électronique - Tableaux de jeux de caractères (page de codes)" . Archivé de l'original le 2016-12-05 . Récupéré le 05/12/2016 .
Nechayev, Valentin (2013) [2001]. "Revue de l'univers des encodages cyrilliques 8 bits" . Archivé de l'original le 2016-12-05 . Récupéré le 05/12/2016 .

Languages

In other projects