Encodages de caractères KOI - KOI character encodings

KOI ( КОИ ) est une famille de plusieurs pages de code pour le cyrillique . Le nom signifie Kod Obmena Informatsiey ( russe : Код Обмена Информацией ) qui signifie « Code pour l'échange d'informations ».

Une caractéristique particulière des pages de codes KOI est que le texte reste lisible par l'homme lorsque le bit le plus à gauche est supprimé, s'il passe par inadvertance à travers un équipement ou un logiciel qui ne peut traiter que des caractères de 7 bits de large. Cela est dû au fait que les caractères sont placés dans un ordre spécial (128 points de code en dehors de la lettre latine à laquelle ils ressemblent le plus), qui, cependant, ne correspond à l'ordre alphabétique dans aucune langue écrite en cyrillique et nécessite l'utilisation de tables de recherche pour effectuer le tri .

Ces codages sont dérivés de l' ASCII sur la base d'une certaine correspondance entre le latin et le cyrillique (presque phonétique), qui était déjà utilisé dans le dialecte russe du code Morse et dans le code télégraphique MTK-2 . Les 26 premiers caractères de А (0xE1) dans KOI8-R sont А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, , , , , , , , .

KOI-7

L'encodage KOI original (1967) était une page de code à 7 bits nommée KOI-7 ( -7 ), qui ne contenait pas de lettres minuscules. Dans KOI-7, les codes des 31 ou 32 lettres russes sont ordonnés selon les lettres latines. Les autres points de code sont les mêmes qu'en ASCII (cependant, le signe dollar $ (point de code 24 hex ) peut être remplacé par le signe monétaire universel ¤).

KOI-8

KOI-8 (КОИ-8), normalisé en 1974 par GOST 19768, est une extension 8 bits de l'ASCII . À l'origine, il ne comprenait que 32 lettres russes minuscules et 31 lettres majuscules russes.

Les dérivés ultérieurs de KOI-8 constituent la famille de codages connus sous le nom de KOI8 , KOI 8 et KOI-8 .

Les membres de la famille sont :

De plus, GOST R 34.303-92 définit "KOI-8 V1" qui est ISO-IR-153 , et "KOI-8 N1" et "KOI-8 N2" qui sont des variantes de la page de code 866 . Ceux-ci ne suivent pas la disposition KOI-8.

DKOI

DKOI est un codage basé sur EBCDIC utilisé dans les mainframes ES EVM . Il a été défini par plusieurs normes : GOST 19768-74 / ST SEV 358-76, ST SEV 358-88 / GOST 19768-93, CSN 36 9103.

Il existe deux variantes :

  • DKOI K1 (ДКОИ К1), chaque lettre cyrillique reçoit son propre point de code.
  • DKOI K2 (ДКОИ К1), certaines lettres cyrilliques (А, В, Е, К, М, Н, О, Р, С, Т, Х, а, е, о, р, с, у, х) sont fusionnées avec lettres latines visuellement identiques.

variantes latines

Certains encodages sont appelés KOI, mais définissent des alphabets latins :

  • KOI8-CS / KOI8-CS2 pour le tchèque et le slovaque (ČSN (norme technique tchèque) 369103, conçue par le Comecon . Ce latin encodé avec des signes diacritiques , comme utilisé en tchèque et en slovaque, plutôt qu'en cyrillique, mais l'idée de base était la même - le texte doit rester lisible avec le 8ème bit effacé, ainsi par exemple Č est devenu C etc.).
  • KOI8-L2 "Latin-2" (défini dans CSN 36 9103), ISO IR 139 (presque identique à ISO 8859-2 (1987), mais a le signe dollar et le signe monétaire échangés)
  • DKOI CS2 (défini dans CSN 36 9103)
  • DKOI L2 (défini dans CSN 36 9103)

Les références

Lectures complémentaires

  • Kornaï, Andras ; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; Fowler, Georges ; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (1993-03-13). "FAQ SUR L'ENCODAGE CYRILLIQUE Version 1.3" . 1.3 . Récupéré le 18/02/2017 .
  • "Kodierungen und Zeichensätze" [Encodages et jeux de caractères]. Robotron Technik (Musée virtuel de l'informatique) (en allemand). 2016-11-29. Code ASCII / Code KOI . Récupéré le 21/02/2017 .

Liens externes