Alphabet latin de base ISO - ISO basic Latin alphabet

L' alphabet latin de base ISO est un alphabet latin composé de deux ensembles de 26 lettres, codifiés dans diverses normes nationales et internationales et largement utilisés dans les communications internationales. Ce sont les mêmes lettres qui composent l' alphabet anglais .

Les deux ensembles contiennent chacun les 26 lettres suivantes :

Alphabet latin de base ISO
Alphabet latin majuscule	UNE	B	C	ré	E	F	g	H	je	J	K	L	M	N	O	P	Q	R	S	T	U	V	W	X	Oui	Z
Alphabet latin minuscule	une	b	c	ré	e	F	g	h	je	j	k	je	m	m	o	p	q	r	s	t	vous	v	w	X	oui	z

Histoire

Dans les années 1960, il est devenu évident pour les industries de l' informatique et des télécommunications du Premier Monde qu'une méthode non exclusive de codage des caractères était nécessaire. L' Organisation internationale de normalisation (ISO) a encapsulé l' écriture latine dans sa norme de codage de caractères à 7 bits ( ISO/IEC 646 ). Pour parvenir à une acceptation généralisée, cette encapsulation était basée sur un usage populaire. La norme était basée sur l' American Standard Code for Information Interchange , déjà publié , mieux connu sous le nom d' ASCII , qui incluait dans le jeu de caractères les 26 × 2 lettres de l' alphabet anglais . Les normes ultérieures publiées par l'ISO, par exemple ISO/IEC 8859 (codage de caractères à 8 bits) et ISO/IEC 10646 ( Unicode Latin ), ont continué à définir les 26 × 2 lettres de l'alphabet anglais comme écriture latine de base avec extensions pour traiter d'autres lettres dans d'autres langues.

Terminologie

Le bloc Unicode qui contient l'alphabet est appelé " C0 Controls and Basic Latin ". Deux sous-rubriques existent :

"Alphabet latin majuscule" : les lettres commencent à U+0041 et contiennent la chaîne LETTRE MAJUSCULE LATINE dans leurs descriptions
"Alphabet latin minuscule" : les lettres commencent à U+0061 et contiennent la chaîne LATIN SMALL LETTER dans leurs descriptions

Il existe également deux autres ensembles dans le bloc Halfwidth and Fullwidth Forms :

Majuscules : les lettres commencent à U+FF21 et contiennent la chaîne FULLWIDTH LATIN CAPITAL LETTER dans leurs descriptions
Minuscule : les lettres commencent à U+FF41 et contiennent la chaîne FULLWIDTH LATIN SMALL LETTER dans leurs descriptions

Chronologie des normes d'encodage

Le code Morse international de 1865 a été normalisé lors du Congrès international de télégraphie à Paris, et a ensuite été adopté par l'Union internationale des télécommunications (UIT)
Alphabet d'orthographe de radiotéléphonie des années 1950 par l'OACI

Chronologie des codes informatiques largement utilisés prenant en charge l'alphabet

1963 : ASCII (norme de codage de caractères 7 bits de l' American Standards Association , devenue ANSI en 1969)
1963/1964 : EBCDIC (développé par IBM et prenant en charge les mêmes caractères alphabétiques que l'ASCII, mais avec des valeurs de code différentes)
1965-04-30 : Ratifié par l' ECMA en tant qu'ECMA-6 sur la base des travaux effectués par le comité technique TC1 de l'ECMA depuis décembre 1960.
1972 : ISO 646 ( norme de codage de caractères ISO 7 bits, utilisant les mêmes valeurs de code alphabétique que l'ASCII, révisée dans la deuxième édition ISO 646:1983 et la troisième édition ISO/IEC 646:1991 en tant que norme commune ISO/IEC )
1983 : Rec. UIT-T T.51 | ISO/IEC 6937 (une extension multi-octets de l'ASCII)
1987 : ISO/IEC 8859-1 :1987 (codage de caractères 8 bits)
- Par la suite, d'autres versions et parties de l'ISO/CEI 8859 ont été publiées.
Milieu à la fin des années 1980 : Windows-1250 , Windows-1252 et autres codages utilisés dans Microsoft Windows (certains à peu près similaires à ISO/IEC 8859-1)
1990 : Unicode 1.0 (développé par le Consortium Unicode ), contenu dans le bloc " C0 Controls and Basic Latin " utilisant les mêmes valeurs de code alphabétique que ASCII et ISO/IEC 646
- Par la suite, d'autres versions d'Unicode ont été publiées et il est ensuite devenu une norme commune ISO/IEC , comme indiqué ci-dessous.
1993 : ISO/IEC 10646-1 :1993, norme ISO/IEC pour les caractères en Unicode 1.1
- Par la suite, d'autres versions de l'ISO/CEI 10646-1 et une de l'ISO/CEI 10646-2 ont été publiées. Depuis 2003, les normes sont publiées sous le nom "ISO/IEC 10646" sans séparation en deux parties.
1997 : liste de glyphes Windows 4

Représentation

Les lettres de l'alphabet latin de base ISO sur un affichage à 16 segments (plus les chiffres arabes ).

En ASCII les lettres appartiennent aux caractères imprimables et en Unicode depuis la version 1.0 elles appartiennent au bloc " C0 Controls and Basic Latin ". Dans les deux cas, ainsi que dans ISO/IEC 646 , ISO/IEC 8859 et ISO/IEC 10646 ils occupent les positions en notation hexadécimale 41 à 5A pour les majuscules et 61 à 7A pour les minuscules.

Non sensible à la casse, toutes les lettres ont des mots de code dans l' alphabet orthographique de l' OACI et peuvent être représentées avec le code Morse .

Usage

Toutes les lettres minuscules sont utilisées dans l' alphabet phonétique international (API). Dans X-SAMPA et SAMPA, ces lettres ont la même valeur sonore que dans IPA.

Alphabets contenant le même ensemble de lettres

La liste ci-dessous ne comprend que les alphabets qui manquent :

lettres dont les signes diacritiques en font des lettres distinctes.
multigraphes qui constituent des lettres distinctes.

Alphabet	Signe diacritique	Multigraphes (ne constituant pas des lettres distinctes)	Ligatures
Alphabet afrikaans	á , é , è , ê , ë , í , î , ï , ó , ô , ú , û , ý
alphabet catalan	à , é , è , í , ï , ó , ò , ú , ü , ç , lꞏl	⟨ Gu ⟩, ⟨ ig ⟩, ⟨ ix ⟩, ⟨ ll ⟩, ⟨ ny ⟩, ⟨ qu ⟩, ⟨ rr ⟩, ⟨ ss ⟩
alphabet néerlandais	ä , é , è , ë , ï , ö , ü	Le digraphe ⟨ ij ⟩ est parfois considéré comme une lettre séparée. Lorsque c'est le cas, il remplace généralement ou est mélangé avec ⟨y⟩. Autres digrammes : ⟨ aa ⟩, ⟨ ae ⟩, ⟨ ai ⟩, ⟨ au ⟩, ⟨ ch ⟩, ⟨ ee ⟩, ⟨ ei ⟩, ⟨ eu ⟩, ⟨ ie ⟩, ⟨ oe ⟩, ⟨ oi ⟩, ⟨ oo ⟩ , ou ⟩, ui ⟩, uu ⟩
alphabet anglais	uniquement dans les mots d'emprunt (voir ci-dessous)	⟨ sh/shw ⟩, ⟨ ch/j ⟩, ⟨ ea/i ⟩, ⟨ ou/au ⟩, ⟨ th/d ⟩, ph/f ⟩, ⟨ ng/ngh/ngk/ngg ⟩⟨ qu/kw ⟩	æ , œ ue (archaïque)
l'alphabet francais	à , â , ç , é , è , ê , ë , î , ï , ô , ù , û , ü , ÿ	⟨ ai ⟩, ⟨ au ⟩, ⟨ ei ⟩, ⟨ eu ⟩, ⟨ oi ⟩, ou ⟩, ⟨ eau ⟩, ⟨ ch ⟩, ⟨ ph ⟩, ⟨ gn ⟩, ⟨ an ⟩, ⟨ am ⟩, ⟨ fr ⟩, ⟨ em ⟩, ⟨ dans ⟩, ⟨ im ⟩, ⟨ sur ⟩, ⟨ om ⟩, ⟨ un ⟩, ⟨ um ⟩, ⟨ yn ⟩, ⟨ ym ⟩, ⟨ ain ⟩, ⟨ objectif ⟩, ⟨ ein ⟩, ⟨ OIN ⟩, ⟨ aÌ ⟩, ⟨ Ei ⟩	æ , œ , ᵫ
alphabet allemand	ä , ö , ü	⟨ Sch ⟩, ⟨ qu ⟩, ⟨ ch ⟩, ⟨ ph ⟩, ⟨ ng ⟩, ⟨ ie ⟩, ⟨ ck ⟩, ⟨ ei ⟩, ⟨ eu ⟩, ⟨ UA ⟩	ß (parfois considéré comme une lettre)
Alphabet italien (étendu)	à , è , é , ì , ò , Ù	⟨ Ch ⟩, ⟨ ci ⟩, ⟨ gh ⟩, ⟨ gi ⟩, ⟨ gl ⟩, ⟨ gli ⟩, ⟨ gn ⟩, ⟨ sc ⟩, ⟨ sci ⟩
Ido alphabet	rien	⟨ Qu ⟩, ⟨ ch ⟩, ⟨ sh ⟩	rien
alphabet indonésien	uniquement dans les supports d'apprentissage (voir ci-dessous)	⟨ Kh ⟩, ⟨ ng ⟩, ⟨ ny ⟩, ⟨ sy ⟩, diphtongues: AI, Au, ei, oi
Alphabet interlingue	uniquement dans des emprunts non assimilés (voir ci-dessous)	⟨ Ch ⟩, ⟨ ph ⟩, ⟨ qu ⟩, ⟨ rh ⟩, ⟨ sh ⟩	rien
Alphabet latin javanais	é , è	⟨ Dh ⟩, ⟨ kh ⟩, ⟨ ng ⟩, ⟨ ny ⟩, ⟨ sy ⟩, ⟨ e ⟩	rien
alphabet luxembourgeois	ä , é , ë
alphabet malais	uniquement dans les supports d'apprentissage (voir ci-dessous)	⟨ Gh ⟩, ⟨ kh ⟩, ⟨ ng ⟩, ⟨ ny ⟩, ⟨ sy ⟩	rien
alphabet portugais	ã , õ , á , é , í , ó , ú , â , ê , ô , à , ç	⟨ Ch ⟩, ⟨ lh ⟩, ⟨ nh ⟩, ⟨ rr ⟩, ⟨ ss ⟩, ⟨ am ⟩, ⟨ em ⟩, ⟨ im ⟩, ⟨ om ⟩, ⟨ um ⟩, ⟨ Ae ⟩, ⟨ ão ⟩, ⟨ Oe ??	rien
Alphabet latin sundanais	é	⟨ Eu ⟩, ⟨ ng ⟩, ⟨ ny ⟩	rien

L'anglais est l'une des rares langues européennes modernes ne nécessitant pas de signes diacritiques pour les mots natifs (bien qu'une tréma soit utilisée par certains éditeurs américains dans des mots tels que « coopération »).

La langue construite Interlingua n'utilise jamais de signes diacritiques, sauf dans des emprunts non assimilés. Cependant, ils peuvent être supprimés s'ils ne sont pas utilisés pour modifier la voyelle (ex : cafe , du français : café ).

Le malais et l'indonésien (basé sur le malais) sont les seules langues en dehors de l'Europe qui utilisent tout l'alphabet latin et ne nécessitent ni signes diacritiques ni ligatures. La plupart des plus de 700 langues indonésiennes utilisent également l'alphabet indonésien pour écrire leurs langues, certaines comme le javanais ajoutant les signes diacritiques é et è, et certaines omettant q, x et z.

Numérotation des colonnes

L'alphabet romain (latin) est couramment utilisé pour la numérotation des colonnes dans un tableau ou un graphique. Cela évite toute confusion avec les numéros de ligne utilisant des chiffres arabes . Par exemple, un tableau 3 par 3 contiendrait les colonnes A, B et C, par rapport aux lignes 1, 2 et 3. Si plus de colonnes sont nécessaires au-delà de Z (normalement la dernière lettre de l'alphabet), la colonne est immédiatement après Z est AA, suivi de AB, et ainsi de suite (voir système bijectif base-26 ). Cela peut être vu en faisant défiler vers la droite dans un tableur tel que Microsoft Excel ou LibreOffice Calc .

Ce sont des "lettres" à deux chiffres pour les colonnes du tableau, de la même manière que 10 à 99 sont des nombres à deux chiffres. L' alphabet grec a une forme étendue similaire qui utilise de telles lettres à deux chiffres si nécessaire, mais il est utilisé pour les chapitres d'une fraternité par opposition aux colonnes d'un tableau.

Ces lettres à deux chiffres pour les puces sont AA, BB, CC, etc., par opposition au système de valeur de position de type nombre expliqué ci-dessus pour les colonnes du tableau.

Voir également

alphabet hébreu
alphabet grec
alphabet latin
- Alphabet latin pour la correspondance sonore
- Liste des alphabets latins
Alphabet cyrillique ancien , Alphabets cyrilliques
Pages de codes Windows

Languages

In other projects