Diacritique - Diacritic

une
Lettre a avec grave diacritique
Diacritiques en latin et en grec
accent
aigu´
double aigu??
la tombe`
double tombe ??
circonflexe??
caron, háček??
brève??
brève inversée  ??  
cédille??
tréma, tréma??
point·
crochet palatin  ??
crochet rétroflex  ??
crochet au dessus ??
Corne ??
indice iota ?? 
macron??
ogonek, nosinė??
périspomène ?? 
dépassement??
sous-anneau??
respiration rauque??
respiration douce??
Marques parfois utilisées comme signes diacritiques
apostrophe'
bar??
côlon:
virgule,
point/point.
trait d'union??
premier??
tilde~
Signes diacritiques dans d'autres scripts
signes diacritiques arabes
Premiers signes diacritiques cyrilliques
kamora ??
pokrytie ??
titlo ??
signes diacritiques hébreux
signes diacritiques indiens
anusvara
avagraha
chandrabindu
nuqta??
virama
visarga
Diacritiques gurmukhī
signes diacritiques khmers
signes diacritiques thaïlandais
Diacritiques IPA
Japonais kana diacritiques
dakuten ??
handakuten ??
diacritiques syriaques
En rapport
Cercle en pointillé??
Signe de ponctuation
Symboles logiques

Un diacritique (également de marque diacritique , le point diacritique , signe diacritique ou accent ) est un glyphe ajouté à une lettre ou à un glyphe de base. Le terme dérive du grec ancien διακριτικός ( diakritikós , « distinguer »), de διακρίνω ( diakrino , « pour distinguer »). Le mot diacritique est un nom , bien qu'il soit parfois utilisé dans un sens attributif , alors que diacritique n'est qu'un adjectif . Certains signes diacritiques, tels que l' aigu (◌́   ) et le grave (◌̀   ), sont souvent appelés accents . Les signes diacritiques peuvent apparaître au-dessus ou au-dessous d'une lettre ou dans une autre position telle qu'à l'intérieur de la lettre ou entre deux lettres.

L'utilisation principale des signes diacritiques en écriture latine est de changer les valeurs sonores des lettres auxquelles ils sont ajoutés. Historiquement, l'anglais a utilisé la diérèse pour indiquer la prononciation correcte de mots ambigus, tels que « coöperate », sans lequel la séquence de lettres <oo> pourrait être mal interprétée comme étant prononcée /ˈkuːpəreɪt/ . D'autres exemples sont les accents aigus et graves, qui peuvent indiquer qu'une voyelle doit être prononcée différemment de la normale dans cette position, par exemple non réduite à /ə/ ou silencieuse comme dans le cas des deux utilisations de la lettre e dans le nom résumé (par opposition au verbe résumé ) et l'aide parfois apportée à la prononciation de certains mots tels que doggèd , learnèd , blessèd , et surtout des mots prononcés différemment que la normale en poésie (par exemple movèd breathèd ).

La plupart des autres mots avec signes diacritiques en anglais sont des emprunts à des langues comme le français pour mieux préserver l'orthographe, comme la tréma sur naïve et Noël , l' aigu de café , le circonflexe dans le mot crêpe , et la cédille en façade . Tous ces signes diacritiques, cependant, sont fréquemment omis par écrit, et l'anglais est la seule grande langue européenne moderne qui n'utilise pas les signes diacritiques en commun.

Dans les alphabets latins d' autres langues, les signes diacritiques peuvent faire la distinction entre les homonymes , tels que le français ("là") par rapport à la ("le"), qui se prononcent tous les deux /la/ . En type gaélique , un point sur une consonne indique la lénition de la consonne en question.

Dans d'autres systèmes alphabétiques , les signes diacritiques peuvent remplir d'autres fonctions. Les systèmes de pointage des voyelles , à savoir les systèmes arabe harakat (  ,ـُ ,ـَ,  etc.) et hébreu niqqud (  ַ◌, ֶ◌, , , , etc.), indiquent les voyelles qui ne sont pas transmises par l'alphabet de base. L' Indic virama (् etc.) et l'arabe Sukun (  ) marquent l'absence de voyelles. Les marques de cantillation indiquent la prosodie . D' autres utilisations incluent le début cyrillique TITLO accident vasculaire cérébral (◌҃) et l'hébreu gershayim (  " ), qui, respectivement, marque abréviations ou acronymes et marques grecs diacritiques, qui a montré que les lettres de l'alphabet étaient utilisées comme chiffres . En vietnamien, le système officiel de romanisation Hanyu Pinyin pour le chinois, les signes diacritiques sont utilisés pour marquer les tons des syllabes dans lesquelles les voyelles marquées se produisent.

En orthographe et en collation , une lettre modifiée par un signe diacritique peut être traitée soit comme une nouvelle lettre distincte, soit comme une combinaison lettre-diacritique. Cela varie d'une langue à l'autre et peut varier d'un cas à l'autre au sein d'une langue.

Dans certains cas, les lettres sont utilisées comme "diacritiques en ligne", avec la même fonction que les glyphes auxiliaires, en ce sens qu'elles modifient le son de la lettre qui les précède, comme dans le cas du "h" dans la prononciation anglaise de " sh" et "th". De telles combinaisons de lettres sont parfois même rassemblées sous forme de lettres séparées. Par exemple, l'orthographe sch était traditionnellement souvent traitée comme une lettre distincte en allemand. Les mots avec cette orthographe étaient répertoriés après tous les autres mots orthographiés avec un s dans les catalogues sur fiches des bibliothèques publiques de Vienne, par exemple (avant la numérisation).

Les types

Parmi les types de signes diacritiques utilisés dans les alphabets basés sur l' écriture latine figurent :

Le tilde, le point, la virgule, le titlo , l'apostrophe, la barre et le côlon sont parfois des signes diacritiques, mais ont également d'autres usages.

Tous les signes diacritiques n'apparaissent pas à côté de la lettre qu'ils modifient. Dans la langue Wali du Ghana, par exemple, une apostrophe indique un changement de qualité vocalique, mais se produit au début du mot, comme dans les dialectes 'Bulengee et 'Dolimi . En raison de l' harmonie des voyelles , toutes les voyelles d'un mot sont affectées, de sorte que la portée du diacritique est le mot entier. Dans les écritures abugida , comme celles utilisées pour écrire l' hindi et le thaï , les signes diacritiques indiquent les voyelles et peuvent apparaître au-dessus, en dessous, avant, après ou autour de la consonne qu'ils modifient.

Le titre (point) sur la lettre i ou la lettre j , de l'alphabet latin est à l'origine un signe diacritique pour distinguer clairement i des minimes (coups bas) des lettres adjacentes. Il est apparu pour la première fois au XIe siècle dans la séquence ii (comme dans ingeníí ), puis s'est étendu à i adjacent à m, n, u , et enfin à tous les i s minuscules . Le j , à l'origine une variante de i , a hérité du titre. La forme du diacritique s'est développée d'abord ressemblant à l'accent aigu d'aujourd'hui à une longue floraison au 15ème siècle. Avec l'avènement du type romain, il a été réduit au point rond que nous avons aujourd'hui.

Les langues d'Europe de l'Est ont tendance à utiliser des signes diacritiques sur les consonnes et les voyelles, alors qu'en Europe occidentale, les digrammes sont plus généralement utilisés pour changer les sons des consonnes. La plupart des langues d'Europe occidentale utilisent des signes diacritiques sur les voyelles, à l'exception de l'anglais où il n'y en a généralement pas (à quelques exceptions près ).

Diacritiques spécifiques aux alphabets non latins

arabe

  • (ئ ؤ إ أ et stand alone ء) hamza : indique un arrêt de glotte .
  • Symboles (ــًــٍــٌـ) tanwīn ( تنوين ) : Rôle grammatical en arabe . Le signe est le plus souvent écrit en combinaison avec alif , par exemple ـًا .
  • (ــّـ) shadda : Gémination (doublement) des consonnes.
  • (ٱ) waṣla : Vient le plus souvent au début d'un mot. Indique un type de hamza qui se prononce uniquement lorsque la lettre est lue au début du discours.
  • (آ) madda : Un remplacement écrit pour un hamza qui est suivi d'un alif, c'est-à-dire ( ءا ). Lu comme un arrêt de glotte suivi d'un long /aː/ , par exemple ءاداب، ءاية، قرءان، مرءاة sont écrits respectivement comme آداب، آية، قرآن، مرآة . Cette règle d'écriture ne s'applique pas lorsque l'alif qui suit un hamza ne fait pas partie du radical du mot, par exemple نتوءات n'est pas écrit نتوآت car le radical نتوء n'a pas d'alif qui suit son hamza .
  • (ــٰـ) exposant alif (également "court" ou "dagger alif": Un remplacement pour un alif original qui est supprimé dans l'écriture de certains mots rares, par exemple لاكن n'est pas écrit avec l'alif original trouvé dans la prononciation du mot, à la place, il est écrit comme لٰكن .
  • ḥarakat (En arabe : حركات aussi appelé تشكيل tashkīl ) :
    • (ــَـ) fatḥa (a)
    • (ــِـ) kasra (i)
    • (ــُـ) amma (u)
    • (ــْـ) sukūn (pas de voyelle)
  • Les points ḥarakat ou voyelles servent à deux fins :
    • Ils servent de guide phonétique. Ils indiquent la présence de voyelles courtes ( fatḥa , kasra ou ḍamma ) ou leur absence ( sukūn ).
    • À la dernière lettre d'un mot, le point de voyelle reflète le cas d' inflexion ou le mode de conjugaison.
      • Pour les noms, le ḍamma est pour le nominatif, fatḥa pour l'accusatif et kasra pour le génitif.
      • Pour les verbes, le ḍamma est pour l'imperfectif, fatḥa pour le perfectif, et le sukūn est pour les verbes à l'impératif ou au jussif .
  • Les points de voyelle ou tashkīl ne doivent pas être confondus avec des points de consonne ou iʿjam ( إعجام ) - un, deux ou trois points écrits au-dessus ou au-dessous d'une consonne pour distinguer les lettres de la même forme ou d'une forme similaire .

grec

Ces signes diacritiques sont utilisés en plus des accents aigus, graves et circonflexes et de la tréma :

hébreu

Genèse 1:9 "Et Dieu dit: Que les eaux soient recueillies".
Lettres en noir, niqqud en rouge , cantillation en bleu

coréen

Hangul , l'alphabet coréen

Les diacritiques et  , connu sous le nom Bangjeom ( 방점,傍點), ont été utilisés pour des accents de pas de marque dans Hangul pour Moyen - coréen . Ils étaient écrits à gauche d'une syllabe en écriture verticale et au-dessus d'une syllabe en écriture horizontale.

Sanskrit et Indic

Les lettres composées de l'écriture Devanagari (de la famille brahmique), qui sont des voyelles combinées avec des consonnes, ont des signes diacritiques. Ici क(Ka) est représenté avec des signes diacritiques vocaliques. C'est-à-dire : ◌T, T ᷇◌, ◌ T᷆, ◌͜, ◌̯, , ◌̙, etc.

syriaque

  • Un point au-dessus et un point au-dessous d'une lettre représentent [a] , translittéré comme a ou ă ,
  • Deux points placés en diagonale au-dessus d'une lettre représentent [ɑ] , translittéré comme ā ou â ou å ,
  • Deux points placés horizontalement sous une lettre représentent [ɛ] , translittéré comme e ou ĕ ; souvent prononcé [ɪ] et translittéré comme i dans le dialecte syriaque oriental ,
  • Deux points placés en diagonale sous une lettre représentent [e] , translittéré comme ē ,
  • Un point sous le Beth représente un son doux [v] , translittéré en v
  • Un tilde (~) placé sous Gamel représente un son [dʒ] , translittéré en j
  • La lettre Waw avec un point en dessous représente [u] , translittéré comme ū ou u ,
  • La lettre Waw avec un point au-dessus représente [o] , translittéré comme ō ou o ,
  • La lettre Yōḏ avec un point en dessous représente [i] , translittéré comme ī ou i ,
  • Un tilde (~) sous Kaph représente un son [t͡ʃ] , translittéré en ch ou è ,
  • Un demi-cercle sous Peh représente un son [f] , translittéré en f ou ph .

En plus des marques de voyelles ci-dessus, la translittération du syriaque comprend parfois ə , ou exposant e (ou souvent rien du tout) pour représenter un schwa araméen original qui s'est perdu plus tard à un moment donné dans le développement du syriaque. Certains schémas de translittération trouvent son inclusion nécessaire pour montrer la spirantisation ou pour des raisons historiques.

Écritures non alphabétiques

Certaines écritures non alphabétiques utilisent également des symboles qui fonctionnent essentiellement comme des signes diacritiques.

  • Les abjads non purs (comme l' écriture hébraïque et arabe ) et les abugidas utilisent des signes diacritiques pour désigner les voyelles . L'hébreu et l'arabe indiquent également un doublement et un changement de consonne avec des signes diacritiques ; L'hébreu et le devanagari les utilisent pour les sons étrangers. Devanagari et les abugidas apparentés utilisent également une marque diacritique appelée virama pour marquer l'absence d'une voyelle. De plus, Devanagari utilise le chandrabindu point de lune ( ).
  • Le langage syllabique autochtone canadien unifié utilise plusieurs types de signes diacritiques, y compris les signes diacritiques avec des propriétés alphabétiques connues sous le nom de médiales et finales. Bien que les voyelles longues aient été à l'origine indiquées par une ligne négative à travers les glyphes syllabiques, faisant apparaître le glyphe brisé, dans les formes modernes, un point au - dessus est utilisé pour indiquer la longueur de la voyelle. Dans certains styles, un anneau au - dessus indique une voyelle longue avec un [j] hors-glisse. Autre signe diacritique, l'"anneau intérieur" est placé en tête du glyphe pour modifier [p] en [f] et [t] en [θ]. Les médians tels que le « w-dot » placé à côté du glyphe syllabique indiquent qu'un [w] est placé entre la consonne de début de syllabe et la voyelle du noyau. Les finales indiquent la syllabe coda consonne; certaines des consonnes coda syllabiques dans les positions médiales des mots, comme avec le "h-tick", indiquent la fortification de la consonne dans la syllabe qui la suit.
  • Les syllabaires japonais hiragana et katakana utilisent les symboles dakuten (◌゛) et handakuten (◌゜) (en japonais : 濁点 et 半濁点), également connus sous le nom de nigori (濁 "muddying") ou ten-ten (点々 "dot dot" ) et maru (丸 "cercle"), pour indiquer les consonnes sonores ou d'autres changements phonétiques.
  • Les émoticônes sont généralement créées avec des symboles diacritiques, en particulier des émoticônes japonaises sur les tableaux d'images populaires .

Alphabétisation ou collation

Différentes langues utilisent des règles différentes pour mettre les caractères diacritiques dans l' ordre alphabétique . Le français et le portugais traitent les lettres avec des signes diacritiques de la même manière que la lettre sous-jacente à des fins de classement et de dictionnaires.

Les langues scandinaves et la langue finnoise , en revanche, traitent les caractères avec des signes diacritiques å , ä et ö comme des lettres distinctes de l'alphabet, et les trient après z . Habituellement ä (a-umlaut) et ö (o-umlaut) [utilisé en suédois et en finnois] sont triés comme équivalents à æ (ash) et ø (o-slash) [utilisé en danois et norvégien]. De plus, aa , lorsqu'il est utilisé comme orthographe alternative à å , est trié comme tel. Les autres lettres modifiées par des signes diacritiques sont traitées comme des variantes de la lettre sous-jacente, à l'exception du fait que ü est fréquemment trié comme y .

Les langues qui traitent les lettres accentuées comme des variantes de la lettre sous-jacente classent généralement les mots avec de tels symboles immédiatement après des mots similaires non marqués. Par exemple, en allemand où deux mots ne diffèrent que par un tréma, le mot sans celui-ci est d'abord trié dans les dictionnaires allemands (par exemple schon puis schön , ou tombé puis fällen ). Cependant, lorsqu'il s'agit de noms (par exemple dans les annuaires téléphoniques ou dans les catalogues d'auteurs des bibliothèques), les trémas sont souvent traités comme des combinaisons de la voyelle avec un suffixe e ; Les annuaires téléphoniques autrichiens traitent désormais les caractères avec des trémas comme des lettres séparées (suivant immédiatement la voyelle sous-jacente).

En espagnol, le graphème ñ est considéré comme une nouvelle lettre différente de n et classée entre n et o , car il dénote un son différent de celui d'un n ordinaire . Mais les voyelles accentuées á , é , í , ó , ú ne sont pas séparées des voyelles non accentuées a , e , i , o , u , car l' accent aigu en espagnol ne modifie que l' accent dans le mot ou dénote une distinction entre les homonymes , et ne modifie pas le son d'une lettre.

Pour une liste complète des ordres de classement dans différentes langues, voir Séquence de classement .

Génération avec des ordinateurs

clavier

La technologie informatique moderne a été développée principalement dans les pays anglophones, de sorte que les formats de données, les dispositions de clavier, etc. ont été développés avec un parti pris favorisant l'anglais, une langue avec un alphabet sans signes diacritiques. Des efforts ont été faits pour créer des noms de domaine internationalisés qui étendent davantage l'alphabet anglais (par exemple, "pokémon.com").

Selon la disposition du clavier , qui diffère selon les pays, il est plus ou moins facile de saisir des lettres avec des signes diacritiques sur les ordinateurs et les machines à écrire. Certains ont leurs propres clés ; certains sont créés en appuyant d'abord sur la touche avec le signe diacritique suivi de la lettre sur laquelle le placer. Une telle touche est parfois appelée touche morte , car elle ne produit aucune sortie propre mais modifie la sortie de la touche enfoncée après elle.

Dans les systèmes d'exploitation Microsoft Windows et Linux modernes, les dispositions de clavier US International et UK International comportent des touches mortes qui permettent de taper des lettres latines avec les caractères aigus, graves, circonflexes, diaérèse, tilde et cédille que l'on trouve dans les langues d'Europe occidentale (en particulier, celles combinaisons trouvées dans le jeu de caractères ISO Latin-1 ) directement : ¨+ edonne ë , ~+ odonne õ , etc. Sur les ordinateurs Apple Macintosh , il existe des raccourcis clavier pour les signes diacritiques les plus courants ; ⌥ Option+ Esuivi d'une voyelle place un accent aigu, ⌥ Option+ Usuivi d'une voyelle donne un tréma, ⌥ Option+ Cdonne une cédille, etc. Les signes diacritiques peuvent être composés dans la plupart des dispositions de clavier du système X Window , ainsi que d'autres systèmes d'exploitation, tels que Microsoft Windows, à l'aide d'un logiciel supplémentaire.

Sur les ordinateurs, la disponibilité des pages de codes détermine si l'on peut utiliser certains signes diacritiques. Unicode résout ce problème en attribuant à chaque caractère connu son propre code ; si ce code est connu, la plupart des systèmes informatiques modernes fournissent une méthode pour le saisir . Avec Unicode, il est également possible de combiner des signes diacritiques avec la plupart des caractères. Cependant, à partir de 2019, très peu de polices incluent la prise en charge nécessaire pour restituer correctement les caractères plus diacritiques pour les alphabets latin, cyrillique et certains autres (les exceptions incluent Andika ).

Langues avec des lettres contenant des signes diacritiques

Les langues suivantes ont des lettres qui contiennent des signes diacritiques qui sont considérés comme des lettres indépendantes distinctes de celles sans signes diacritiques.

Lettres latines/romaines

baltique
  • Le letton a les lettres suivantes : ā , ē , ī , ū , č , ģ , ķ , ļ , ņ , š , ž
  • lituanien . Dans l'usage général, où les lettres apparaissent avec le caron ( è, š et ž ), elles sont considérées comme des lettres distinctes de c, s ou z et collationnées séparément; les lettres avec l' ogonek ( ą , ę , į et ų ), le macron ( ū ) et le superpoint ( ė ) sont également considérées comme des lettres séparées, mais ne reçoivent pas un ordre de collation unique.
celtique
  • Le gallois utilise le circonflexe , la diérèse , l' aigu et le grave sur ses sept voyelles a, e, i, o, u, w, y (d'où les composés â, ê, î, ô, û, ŵ, ŷ, ä, ë, ï, ö, ü, ẅ, , á, é, í, ó, ú, ẃ, , à, è, , ò, ù, ẁ, ỳ).
  • À la suite de réformes orthographiques depuis les années 1970, le gaélique écossais utilise uniquement des tombes, qui peuvent être utilisées sur n'importe quelle voyelle ( à , è , ì , ò , ù ). Autrefois, les accents aigus pouvaient être utilisés sur á, ó et é , qui étaient utilisés pour indiquer une qualité vocalique spécifique. Avec la suppression de ces accents, la nouvelle orthographe repose sur une connaissance préalable du lecteur de la prononciation d'un mot donné.
  • Manx utilise le seul diacritique ç combiné avec h pour donner le digramme ⟨çh⟩ (prononcé /tʃ/ ) pour marquer la distinction entre celui-ci et le digraphe ⟨ch⟩ (prononcé /h/ ou /x/ ). D'autres signes diacritiques utilisés en mannois comprenaient â, ê, ï, etc. pour marquer la distinction entre deux mots épelés de la même manière mais avec une prononciation légèrement différente.
  • L'irlandais n'utilise que des accents aigus pour marquer les voyelles longues, à la suite de la réforme orthographique de 1948.
  • Le breton n'a pas une seule orthographe (système d'orthographe), mais utilise des signes diacritiques à plusieurs fins. La tréma est utilisée pour marquer que deux voyelles sont prononcées séparément et non comme une diphtongue/digraphe. Le circonflexe est utilisé pour marquer les voyelles longues, mais généralement uniquement lorsque la longueur des voyelles n'est pas prévisible par la phonologie. La nasalisation des voyelles peut être marquée d'un tilde ou suivre la voyelle de la lettre <ñ>. Le suffixe pluriel -où est utilisé comme orthographe unifiée pour représenter un suffixe avec un certain nombre de prononciations dans différents dialectes, et pour distinguer ce suffixe du digraphe <ou> qui se prononce /u:/ . Une apostrophe est utilisée pour distinguer c'h, prononcé /x/ comme le digraphe <ch> est utilisé dans d'autres langues celtiques, du digraphe d'influence française ch, prononcé /ʃ/ .
finno-ougrien
  • L'estonien a une lettre distincte õ , qui contient un tilde. Les « voyelles pointées » estoniennes ä , ö , ü sont similaires à l'allemand, mais ce sont aussi des lettres distinctes, pas comme les lettres allemandes tréma. Tous les quatre ont leur propre place dans l'alphabet, entre w et x . Les carons en š ou ž n'apparaissent que dans les noms propres et les emprunts étrangers . Ce sont aussi des lettres distinctes, placées dans l'alphabet entre s et t .
  • Le finnois utilise des voyelles pointées (tréma) ( ä et ö ). Comme en suédois et en estonien, celles-ci sont considérées comme des lettres individuelles, plutôt que comme des combinaisons voyelle + tréma (comme cela se produit en allemand). Il utilise également les caractères å , š et ž dans les noms étrangers et les emprunts. Dans les alphabets finnois et suédois, å , ä et ö s'assemblent comme des lettres séparées après z , les autres comme des variantes de leur lettre de base.
  • Le hongrois utilise le tréma, l'accent aigu et double aigu (unique au hongrois) : ( ö, ü ), ( á, é, í, ó, ú ) et ( ő, ű ). L'accent aigu indique la forme longue d'une voyelle (en cas de i/í , o/ó , u/ú ) tandis que le double aigu remplit la même fonction pour ö et ü . L'accent aigu peut également indiquer un son différent (plus ouvert, comme dans le cas de a/á , e/é ). Les deux formes longues et courtes des voyelles sont énumérées séparément dans l' alphabet hongrois , mais les membres des paires a /, e / é, i / i, o / o, o / õ , u / ú et ü / û sont collationnées dans les dictionnaires comme la même lettre.
  • Livonie a les lettres suivantes: A, A, ǟ , , ë, I, L, ò, ö, ȯ , ȱ , õ , ȭ , R, S, T, U, ž .
germanique
  • Le féroïen utilise des aigus et d'autres lettres spéciales. Tous sont considérés comme des lettres distinctes et ont leur place dans l'alphabet: á , í , ó , ú , ý et ø .
  • L'islandais utilise des aigus et d'autres lettres spéciales. Tous sont considérés comme des lettres distinctes, et ont leur propre place dans l'alphabet: á , é , í , ó , ú , ý , et ö .
  • Danois et norvégiens utilisent des caractères supplémentaires comme le o-slash ø et un overring å . Ces lettres viennent après z et æ dans l'ordre ø, å . Historiquement, le å a mis au point à partir d' un ligatures en écrivant un petit exposant un sur une minuscule un ; si un å caractère est indisponible, certaines langues scandinaves permettent la substitution d'un doublé a . Les langues scandinaves collationnent ces lettres après z, mais ont des normes de collation différentes .
  • Suédois utilise une tréma ( ä ) et o-tréma ( ö ) à la place des cendres ( æ ) et o tailladé ( ø ) en plus de l'un overring ( å ). Historiquement, la tréma des lettres suédoises ä et ö , comme le tréma allemand , s'est développée à partir d'un petit e gothique écrit au-dessus des lettres. Ces lettres sont classées après z , dans l'ordre å, ä, ö .
Romance
  • En asturien , galicien et espagnol , le caractère ñ est une lettre et collationné entre n et o .
  • L'asturien utilise ( minuscule ) et ( minuscule )
  • Léonais : pourrait utiliser ñ ou nn .
  • Roumaine utilise une brève sur la lettre un ( ã ) pour indiquer le son schwa / ə / , ainsi qu'un circonflexe sur les lettres un ( â ) et i ( î ) pour le son / ɨ / . Le roumain écrit également une virgule sous les lettres s ( ș ) et t ( ț ) pour représenter respectivement les sons /ʃ/ et /t͡s/ . Ces caractères sont rassemblés après leur équivalent non diacritique.
slave
  • Les bosniaque , croate et serbe alphabets latins ont les symboles ˙c , æ , đ , š et ž , qui sont considérés comme des lettres distinctes et sont répertoriés en tant que tels dans les dictionnaires et autres contextes dans lesquels les mots sont classés par ordre alphabétique. Ils ont également un digramme comprenant un diacritique, , qui est également classé par ordre alphabétique indépendamment, et suit d et précède đ dans l'ordre alphabétique. L'alphabet cyrillique serbe n'a pas de signes diacritiques, à la place il a un graphème ( glyphe ) pour chaque lettre de son homologue latin (y compris les lettres latines avec signes diacritiques et les digrammes dž, lj et nj ).
  • L' alphabet tchèque utilise l'aigu (á é í ó ú ý), le caron ( č ď ě ň ř š ť ž ), et pour une lettre ( ů ) l'anneau. (Notez que dans ď et ť le caron est modifié pour ressembler plutôt à une apostrophe.)
  • Le polonais a les lettres suivantes : ą ć ę ł ń ó ś ź ż . Ceux - ci sont considérés comme des lettres distinctes: chacun d'eux est placé dans l'alphabet immédiatement après son homologue latin (par exemple ± entre un et b ), ź et ż sont placés après z dans cet ordre.
  • L' alphabet slovaque utilise l'accent aigu (á é í ó ú ý ĺ ŕ ), le caron (č ď ľ ň š ť ž dž), le tréma (ä) et l'accent circonflexe (ô). Toutes ces lettres sont considérées comme des lettres distinctes et sont placées directement après l'homologue d'origine dans l' alphabet .
  • L' alphabet slovène de base comporte les symboles č , š et ž , qui sont considérés comme des lettres distinctes et sont répertoriés comme tels dans les dictionnaires et autres contextes dans lesquels les mots sont répertoriés par ordre alphabétique. Les lettres avec un caron sont placées juste après les lettres telles qu'elles sont écrites sans le signe diacritique. La lettre đ peut être utilisée dans des mots étrangers non translittérés, en particulier des noms, et est placée après č et avant d .
Turc
  • Azerbaïdjan comprend les lettres distinctes de l' alphabet turc Ç , Ð , I , İ , Ö , Þ et Ü .
  • Tatars de Crimée comprend les lettres distinctes de l' alphabet turc Ç , Ð , I , İ , Ö , Þ et Ü . Contrairement au turc, le tatar de Crimée a également la lettre Ñ .
  • Gagaouzie comprend les lettres distinctes de l' alphabet turc Ç , Ð , I , İ , Ö et Ü . Contrairement au turc, le gagaouze a également les lettres Ä , Ê Ș et Ț . Þ et Ţ dérivent de l' alphabet roumain pour les mêmes sons. Parfois , le turc Þ peut être utilisé au lieu de Þ .
  • Le turc utilise un G avec une brève ( Ğ ), deux lettres avec un tréma ( Ö et Ü , représentant deux voyelles antérieures arrondies), deux lettres avec une cédille ( Ç et Ş , représentant l'affriquée /tʃ/ et la fricative /ʃ/ ), et possède également un capital en pointillés © (et un dotless minuscule ı représentant une voyelle arrière haute unrounded). En turc, chacune d'entre elles sont des lettres distinctes, plutôt que des versions d'autres lettres, où la majuscule pointée İ et la minuscule i sont la même lettre, tout comme la majuscule sans point I et la minuscule ı . Typographiquement , Ç et Ş sont parfois rendus avec un sous-point, comme dans ; lorsqu'un crochet est utilisé, il a tendance à avoir plus une forme de virgule que la cédille habituelle. Les nouveaux alphabets azerbaïdjanais, tatar de Crimée et gagaouze sont basés sur l'alphabet turc et ses mêmes lettres diacritiques, avec quelques ajouts.
  • Turkmène comprend les lettres distinctes de l' alphabet turc Ç , Ö , Þ et Ü . En outre, turkmène utilise un tréma ( Ä ) pour représenter / æ / , N caron ( Ň ) pour représenter l' nasale vélaire / N / Y avec aigu ( Ý ) pour représenter le palatal approximant / j / , et Z avec caron ( Ž ) pour représenter /ʒ/ .
Autre
  • L'albanais a deux lettres spéciales Ç et Ë majuscule et minuscule. Ils sont placés à côté des lettres les plus similaires de l'alphabet, c et e en conséquence.
  • Espéranto a les symboles û , ĉ , ĝ , ĥ , ĵ et ŝ , qui sont inclus dans l'alphabet, et considérés comme des lettres distinctes.
  • Le philippin a également le caractère ñ sous forme de lettre et est classé entre n et o.
  • L'hawaïen utilise le kahakō ( macron ) sur les voyelles, bien qu'il y ait un certain désaccord sur le fait de les considérer comme des lettres individuelles. Le kahakō sur une voyelle peut changer complètement le sens d'un mot qui s'écrit de la même manière mais sans le kahakō.
  • Kurde utilise les symboles Ç , Ê , Î ï , Þ et Û avec 26 autres standards symboles de l' alphabet latin.
  • Lakota alphabet utilise le caron pour les lettres de , Ȟ , Ǧ , š et ž . Il utilise également l' accent aigu pour les voyelles accentuées á, é, í, ó, ú, áŋ, íŋ, úŋ.
  • Le malais utilise des signes diacritiques tels que á, ā, ç, í, ñ, ó, š, ú . Les utilisations de diacritiques a été poursuivie jusqu'à la fin du 19ème siècle , sauf â et ē .
  • Le maltais utilise un C, un G et un Z avec un point dessus (Ċ, Ġ, Ż), et a également un H avec une barre horizontale supplémentaire. Pour le H majuscule, la barre supplémentaire est écrite légèrement au-dessus de la barre habituelle. H minuscules, la barre supplémentaire est écrite traverse la verticale, comme un t , et ne pas toucher la partie inférieure ( Ħ , H). Les caractères ci-dessus sont considérés comme des lettres distinctes. La lettre « c » sans point n'est plus utilisée en raison de la redondance. 'Ċ' se prononce comme le 'ch' anglais et 'k' est utilisé comme un c dur comme dans 'cat'. 'Ż' se prononce exactement comme le 'Z' anglais comme dans 'Zebra', tandis que 'Z' est utilisé pour faire le son de 'ts' en anglais (comme 'tsunami' ou 'maths'). 'Ġ' est utilisé comme un 'G' doux comme dans 'géométrie', tandis que le 'G' sonne comme un 'G' dur comme dans 'log'. Le digraphe 'għ' (appelé għajn d' après le nom de la lettre arabe ' ayn pour غ) est considéré comme séparé, et parfois ordonné après 'g', tandis que dans d'autres volumes il est placé entre 'n' et 'o' (la lettre latine 'o ' a évolué à l'origine à partir de la forme du phénicien ʻayin , qui était traditionnellement collationné après le phénicien nūn ).
  • La romanisation du syriaque utilise les lettres altérées de. Ā , Č , , Ē , Ë , ¯g , ¯h , Ò , © , š , , Ū , Ž aux côtés des 26 standards des symboles de l' alphabet latin.
  • Le vietnamien utilise le signe diacritique de la corne pour les lettres ơ et ư ; le circonflexe pour les lettres â , ê et ô ; la brève pour la lettre ă ; et une barre à travers la lettre đ . Séparément, il a également á, à, ả, ã et ạ, les cinq tons utilisés pour les voyelles en plus du ton plat 'a'.

Lettres cyrilliques

  • Le biélorusse et le cyrillique ouzbek ont une lettre ў .
  • Le biélorusse, le bulgare , le russe et l'ukrainien ont la lettre й .
  • Le biélorusse et le russe ont la lettre ё . En russe, cette lettre est généralement remplacée par е , bien qu'elle ait une prononciation différente. L'utilisation de е au lieu de ё n'affecte pas la prononciation. Ё est toujours utilisé dans les livres pour enfants et dans les dictionnaires. Une paire minimale est все ( vs'e , "tout le monde" pl.) et всё ( vs'o , "tout" n. sg.). En biélorusse, le remplacement par е est une erreur; en russe, il est permis d'utiliser е ou ё pour ё mais le premier est plus courant dans l'écriture de tous les jours (par opposition à l'écriture pédagogique ou juvénile).
  • L' alphabet cyrillique ukrainien a les lettres ґ , й et ї . Latynka ukrainienne en a beaucoup plus.
  • Le macédonien a les lettres ќ et ѓ .
  • En bulgare et macédonien le pronom possessif ѝ ( ì , « elle ») est écrit avec un accent grave afin de le distinguer de la conjonction и ( i , « et »).
  • L'accent aigu " ́ " au-dessus de n'importe quelle voyelle dans les alphabets cyrilliques est utilisé dans les dictionnaires, les livres pour enfants et les apprenants étrangers pour indiquer le mot accent, il peut également être utilisé pour la désambiguïsation de mots de même orthographe avec des accents lexicaux différents.

Diacritiques qui ne produisent pas de nouvelles lettres

Le tableau noir utilisé en classe à Harvard montre les efforts des étudiants pour placer le ü et l'accent diacritique aigu utilisé dans l'orthographe espagnole .

Anglais

L'anglais est l'une des rares langues européennes qui n'a pas beaucoup de mots contenant des signes diacritiques. Au lieu de cela, les digrammes sont la principale façon dont l'alphabet anglais moderne adapte le latin à ses phonèmes. Les exceptions sont les emprunts étrangers non assimilés, y compris les emprunts au français et, de plus en plus, à l' espagnol comme jalapeño ; cependant, le diacritique est aussi parfois omis de ces mots. Les mots d'emprunt qui apparaissent fréquemment avec le signe diacritique en anglais incluent café , résumé ou résumé (un usage qui permet de le distinguer du verbe reprendre ), soufflé et naïveté (voir les termes anglais avec signes diacritiques ). Dans la pratique plus ancienne (et même parmi certains écrivains modernes orthographiquement conservateurs), on peut voir des exemples tels que élite , mêlée et rôle.

Les anglophones et les écrivains utilisaient autrefois la diérèse plus souvent que maintenant dans des mots tels que coopération (de Fr. coopération ), zoologie (de Grk. zoologia ) et seeër (maintenant plus communément see-er ou simplement voyant ) comme un moyen d'indiquer que les voyelles adjacentes appartenaient à des syllabes séparées, mais cette pratique est devenue beaucoup moins courante. Le magazine New Yorker est une publication majeure qui continue d'utiliser la tréma au lieu d'un trait d'union pour plus de clarté et d'économie d'espace.

Quelques mots anglais, hors contexte, ne peuvent être distingués des autres que par une lettre diacritique ou modifiée, notamment exposé, lamé, maté, öre, øre, pâté et rosé. Il en est de même pour CV, alternativement CV, mais néanmoins il est régulièrement orthographié CV . En quelques mots, des signes diacritiques qui n'existaient pas dans l'original ont été ajoutés pour la désambiguïsation, comme dans maté (de Sp. et Port. mate ), saké (la romanisation standard du japonais n'a pas de marque d'accent), et Malé (de Dhivehi މާލެ), pour les distinguer clairement des mots anglais "mate", "sake" et "male".

Les accents aigus et graves sont parfois utilisés dans la poésie et les paroles: les aigus pour indiquer le stress ouvertement où il pourrait être ambigu ( REBEL contre REBEL ) ou non standard pour des raisons versifiés ( civils ), la tombe pour indiquer qu'une syllabe ordinaire silencieuse ou élision se prononce ( prévenu, parlìament ).

Dans certains noms de personne comme Renée et Zoë , souvent deux orthographes existent, et la préférence ne sera connue que des proches de la personne elle-même. Même lorsque le nom d'une personne est orthographié avec un signe diacritique, comme Charlotte Brontë, cela peut être supprimé dans des articles en anglais et même dans des documents officiels tels que des passeports, soit par négligence, le dactylographe ne sachant pas comment saisir des lettres avec des signes diacritiques, ou pour des raisons techniques — la Californie , par exemple, n'autorise pas les noms avec signes diacritiques, car le système informatique ne peut pas traiter de tels caractères. Ils apparaissent également dans certaines dénominations sociales et/ou marques commerciales mondiales telles que Nestlé ou Citroën .

Autres langues

Les langues suivantes ont des combinaisons lettre-diacritique qui ne sont pas considérées comme des lettres indépendantes.

  • L'afrikaans utilise une diérèse pour marquer les voyelles qui sont prononcées séparément et non comme on pourrait s'y attendre lorsqu'elles se produisent ensemble, par exemple voel (sentir) par opposition à voël (oiseau). Le circonflexe est utilisé dans ê, î, ô et û généralement pour indiquer à long gros moyen , par opposition à plein milieu voyelles, par exemple dans les mots Wereld (monde) et Moré (matin, demain). L'accent aigu est utilisé pour ajouter de l'emphase de la même manière que le soulignement ou l'écriture en gras ou en italique en anglais, par exemple Dit is jóú boek (C'est votre livre). L'accent grave est utilisé pour distinguer des mots qui ne diffèrent que par le placement de l'accent, par exemple appel (pomme) et appèl (appel) et dans quelques cas où il ne fait aucune différence pour la prononciation mais distingue les homophones. Les deux cas les plus courants de ces derniers sont dans les dictons òf... òf (soit... ou) et nòg... nòg (ni... ni) pour les distinguer de of (ou) et nog (encore, toujours).
  • Aymara utilise une corne diacritique sur p, q, t, k, ch .
  • Le catalan a les caractères composites suivants : à, ç, é, è, í, ï, ó, ò, ú, ü, l·l . L' aigu et le grave indiquent l' accent et la hauteur des voyelles , la cédille marque le résultat d' une palatalisation historique , la tréma indique soit un hiatus , soit que la lettre u se prononce lorsque les graphèmes gü , qü sont suivis de e ou i , l' interponctuel (·) distingue les différentes valeurs de ll/l·l .
  • Certaines orthographes du cornique telles que Kernowek Standard et Unified Cornish utilisent des signes diacritiques, tandis que d'autres comme Kernewek Kemmyn et le Standard Written Form ne les utilisent pas (ou ne les utilisent qu'en option dans le matériel pédagogique).
  • Le néerlandais utilise la diérèse. Par exemple, dans ruïne cela signifie que le u et le i sont prononcés séparément de leur manière habituelle, et non de la manière dont la combinaison ui se prononce normalement. Ainsi, il fonctionne comme un signe de séparation et non comme une indication pour une version alternative du i . Les signes diacritiques peuvent être utilisés pour l'emphase ( érg koud pour très froid) ou pour lever l'ambiguïté entre plusieurs mots qui s'épellent de la même façon lorsque le contexte n'indique pas le sens correct ( één appel = une pomme, een appel = une pomme ; vóórkomen = se produire, voorkómen = empêcher). Les accents graves et aigus sont utilisés sur un très petit nombre de mots, principalement des emprunts. Le ç apparaît également dans certains emprunts.
  • féroïen . Les lettres accentuées non féroïennes ne sont pas ajoutées à l'alphabet féroïen. Ceux - ci comprennent é , ö , ü , å et récemment aussi des lettres comme š , ł et æ .
  • Le philippin a les caractères composites suivants : á, à, â, é, è, ê, í, ì, î, ó, ò, ô, ú, ù, û . L'utilisation réelle de signes diacritiques pour le philippin est cependant rare, destinée uniquement à distinguer les homonymes avec des accents et des significations différents qui se produisent soit à proximité les uns des autres dans un texte, soit pour aider le lecteur à déterminer son sens autrement ambigu. La lettre eñe est due à l'alphabet espagnol et est également considérée comme une lettre distincte. Les signes diacritiques apparaissent dans les emprunts et les noms espagnols si l'orthographe espagnole est observée.
  • finnois . Les carons dans š et ž n'apparaissent que dans les noms propres étrangers et les emprunts , mais peuvent être remplacés par sh ou zh si et seulement s'il est techniquement impossible de produire des lettres accentuées dans le médium. Contrairement à l'estonien, š et ž ne sont pas considérés comme des lettres distinctes en finnois.
  • Le français utilise cinq signes diacritiques. Le grave ( accent grave ) marque le son /ɛ/ lorsqu'il est au-dessus d'un e, comme dans père ("père") ou est utilisé pour distinguer des mots qui sont par ailleurs des homographes tels qu'un / à ("a"/"à") ou ou / ("ou"/"où"). L' aigu ( accent aigu ) n'est utilisé qu'en "é", en modifiant le "e" pour faire le son /e/ , comme dans étoile ("étoile"). Le circonflexe ( accent circonflexe ) désigne généralement qu'un S suivait autrefois la voyelle en ancien français ou en latin, comme dans fête (« party »), l'ancien français étant feste et le latin étant festum . Que le circonflexe modifie la prononciation de la voyelle dépend du dialecte et de la voyelle. La cédille ( cédille ) indique qu'un "c" normalement dur (avant les voyelles "a", "o" et "u") doit être prononcé /s/ , comme dans ça ("ça"). Le tréma ( tréma ) indique que deux voyelles adjacentes qui devraient normalement être prononcé comme une doivent être marquées séparément, comme dans Noël ( « Noël »).
  • Galicien voyelles peuvent supporter un aigu ( á, é, í, ó, ú ) pour indiquer le stress ou la différence entre les deux autrement mêmes mots écrits ( e , « est » par rapport à e , « et »), mais le tréma ( Trema ) est utilisé uniquement avec ï et ü pour afficher deux voyelles distinctes dans la prononciation. Ce n'est que dans des mots étrangers que le galicien peut utiliser d'autres signes diacritiques tels que ç (commun au Moyen Âge), ê , ou à .
  • L'allemand utilise les trois caractères tréma ä , ö et ü . Ces signes diacritiques indiquent des changements de voyelles. Par exemple, le mot Ofen [ˈoːfən] "four" a le pluriel Öfen [ˈøːfən] . La marque a pour origine un exposant e ; une lettre noire manuscrite e ressemble à deux lignes verticales parallèles, comme une tréma. En raison de cet historique, "ä", "ö" et "ü" peuvent être écrits comme "ae", "oe" et "ue" respectivement, si les lettres tréma ne sont pas disponibles.
  • L'hébreu a de nombreux signes diacritiques connus sous le nom de niqqud qui sont utilisés au-dessus et au-dessous du script pour représenter les voyelles. Celles-ci doivent être distinguées de la cantillation , qui sont des clés de prononciation et de syntaxe.
  • L' alphabet phonétique international utilise des symboles et des caractères diacritiques pour indiquer des caractéristiques phonétiques ou des articulations secondaires.
  • L'irlandais utilise l'aigu pour indiquer qu'une voyelle est longue : á , é , í , ó , ú . Il est connu sous le nom de síneadh fada "signe long" ou simplement fada "long" en irlandais. Dans le plus ancien de type gaélique , overdots sont utilisés pour indiquer lenition d'une consonne: ˙B , ċ , , ¯F , ġ , , , š , .
  • Italienne a principalement aiguë et la tombe ( à , è / é , ì , ò / ó , Ù ), généralement pour indiquer une syllabe accentuée qui ne serait pas souligné dans les règles normales de prononciation , mais parfois aussi de faire la distinction entre les mots qui sont autrement orthographié de la même manière (par exemple "e", et; "è", est). Malgré son usage rare, l'orthographe italienne autorise aussi le circonflexe (î), dans deux cas : on le retrouve dans le contexte littéraire ancien (jusqu'au XIXe siècle environ) pour signaler une syncope (fêro→fecero, ils l'ont fait), ou dans le Italien pour signaler la contraction de ″-ii″ due à la terminaison plurielle -i alors que la racine se termine par un autre -i; par exemple, l' art. démonio, p. démonii→démonî; dans ce cas le circonflexe signale aussi que le mot visé n'est pas demoni, pluriel de « démone » en décalant l'accent (demònî, « diables » ; dèmoni, « démons »).
  • Le lituanien utilise l' aigu , le grave et le tilde dans les dictionnaires pour indiquer les types d' accentuation dans le système d' accent tonique de la langue .
  • Le maltais utilise également la grave sur ses voyelles pour indiquer l'accentuation à la fin d'un mot de deux syllabes ou plus :– lettres minuscules : à, è, ì, ò, ù ; lettres majuscules : À, È, , Ò, Ù
  • Les maoris utilisent des macrons pour marquer les voyelles longues.
  • L'occitan a les caractères composites suivants : á, à, ç, é, è, í, ï, ó, ò, ú, ü, n·h, s·h . L'aigu et le grave indiquent l' accent et la hauteur des voyelles , la cédille marque le résultat d'une palatalisation historique , la tréma indique soit un hiatus , soit que la lettre u se prononce lorsque les graphèmes gü, qü sont suivis de e ou i , et le interpunct (·) distingue les différentes valeurs de nh/n·h et sh/s·h (c'est-à-dire que les lettres sont censées être prononcées séparément, non combinées en "ny" et "sh").
  • Le portugais a les caractères composites suivants : à, á, â, ã, ç, é, ê, í, ó, ô, , ú . L'aigu et le circonflexe indiquent l'accent et la hauteur des voyelles, le grave indique la crase, le tilde représente la nasalisation et la cédille marque le résultat d'une lénition historique.
  • Les aigus sont également utilisés dans les dictionnaires et les manuels de langue slave pour indiquer l'accent lexical , placé sur la voyelle de la syllabe accentuée. Cela peut également servir à lever l'ambiguïté (par exemple, en russe писа́ть ( pisáť ) signifie "écrire", mais пи́сать ( písať ) signifie " pisser"), ou " бо́льшая часть " (la plus grande partie) vs " больша́я часть " ( la grande partie).
  • L'espagnol utilise l'aigu et la diérèse. L'aigu est utilisé sur une voyelle dans une syllabe accentuée dans les mots avec des motifs d'accent irréguliers. Il peut également être utilisé pour "casser" une diphtongue comme dans tío (prononcé [ˈti.o] , plutôt que [ˈtjo] comme ce serait sans l'accent). De plus, l'aigu peut être utilisé pour distinguer des mots qui autrement s'écrivent de la même manière, tels que si ("si") et ("oui"), et aussi pour distinguer les pronoms interrogatifs et exclamatifs des homophones ayant une fonction grammaticale différente, tels que donde/¿dónde ? ("où"/"où ?") ou como/¿cómo ? ("un spectacle?"). La aiguë peut également être utilisé pour éviter toute ambiguïté typographique, comme dans 1 O 2 ( « 1 ou 2 », le tréma est utilisé uniquement sur sans aiguë cela pourrait être interprété comme « 1 0 2 ». U ( ü ) pour qu'il être prononcé [w] dans les combinaisons gue et gui,u est normalement silencieux, par exemple ambigüedad. dans la poésie, le tréma peut être utilisé sur i et u comme un moyen pour forcer un hiatus. comme annoncé précédemment, nasale ñ la tilde (gribouillis) n'est pas du tout considéré comme un signe diacritique, mais comme une partie composite d'un glyphe distinct, avec son propre chapitre dans le dictionnaire : un glyphe qui désigne la 15e lettre de l'alphabet espagnol.
  • Le suédois utilise l' aigu pour montrer un stress non standard, par exemple dans kafé (café) et résumé (résumé). Cela aide parfois à résoudre des ambiguïtés, telles que ide (hibernation) contre idé (idée). En ces termes, l'aigu n'est pas facultatif. Certains noms propres utilisent des signes diacritiques non standard, comme Carolina Klüft et Staël von Holstein . Pour les mots empruntés à l'étranger, les accents originaux sont fortement recommandés, à moins que le mot n'ait été infusé dans la langue, auquel cas ils sont facultatifs. D'où crème fraîche mais ampère . Le suédois a également les lettres å , ä et ö , mais celles-ci sont considérées comme des lettres distinctes, pas a et o avec des signes diacritiques.
  • Le tamoul n'a pas de signes diacritiques en soi, mais utilise les chiffres arabes 2, 3 et 4 comme signes diacritiques pour représenter les consonnes aspirées, voisées et aspirées lorsque l'écriture tamoule est utilisée pour écrire de longs passages en sanskrit .
  • Le thaï a son propre système de signes diacritiques dérivés des chiffres indiens , qui désignent des tons différents .
  • Le vietnamien utilise l'aigu ( dấu sắc ), le grave ( dấu huyền ), le tilde ( dấu ngã ), l'underdot ( dấu nặng ) et le hoi ( dấu hỏi ) sur les voyelles comme indicateurs de ton .
  • Le gallois utilise le circonflexe, la diérèse, l'aigu et le grave sur ses sept voyelles a, e, i, o, u, w, y . Le plus courant est le circonflexe (qu'il appelle bach , qui signifie « petit toit », ou acen grom « accent tordu », ou hirnod « signe long ») pour désigner une voyelle longue, généralement pour la désambiguïser d'un mot similaire avec un voyelle courte. L'accent grave plus rare a l'effet inverse, raccourcissant les sons de voyelles qui seraient généralement prononcés longtemps. L'accent aigu et la diérèse sont également parfois utilisés, pour désigner respectivement l'accent et la séparation des voyelles. Le w -circumflex et le y -circumflex sont parmi les caractères les plus couramment accentués en gallois, mais inhabituels dans les langues en général, et étaient jusqu'à récemment très difficiles à obtenir dans les documents de traitement de texte et HTML.

Translitération

Plusieurs langues qui ne s'écrivent pas avec l'alphabet romain sont translittérées ou romanisées à l'aide de signes diacritiques. Exemples:

  • L'arabe a plusieurs romanisations , selon le type d'application, la région, le public visé, le pays, etc. beaucoup d'entre eux utilisent abondamment les signes diacritiques, par exemple, certaines méthodes utilisent un sous-point pour rendre les consonnes emphatiques (ṣ, ṭ, ḍ, ẓ, ḥ ). Le macron est souvent utilisé pour rendre les voyelles longues. š est souvent utilisé pour /ʃ/ , ġ pour /ɣ/ .
  • Le chinois a plusieurs romanisations qui utilisent le tréma, mais uniquement sur u ( ü ). En Hanyu Pinyin , les quatre tons du chinois mandarin sont désignés par les signes diacritiques macron (premier ton), aigu (deuxième ton), caron (troisième ton) et grave (quatrième ton). Exemple : ā, á, , à .
  • Le japonais romanisé ( Rōmaji ) utilise parfois des macrons pour marquer les voyelles longues. Le système de romanisation Hepburn utilise des macrons pour marquer les voyelles longues , et les systèmes Kunrei-shiki et Nihon-shiki utilisent un circonflexe .
  • Le sanskrit , ainsi que bon nombre de ses descendants, comme l' hindi et le bengali , utilise un système de romanisation sans perte , IAST . Cela comprend plusieurs lettres avec des marques diacritiques, telles que le macron (ā, ī, ū), les sur- et les sous-points (ṛ, ḥ, , ṇ, ṣ, ṭ, ḍ) ainsi que quelques autres (ś, ñ) .

Limites

Orthographique

Le plus grand nombre de signes diacritiques de combinaison requis pour composer un caractère valide dans n'importe quelle langue Unicode est probablement 8, pour le "groupe de graphèmes bien connu dans les scripts tibétains et ranjana", ཧྐྵྨླྺྼྻྂ , ou HAKṢHMALAWARAYAṀ.

C'est U+0F67 U+0F90 U+0FB5 U+0FA8 U+0FB3 U+0FBA U+0FBC U+0FBB U+0F82, ou :
LETTRE TIBETAINE HA + LETTRE TIBETAINE SUBJOINTE KA + LETTRE TIBETAINE SUBJOINTE SSA + LETTRE TIBETAINE SUBJOINTE MA + LETTRE TIBETAINE JOINTE LA + LETTRE TIBETAINE JOINTE DE FORME FIXE WA + LETTRE TIBETAINE JOINTE DE FORME FIXE RA + LETTRE TIBETAINE JOINTE DE FORME FIXE YA + SIGNE TIBETAIN NYI ZLA NAA DA.

Non orthographique/ornemental

Certains utilisateurs ont exploré les limites du rendu dans les navigateurs Web et autres logiciels en « décorant » des mots avec plusieurs signes diacritiques absurdes par caractère. Le résultat s'appelle " Zalgo text ". Les faux caractères et mots composés peuvent être copiés et collés normalement via le presse-papiers du système.




Exemple : c̳̻͚̻̩̻͉̯̄̏͑̋͆̎͐ͬ͑͌́͢h̵͔͈͍͇̪̯͇̞͖͇̜͉̪̪̤̙ͧͣ̓̐̓ͤ͋͒ͥ͑̆͒̓͋̑́͞ǎ̡̮̤̤̬͚̝͙̞͎̇ͧ͆͊ͅo̴̲̺͓̖͖͉̜̟̗̮̳͉̻͉̫̯̫̍̋̿̒͌̃̂͊̏̈̏̿ͧ́ͬ̌ͥ̇̓̀͢͜s̵̵̘̹̜̝̘̺̙̻̠̱͚̤͓͚̠͙̝͕͆̿̽ͥ̃͠͡

Voir également

Les références

Liens externes