Thésaurus Linguae Graecae - Thesaurus Linguae Graecae

Le Thesaurus Linguae Graecae ( TLG ) est un centre de recherche de l' Université de Californie à Irvine . Le TLG a été fondé en 1972 par Marianne McDonald (une étudiante diplômée à l'époque et maintenant professeur de théâtre et de lettres classiques à l' Université de Californie à San Diego ) dans le but de créer une collection numérique complète de tous les textes survivants écrits en grec à partir de l'antiquité à l'époque actuelle. Depuis 1972, le TLG a collecté et numérisé la plupart des textes littéraires conservés écrits en grec depuis Homère jusqu'à la chute de Constantinople en 1453 de notre ère et au-delà. Theodore Brunner (1934-2007) a dirigé le projet de 1972 jusqu'à sa retraite de l'Université de Californie en 1998. Maria Pantelia , également professeure de lettres classiques à l'UC Irvine, a succédé à Theodore Brunner en 1998, et dirige le TLG depuis. Le nom de TLG est partagé avec sa base de données en ligne, dont le titre complet est Thesaurus Linguae Graecae: A Digital Library of Greek Literature (le TLG , en italique, en abrégé).

Le défi de cette énorme entreprise a été relevé à l'origine avec l'aide de plusieurs classiques et experts en technologie, mais principalement grâce aux efforts de David W. Packard et de son équipe qui ont créé le système Ibycus, le matériel et les logiciels utilisés à l'origine pour relire et rechercher le corpus. . Packard a également développé le code bêta , une convention de codage de caractères et de formatage utilisée pour coder le grec polytonique . La collection a d'abord été diffusée sur CD-ROM . Le premier CD-ROM est sorti en 1985 et était le premier disque compact ne contenant pas de musique. Les versions suivantes ont été publiées en 1988 et en 1992, grâce au support technique fourni par Packard.

À la fin des années 1990, il est devenu évident que l'ancienne technologie Ibycus était obsolète. Sous la direction du professeur Maria Pantelia, un certain nombre de nouveaux projets ont été entrepris, notamment la migration massive d'Ibycus, le développement d'un nouveau système pour numériser, relire et gérer la collection textuelle, un nouveau CD-ROM (TLG E) , publié en 1999, et finalement le déplacement du corpus vers l'environnement Web en 2001. Dans le même temps, le TLG a commencé à travailler avec le comité technique Unicode pour inclure tous les caractères nécessaires à l'encodage et à l'affichage du grec dans la norme Unicode. Le corpus continue d'être considérablement élargi pour inclure des textes byzantins , médiévaux et éventuellement grecs modernes . Des projets plus récents incluent la lemmatisation du corpus grec (2006) - une entreprise importante, étant donné la nature très infléchie du grec et la complexité du corpus, couvrant plus de deux millénaires de développement littéraire - et le grec en ligne Liddell-Scott-Jones –English Lexicon (communément appelé le LSJ), publié en février 2011.

Depuis 2001, le corpus TLG est consultable en ligne par les membres des institutions adhérentes, qui sont près de 1500 dans le monde. Toutes les informations bibliographiques et un sous-ensemble des textes sont accessibles au grand public.

Le nombre de mots grecs dans le corpus s'élève à 110 millions, tandis que le nombre de formes de mots uniques s'élève à 1,6 million et le nombre de lemmes uniques à 250 000.

Voir également

Les références

Liens externes