Gérard Salton - Gerard Salton

Gérard Salton
( 08/03/1927 ) 8 mars 1927
Décédés 28 août 1995 (28/08/1995) (à 68 ans)
mère nourricière Université de Harvard
Connu pour le père de la recherche d'information
Gerard Salton Award
Carrière scientifique
Des champs récupération de l'information
Les institutions L'Université de Cornell
Thèse Un système de traitement automatique des données pour la comptabilité des recettes des services publics   (1958)
Conseiller doctoral Howard Aiken
Doctorants

Gerard A. "Gerry" Salton (8 mars 1927 à Nuremberg - 28 août 1995), était professeur d' informatique à l'Université Cornell . Salton était peut-être le principal informaticien travaillant dans le domaine de la recherche d'informations à son époque, et "le père de la recherche d'informations". Son groupe à Cornell a développé le SMART Information Retrieval System , qu'il a lancé lorsqu'il était à Harvard. C'était le tout premier système à utiliser le modèle d'espace vectoriel désormais populaire pour la recherche d'informations.

Salton est né Gerhard Anton Sahlmann le 8 mars 1927 à Nuremberg, en Allemagne . Il a obtenu une licence (1950) et une maîtrise (1952) en mathématiques du Brooklyn College et un doctorat. de Harvard en mathématiques appliquées en 1958, le dernier des doctorants de Howard Aiken , et y enseigna jusqu'en 1965, date à laquelle il rejoignit l'Université Cornell et cofonda son département d'informatique.

Salton était peut-être le plus connu pour avoir développé le modèle d'espace vectoriel désormais largement utilisé pour la recherche d'informations. Dans ce modèle, les documents et les requêtes sont représentés comme des vecteurs du nombre de termes, et la similitude entre un document et une requête est donnée par le cosinus entre le vecteur de terme et le vecteur de document. Dans cet article, il a également présenté TF-IDF , ou fréquence-terme-fréquence-inverse-document, un modèle dans lequel le score d'un terme dans un document est le rapport du nombre de termes dans ce document divisé par la fréquence de la nombre de documents dans lesquels ce terme apparaît. (Le concept de fréquence inverse des documents, une mesure de spécificité, avait été introduit en 1972 par Karen Sparck-Jones .) Plus tard dans sa vie, il s'est intéressé à la synthèse et à l'analyse automatiques de texte, ainsi qu'à la génération automatique d'hypertexte. Il a publié plus de 150 articles de recherche et 5 livres au cours de sa vie.

Salton a été rédacteur en chef des Communications de l'ACM et du Journal de l'ACM , et a présidé le Groupe d'Intérêt Spécial sur la Recherche d'Informations (SIGIR). Il était rédacteur en chef adjoint de ACM Transactions on Information Systems . Il a été membre de l' ACM (élu en 1995), a reçu un prix du mérite de l' American Society for Information Science (1989) et a été le premier récipiendaire du prix SIGIR pour ses contributions exceptionnelles à l'étude de la recherche d'information (1983) - maintenant appelé le prix Gerard Salton .

Bibliographie

  • Salton, Organisation et récupération automatique des informations , 1968.
  • Gérard Salton (1975). Une théorie de l'indexation . Société de mathématiques industrielles et appliquées. p.  56 .
  • --- et Michael J. McGill, Introduction to modern Information Retrieval , 1983. ISBN   0-07-054484-0
  • Gérard Salton (1989). Traitement automatique du texte . Société d'édition Addison-Wesley. p.  530 . ISBN   978-0-201-12227-5 .
  • Gerard Salton chez DBLP Bibliography Server Modifiez ceci sur Wikidata
  • G. Salton, A. Wong et CS Yang (1975), « Un modèle d'espace vectoriel pour l'indexation automatique », Communications de l'ACM , vol. 18, nr. 11, pages 613–620. (Article dans lequel un modèle d'espace vectoriel a été présenté)

Voir également

Références

Liens externes

  • En mémoire
  • Fractales du changement: recherche dans le chemin de la mémoire
  • L'article le plus influent Gerard Salton n'a jamais écrit - Cet article de 2004 sur les tendances de la bibliothèque de David Dubin sert de revue historique de la métamorphose du terme modèle de valeur de discrimination (TDV) en modèle d'espace vectoriel en tant que modèle de recherche d'informations (VSM en tant que modèle IR ). Cet article remet en question ce que la communauté de recherche sur la recherche d'information pensait que le modèle d'espace vectoriel de Salton était à l'origine destiné à modéliser. Ce qui est devenu beaucoup plus tard un modèle de recherche d’informations était à l’origine un modèle de calcul mathématique centré sur les données utilisé comme un outil explicatif. De plus, l'article de Dubin souligne qu'un article de Salton de 1975 souvent cité n'existe pas mais qu'il est probablement une combinaison de deux autres articles, dont aucun ne fait en fait référence au VSM comme modèle IR.