FrameNet - FrameNet

FrameNet
Énoncé de mission Construire une base de données lexicale basée sur une théorie du sens appelée Frame Semantics .
Commercial? Non (disponible gratuitement en téléchargement)
Type de projet Base de données lexicale (contenant : cadres, éléments de cadre (FE), unités lexicales (LU), exemples de phrases et relations de cadre)
Emplacement Institut international d'informatique à Berkeley, Californie
Propriétaire Collin Baker (actuel chef de projet)
Fondateur Charles J. Fillmore
Établi 1997 ; il y a 24 ans ( 1997 )
Site Internet framenet .icsi .berkeley .edu

En linguistique informatique , FrameNet est un projet hébergé à l' International Computer Science Institute de Berkeley, en Californie, qui produit une ressource électronique basée sur une théorie du sens appelée sémantique des cadres . FrameNet révèle par exemple que la phrase « John a vendu une voiture à Marie » décrit essentiellement la même situation de base (cadre sémantique) que « Marie a acheté une voiture à John », juste d'un point de vue différent. Un cadre sémantique peut être considéré comme une structure conceptuelle décrivant un événement, une relation ou un objet et ses participants. La base de données lexicale FrameNet contient plus de 1 200 cadres sémantiques , 13 000 unités lexicales (un appariement d'un mot avec un sens ; les mots polysémiques sont représentés par plusieurs unités lexicales ) et 202 000 exemples de phrases. FrameNet est en grande partie la création de Charles J. Fillmore , qui a développé la théorie de la sémantique des cadres sur laquelle le projet est basé, et était initialement le chef de projet lorsque le projet a commencé en 1997. Collin Baker est devenu le chef de projet en 2000. Le projet FrameNet a eu une influence à la fois sur la linguistique et le traitement du langage naturel, où il a conduit à la tâche d' étiquetage automatique des rôles sémantiques .

notions

Cadres

Un cadre est une représentation schématique d'une situation impliquant divers participants, accessoires et autres rôles conceptuels. Des exemples de noms de trame sont Being_bornet Locative_relation. Un cadre dans FrameNet contient une description textuelle de ce qu'il représente (une définition de cadre), des éléments de cadre associés, des unités lexicales, des exemples de phrases et des relations de cadre à cadre.

Éléments de cadre

Les éléments de trame (FE) fournissent des informations supplémentaires à la structure sémantique d'une phrase. Chaque trame a un certain nombre d'entités fonctionnelles centrales et non centrales qui peuvent être considérées comme des rôles sémantiques. Les entités fonctionnelles centrales sont essentielles à la signification de la trame, tandis que les entités fonctionnelles non centrales sont généralement descriptives (comme l'heure, le lieu, la manière, etc.).

Voici quelques exemples :

  • Le seul noyau FE de la Being_borntrame est appelé Child; les entités fonctionnelles non centrales étant Time, Place, Relatives, etc.
  • Les entités fonctionnelles principales du Commerce_goods-transfercomprennent les Seller, Buyer, Goods, entre autres, tandis que les entités fonctionnelles non centrales comprennent les Place, Purpose, etc.

FrameNet inclut des données superficielles sur les rôles syntaxiques que jouent les éléments de cadre dans les exemples de phrases. Par exemple, pour une phrase comme "Elle est née vers l'AD 460", FrameNet marquerait "Elle" comme un syntagme nominal faisant référence à l' ChildEF et "environ AD 460" comme un syntagme nominal correspondant à l' Timeélément frame. Les détails sur la façon dont les éléments de cadre peuvent être réalisés dans une phrase sont importants car cela révèle des informations importantes sur les cadres de sous - catégorisation ainsi que sur les alternances possibles de diathèse (par exemple, "John a cassé la fenêtre" vs.

Unités lexicales

Les unités lexicales (LU) sont des lemmes, avec leur partie du discours, qui évoquent un cadre spécifique. En d'autres termes, lorsqu'une LU est identifiée dans une phrase, cette LU spécifique peut être associée à sa ou ses trames spécifiques. Pour chaque trame, il peut y avoir de nombreuses LU associées à cette trame, et il peut également y avoir de nombreuses trames qui partagent une LU spécifique, c'est généralement le cas avec les LU qui ont plusieurs sens de mot. A côté du cadre, chaque unité lexicale est associée à des éléments de cadre spécifiques au moyen des exemples de phrases annotés.

Exemple:

Les unités lexicales qui évoquent le Complainingcadre (ou des versions perspectivisées plus spécifiques de celui-ci, pour être précis), incluent les verbes « se plaindre », « grouse », « se plaindre » et autres.

Exemples de phrases

Les cadres sont associés à des exemples de phrases et les éléments de cadre sont marqués dans les phrases. Ainsi, la phrase

Elle est née vers 460 après JC

est associé au cadre Being_born, tandis que "Elle" est marqué comme élément de cadre Childet "environ AD 460" est marqué comme Time. (Voir le rapport d'annotation FrameNet pour born.v.) Depuis le début, le projet FrameNet s'est engagé à examiner les preuves de l'utilisation réelle de la langue telle qu'elle se trouve dans des collections de textes comme le British National Corpus . Sur la base de tels exemples de phrases, des outils d' étiquetage de rôle sémantique automatique sont capables de déterminer des cadres et de marquer des éléments de cadre dans de nouvelles phrases.

Valences

FrameNet expose également les statistiques sur les valences des cadres , c'est-à-dire le nombre et la position des éléments du cadre dans les phrases d'exemple. La phrase

Elle est née vers 460 après JC

tombe dans le modèle de valence

NP Ext, INI --, NP Dep

qui apparaît deux fois dans les exemples de phrases dans FrameNet, à savoir dans :

Elle est née vers 460 après JC , fille et petite-fille des empereurs romains et byzantins, dont la famille avait joué un rôle important dans la politique romaine pendant plus de 700 ans.
Il fut bientôt affecté en Afrique du Nord, et ne rencontra jamais leur unique enfant, une fille née le 8 juin 1941 .

Relations de cadre

FrameNet capture en outre les relations entre différentes trames à l'aide de relations. Il s'agit notamment des éléments suivants :

  • Héritage : lorsqu'un cadre est une version plus spécifique d'un autre cadre parent plus abstrait. Tout ce qui est vrai pour le cadre parent doit également l'être pour le cadre enfant, et un mappage est spécifié entre les éléments de cadre du parent et les éléments de cadre de l'enfant.
  • Perspectivized_in : un cadre neutre (comme Commerce_transfer-goods) est connecté à un cadre avec une perspective spécifique du même scénario (par exemple le Commerce_sellcadre, qui assume la perspective du vendeur ou le Commerce_buycadre, qui assume la perspective de l'acheteur)
  • Sous- Criminal_processtrame : certaines trames comme la trame font référence à des scénarios complexes qui consistent en plusieurs états ou événements individuels qui peuvent être décrits par des trames distinctes telles que Arrest, Trial, et ainsi de suite.
  • Precedes : la relation Precedes capture un ordre temporel qui s'applique entre les sous-trames d'un scénario complexe.
  • Causative_of et Inchoative_of : il existe une relation assez systématique entre les descriptions statiques (comme le Position_on_a_scalecadre, par exemple "Elle avait un salaire élevé") et les descriptions causales (comme le Cause_change_of_scalar_positioncadre, par exemple "Elle a augmenté son salaire") ou les descriptions inchoatives (comme le Change_position_on_a_scalecadre, par exemple " Son salaire a augmenté").
  • Utilisation : une relation qui existe entre une image qui, d'une manière ou d'une autre, implique une autre image. Par exemple, le Judgment_communicationcadre utilise à la fois le Judgmentcadre et le Statementcadre, mais n'hérite d'aucun d'eux car il n'y a pas de correspondance claire des éléments du cadre.
  • See_also : connecte des cadres qui ressemblent un peu mais qui doivent être distingués avec soin.

Applications

FrameNet s'est avéré utile dans un certain nombre d'applications informatiques, car les ordinateurs ont besoin de connaissances supplémentaires pour reconnaître que « John a vendu une voiture à Mary » et « Marie a acheté une voiture à John » décrivent essentiellement la même situation, malgré l'utilisation de deux des verbes différents, des prépositions différentes et un ordre des mots différent. FrameNet a été utilisé dans des applications telles que la réponse aux questions , la paraphrase , la reconnaissance de l'implication textuelle et l' extraction d'informations , soit directement, soit au moyen d' outils d' étiquetage de rôle sémantique . Le premier système automatique d' étiquetage de rôle sémantique (SRL, parfois aussi appelé « analyse sémantique superficielle ») a été développé par Daniel Gildea et Daniel Jurafsky sur la base de FrameNet en 2002. L'étiquetage de rôle sémantique est depuis devenu l'une des tâches standard en langage naturel. traitement, avec la dernière version (1.7) de FrameNet désormais entièrement prise en charge dans Natural Language Toolkit .

Étant donné que les cadres sont essentiellement des descriptions sémantiques, ils sont similaires d'une langue à l'autre, et plusieurs projets ont vu le jour au fil des ans qui se sont appuyés sur le FrameNet d'origine comme base pour d'autres FrameNets non anglais, pour l'espagnol, le japonais, l'allemand et le polonais, entre autres. .

Voir également

Les références

Lectures complémentaires

Liens externes