Répartition des diplômes - Degree distribution

Dans l'étude des graphes et des réseaux , le degré d'un nœud dans un réseau est le nombre de connexions dont il dispose avec d'autres nœuds et la distribution des degrés est la distribution de probabilité de ces degrés sur l'ensemble du réseau.

Définition

Le degré d'un nœud dans un réseau (parfois appelé à tort la connectivité ) est le nombre de connexions ou d' arêtes du nœud avec d'autres nœuds. Si un réseau est orienté , ce qui signifie que les arêtes pointent dans une direction d'un nœud à un autre, alors les nœuds ont deux degrés différents, l'in-degré, qui est le nombre d'arêtes entrantes, et le degré de sortie, qui est le nombre des bords sortants.

La distribution des degrés P ( k ) d'un réseau est alors définie comme étant la fraction de nœuds du réseau de degré k . Ainsi, s'il y a n nœuds au total dans un réseau et que n k d'entre eux ont un degré k , nous avons .

La même information est aussi parfois présentée sous la forme d'une distribution de degrés cumulée , la fraction de nœuds de degré inférieur à k , ou encore la distribution de degrés cumulative complémentaire , la fraction de nœuds de degré supérieur ou égal à k (1 - C ) si l'on considère C comme la distribution cumulative des degrés ; -à- dire le complément de C .

Distributions de degrés observées

La répartition des diplômes est très importante pour étudier à la fois les réseaux réels, tels qu'Internet et les réseaux sociaux , et les réseaux théoriques. Le modèle de réseau le plus simple, par exemple, le graphe aléatoire (modèle Erdős – Rényi) , dans lequel chacun des n nœuds est indépendamment connecté (ou non) avec une probabilité p (ou 1 - p ), a une distribution binomiale de degrés k :

(ou Poisson dans la limite d'un grand n , si le degré moyen est maintenu fixe). Cependant, la plupart des réseaux dans le monde réel ont des distributions de degrés très différentes de celle-ci. La plupart sont très asymétriques à droite , ce qui signifie qu'une grande majorité de nœuds ont un faible degré mais qu'un petit nombre, appelés «hubs», ont un degré élevé. Certains réseaux, notamment Internet, le World Wide Web , et certains réseaux sociaux ont été argumentées ont des distributions degré qui suivent environ une loi de puissance : où γ est une constante. Ces réseaux sont appelés réseaux sans échelle et ont attiré une attention particulière pour leurs propriétés structurelles et dynamiques. Cependant, une enquête sur un large éventail de réseaux du monde réel suggère que les réseaux sans échelle sont rares lorsqu'ils sont évalués à l'aide de mesures statistiquement rigoureuses. Certains chercheurs ont contesté ces résultats en faisant valoir que les définitions utilisées dans l'étude sont trop strictes, tandis que d'autres ont soutenu que la forme fonctionnelle précise de la distribution des degrés est moins importante que de savoir si la distribution des degrés est à queue grasse ou non. La surinterprétation de formes spécifiques de la distribution des degrés a également été critiquée pour ne pas avoir pris en compte la façon dont les réseaux peuvent évoluer au fil du temps.

Distribution des degrés excédentaires

La distribution des degrés en excès est la distribution de probabilité, pour un nœud atteint en suivant une arête, du nombre d'autres arêtes attachées à ce nœud. En d'autres termes, il s'agit de la distribution des liens sortants à partir d'un nœud atteint en suivant un lien.

Supposons qu'un réseau ait une distribution en degrés , en sélectionnant un nœud (au hasard ou non) et en allant à l'un de ses voisins (en supposant avoir au moins un voisin), alors la probabilité que ce nœud ait des voisins n'est pas donnée par . La raison en est que, chaque fois qu'un nœud est sélectionné dans un réseau hétérogène, il est plus probable d'atteindre les hubs en suivant l'un des voisins existants de ce nœud. La vraie probabilité que de tels nœuds aient un degré est ce qu'on appelle le degré excessif de ce nœud. Dans le modèle de configuration , les corrélations entre les nœuds ont été ignorées et chaque nœud est supposé être connecté à tous les autres nœuds du réseau avec la même probabilité, la distribution des degrés en excès peut être trouvée comme:

où est le degré moyen (degré moyen) du modèle. Il s'ensuit que le degré moyen du voisin de n'importe quel nœud est supérieur au degré moyen de ce nœud. Dans les réseaux sociaux, cela signifie que vos amis, en moyenne, ont plus d'amis que vous. Ceci est connu comme le paradoxe de l' amitié . On peut montrer qu'un réseau peut avoir une composante géante , si son excès moyen est supérieur à un:

Gardez à l'esprit que les deux dernières équations sont juste pour le modèle de configuration et pour dériver la distribution des degrés en excès d'un réseau de mots réels, nous devons également ajouter les corrélations de degrés en compte.

La méthode de génération de fonctions

Les fonctions de génération peuvent être utilisées pour calculer différentes propriétés de réseaux aléatoires. Compte tenu de la distribution des degrés et de la distribution des degrés excédentaires de certains réseaux, et respectivement, il est possible d'écrire deux séries de puissance sous les formes suivantes:

et

peut également être obtenu à partir de dérivés de :

Si nous connaissons la fonction génératrice d'une distribution de probabilité, nous pouvons récupérer les valeurs de en différenciant:

Certaines propriétés, par exemple les moments, peuvent être facilement calculées à partir de et ses dérivées:

Et en général:

Pour Poisson -distributed réseaux aléatoires, comme le graphique ER , qui est la raison pour laquelle la théorie des réseaux aléatoires de ce type est particulièrement simple. Les distributions de probabilité pour les 1er et 2ème voisins les plus proches sont générées par les fonctions et . Par extension, la distribution des -ièmes voisins est générée par:

, avec des itérations de la fonction agissant sur elle-même.

Le nombre moyen de 1ers voisins,, est et le nombre moyen de 2ièmes voisins est:

Répartition des degrés pour les réseaux dirigés

Distribution des degrés d'entrée / sortie pour le graphique d'hyperliens de Wikipédia (échelles logarithmiques)

Dans un réseau dirigé, chaque nœud a un certain degré et un autre degré qui sont le nombre de liens qui sont entrés et sortis de ce nœud respectueusement. Si est la probabilité qu'un nœud choisi au hasard ait un degré en degré et un degré extérieur, alors la fonction génératrice affectée à cette distribution de probabilité conjointe peut être écrite avec deux objets de valeur et comme:

Étant donné que chaque lien dans un réseau dirigé doit quitter un nœud et en entrer un autre, le nombre moyen net de liens entrant dans un nœud est égal à zéro. Par conséquent,

,

ce qui implique que la fonction de génération doit satisfaire:

où est le degré moyen (à l'entrée et à la sortie) des nœuds du réseau;

En utilisant la fonction , nous pouvons à nouveau trouver la fonction de génération pour la distribution des degrés d'entrée / sortie et la distribution des degrés d'entrée / sortie en excès, comme précédemment. peut être définie comme générant des fonctions pour le nombre de liens arrivant à un nœud choisi au hasard, et peut être définie comme le nombre de liens arrivant à un nœud atteint en suivant un lien choisi au hasard. On peut également définir des fonctions génératrices et pour le nombre sortant d'un tel nœud:

Ici, le nombre moyen de voisins 1er, ou comme précédemment présenté comme est et le nombre moyen de voisins 2e accessible à partir d' un noeud choisi au hasard est donné par: . Ce sont également les nombres de 1er et 2ème voisins à partir desquels un nœud aléatoire peut être atteint, puisque ces équations sont manifestement symétriques en et .

Répartition des diplômes pour les réseaux signés

Dans un réseau signé, chaque nœud a un degré positif et un degré négatif qui sont respectivement le nombre positif de liens et le nombre négatif de liens connectés à ce nœud. Donc et dénotons une distribution de degrés négative et une distribution de degrés positive du réseau signé.

Voir également

Les références