Glossaire de probabilités et statistiques - Glossary of probability and statistics

Ce qui suit est un glossaire des termes utilisés dans les sciences mathématiques , statistiques et probabilités.

UNE

règle de décision recevable

algèbre de variables aléatoires

hypothèse alternative

analyse de la variance

événement atomique

Un autre nom pour l'événement élémentaire

B

1. Une caractéristique d'un échantillon qui n'est pas représentative de la population

2. La différence entre la valeur attendue d'un estimateur et la valeur vraie

données binaires

Données qui ne peuvent prendre que deux valeurs, généralement représentées par 0 et 1

distribution binomiale

analyse bivariée

blocage

Méthode Box – Jenkins

boîte à moustaches

C

étude causale

Une étude statistique dans laquelle l'objectif est de mesurer l'effet d'une variable sur le résultat d'une variable différente. Par exemple, comment me sentirai-je mal de tête si je prends de l'aspirine, par rapport à si je ne prends pas d'aspirine? Les études causales peuvent être expérimentales ou observationnelles.

théorème limite central

moment central

fonction caractéristique

distribution du chi carré

test du chi carré

l'analyse par grappes

échantillonnage en grappes

événement complémentaire

conception complètement aléatoire

statistiques informatiques

concomitants

Dans une étude statistique, les concomitants sont toutes les variables dont les valeurs ne sont pas affectées par les traitements, telles que l'âge, le sexe et le taux de cholestérol d'une unité avant de commencer un régime (traitement).

distribution conditionnelle

Étant donné deux variables aléatoires X et Y distribuées conjointement , la distribution de probabilité conditionnelle de Y étant donné X (écrite « Y | X ») est la distribution de probabilité de Y lorsque X est connu pour être une valeur particulière

probabilite conditionnelle

La probabilité d'un événement A, en supposant l'événement B. La probabilité conditionnelle s'écrit P ( A | B ), et se lit "la probabilité de A , étant donné B "

distribution de probabilité conditionnelle

Intervalle de confiance

Dans les statistiques inférentielles, un IC est une plage de valeurs plausibles pour un paramètre, comme la moyenne de la population. Par exemple, sur la base d'une étude des habitudes de sommeil chez 100 personnes, un chercheur peut estimer que la population globale dort entre 5 et 9 heures par nuit. Ceci est différent de la moyenne de l'échantillon, qui peut être mesurée directement.

un niveau de confiance

Également appelé coefficient de confiance, le niveau de confiance indique la probabilité que l'intervalle de confiance (intervalle) capture la vraie moyenne de la population. Par exemple, un intervalle de confiance avec un niveau de confiance de 95% a 95% de chances de capturer la moyenne de la population. Techniquement, cela signifie que si l'expérience était répétée plusieurs fois, 95% des IC contiendraient la vraie moyenne de la population.

déroutant

conjuguer avant

variable continue

échantillonnage de commodité

corrélation

Aussi appelé coefficient de corrélation, une mesure numérique de la force de la relation linéaire entre deux variables aléatoires (on peut l'utiliser pour quantifier, par exemple, comment la taille et la taille des chaussures sont corrélées dans la population). Un exemple est le coefficient de corrélation produit-moment de Pearson , qui est obtenu en divisant la covariance des deux variables par le produit de leurs écarts-types. Les variables indépendantes ont une corrélation de 0. Une corrélation de population est souvent représentée par le symbole , tandis qu'une corrélation d'échantillon par .

{\ displaystyle \ rho}

{\ displaystyle r}

compter les données

Données issues du comptage qui ne peuvent prendre que des valeurs entières non négatives

covariance

Étant donné deux variables aléatoires X et Y , avec des valeurs attendues et , la covariance est définie comme la valeur attendue de la variable aléatoire et est écrite . Il est utilisé pour mesurer la corrélation.

{\ displaystyle E (X) = \ mu}

{\ displaystyle E (Y) = \ nu}

{\ Displaystyle (X- \ mu) (Y- \ nu)}

{\ displaystyle \ operatorname {cov} (X, Y)}

ré

Les données

l'analyse des données

base de données

Un échantillon et les points de données associés

point de données

Une mesure typée - cela peut être une valeur booléenne , un nombre réel, un vecteur (auquel cas on l'appelle aussi un vecteur de données), etc.

Règle de décision

théorie de la décision

degrés de liberté

estimation de la densité

dépendance

variable dépendante

statistiques descriptives

conception d'expériences

E

événement élémentaire

Un événement avec un seul élément. Par exemple, lorsque vous retirez une carte d'un deck, "obtenir le valet de pique" est un événement élémentaire, alors que "obtenir un roi ou un as" ne l'est pas.

théorie de l'estimation

estimateur

Une fonction des données connues qui est utilisée pour estimer un paramètre inconnu; une estimation est le résultat de l'application réelle de la fonction à un ensemble particulier de données. La moyenne peut être utilisée comme estimateur

valeur attendue

Somme de la probabilité de chaque résultat possible de l'expérience multipliée par son gain («valeur»). Ainsi, il représente le montant moyen que l'on «s'attend» à gagner par pari si des paris avec des cotes identiques sont répétés plusieurs fois. Par exemple, la valeur attendue d'un jet de dé à six faces est de 3,5. Le concept est similaire à la moyenne. La valeur attendue de la variable aléatoire X s'écrit typiquement E (X) pour l'opérateur et ( mu ) pour le paramètre.

{\ displaystyle \ mu}

expérience

Toute procédure qui peut être répétée à l'infini et qui a un ensemble bien défini de résultats

famille exponentielle

un événement

Un sous-ensemble de l'espace échantillon (résultat d'une expérience possible), auquel une probabilité peut être attribuée. Par exemple, en lançant un dé, "obtenir un cinq ou un six" est un événement (avec une probabilité d'un tiers si le dé est juste)

F

analyse factorielle

expérience factorielle

la fréquence

distribution de fréquence

domaine fréquentiel

inférence fréquentiste

g

modèle linéaire général

modèle linéaire généralisé

données groupées

H

histogramme

je

Indépendance (théorie des probabilités)

variable indépendante

gamme interquartile

J

distribution conjointe

Étant donné deux variables aléatoires X et Y , la distribution conjointe de X et Y est la distribution de probabilité de X et Y ensemble

probabilité conjointe

La probabilité que deux événements se produisent ensemble. La probabilité conjointe de A et B s'écrit ou

{\ displaystyle P (A \ cap B)}

{\ displaystyle P (A, \ B).}

K

Filtre de Kalman

noyau

estimation de la densité du noyau

kurtosis

Une mesure des observations extrêmes peu fréquentes (valeurs aberrantes) de la distribution de probabilité d'une variable aléatoire à valeur réelle. Un kurtosis plus élevé signifie qu'une plus grande partie de la variance est due à des écarts extrêmes peu fréquents, par opposition à des écarts fréquents de taille modeste

L

Moment L

loi des grands nombres

fonction de vraisemblance

Une fonction de probabilité conditionnelle considérée comme une fonction de son deuxième argument avec son premier argument maintenu fixe. Par exemple, imaginez tirer une balle numérotée avec le nombre k d'un sac de n balles, numérotées de 1 à n. Ensuite, vous pourriez décrire une fonction de vraisemblance pour la variable aléatoire N comme la probabilité d'obtenir k étant donné qu'il y a n boules: la vraisemblance sera 1 / n pour n supérieur ou égal à k, et 0 pour n plus petit que k. Contrairement à une fonction de distribution de probabilité, cette fonction de vraisemblance ne totalisera pas 1 sur l'espace d'échantillonnage

fonction de perte

test du rapport de vraisemblance

M

Estimateur M

distribution marginale

Étant donné deux variables aléatoires X et Y distribuées conjointement , la distribution marginale de X est simplement la distribution de probabilité de X ignorant les informations sur Y

probabilité marginale

La probabilité d'un événement, ignorant toute information sur d'autres événements. La probabilité marginale de A s'écrit P ( A ). Contraste avec la probabilité conditionnelle

Chaîne de Markov Monte Carlo

statistiques mathématiques

Estimation de vraisemblance maximale

moyenne

1. La valeur attendue d'une variable aléatoire

2. La moyenne arithmétique est la moyenne d'un ensemble de nombres ou la somme des valeurs divisée par le nombre de valeurs

distribution multimodale

analyse multivariée

estimation de densité de noyau multivariée

variable aléatoire multivariée

Un vecteur dont les composantes sont des variables aléatoires sur le même espace de probabilité

exclusivité mutuelle

indépendance mutuelle

Une collection d'événements est mutuellement indépendante si, pour un sous-ensemble de la collection, la probabilité conjointe de tous les événements se produisant est égale au produit des probabilités conjointes des événements individuels. Pensez au résultat d'une série de tirages au sort. C'est une condition plus forte que l'indépendance par paire

N

régression non paramétrique

statistiques non paramétriques

erreur non due à l'échantillonnage

distribution normale

diagramme de probabilité normale

hypothèse nulle

L'énoncé testé dans un test de signification statistique Habituellement, l'hypothèse nulle est une affirmation «sans effet» ou «sans différence». "Par exemple, si l'on voulait tester si la lumière a un effet sur le sommeil, l'hypothèse nulle serait qu'il n'y a aucun effet, il est souvent symbolisé par H ₀ .

O

P

valeur p

indépendance par paire

Une collection indépendante par paire de variables aléatoires est un ensemble de variables aléatoires dont deux quelconques sont indépendantes

paramètre

Peut être un paramètre de population, un paramètre de distribution, un paramètre non observé (avec différentes nuances de sens). En statistique, c'est souvent une quantité à estimer

filtre à particule

centile

diagramme circulaire

estimation ponctuelle

Puissance

probabilité antérieure

Dans l'inférence bayésienne , cela représente des croyances antérieures ou d'autres informations disponibles avant que de nouvelles données ou observations ne soient prises en compte

paramètre de population

Voir le paramètre

probabilité postérieure

Le résultat d'une analyse bayésienne qui encapsule la combinaison de croyances ou d'informations antérieures avec des données observées

analyse des composants principaux

probabilité

densité de probabilité

Décrit la probabilité dans une distribution de probabilité continue. Par exemple, vous ne pouvez pas dire que la probabilité qu'un homme mesure six pieds est de 20%, mais vous pouvez dire qu'il a 20% de chances d'avoir entre cinq et six pieds. La densité de probabilité est donnée par une fonction de densité de probabilité. Contraste avec la masse de probabilité

fonction de densité de probabilité

Donne la distribution de probabilité pour une variable aléatoire continue

distribution de probabilité

Une fonction qui donne la probabilité de tous les éléments dans un espace donné: voir Liste des distributions de probabilité

mesure de probabilité

La probabilité d'événements dans un espace de probabilités

diagramme de probabilité

espace de probabilité

Un espace d'échantillonnage sur lequel une mesure de probabilité a été définie

Q

quantile

quartile

échantillonnage par quotas

R

Variable aléatoire

Une fonction mesurable sur un espace de probabilité, souvent à valeur réelle. La fonction de distribution d'une variable aléatoire donne la probabilité de résultats différents. Nous pouvons également dériver la moyenne et la variance d'une variable aléatoire

conception de blocs aléatoires

intervalle

La longueur du plus petit intervalle contenant toutes les données

estimation bayésienne récursive

analyse de régression

conception de mesures répétées

réponses

Dans une étude statistique, toutes les variables dont les valeurs peuvent avoir été affectées par les traitements, comme le taux de cholestérol après avoir suivi un régime particulier pendant six mois.

randomisation restreinte

statistiques robustes

erreur d'arrondi

S

goûter

La partie d'une population qui est effectivement observée

Moyenne de l'échantillon et covariance

La moyenne arithmétique d'un échantillon de valeurs tirées de la population. Il est indiqué par . Un exemple est le score moyen au test d'un sous-ensemble de 10 étudiants d'une classe. La moyenne de l'échantillon est utilisée comme estimateur de la moyenne de la population, qui, dans cet exemple, serait la note moyenne au test de tous les élèves de la classe.

{\ displaystyle {\ overline {x}}}

espace d'échantillon

L'ensemble des résultats possibles d'une expérience. Par exemple, l'espace échantillon pour lancer un dé à six faces sera {1, 2, 3, 4, 5, 6}

échantillonnage

Un processus de sélection d'observations pour obtenir des connaissances sur une population. Il existe de nombreuses méthodes pour choisir sur quel échantillon effectuer les observations

Biais d'échantillonnage

distribution d'échantillonnage

La distribution de probabilité, sous échantillonnage répété de la population, d'une statistique donnée

erreur d'échantillonnage

nuage de points

Paramètre d'échelle

niveau de signification

échantillon aléatoire simple

Le paradoxe de Simpson

asymétrie

Une mesure de l'asymétrie de la distribution de probabilité d'une variable aléatoire à valeur réelle. En gros, une distribution a une asymétrie positive (asymétrique à droite) si la queue supérieure est plus longue et une asymétrie négative (asymétrique à gauche) si la queue inférieure est plus longue (confondre les deux est une erreur courante)

parcelle de spaghetti

biais de spectre

écart-type

La mesure la plus couramment utilisée de la dispersion statistique. C'est la racine carrée de la variance, et s'écrit généralement ( sigma )

{\ displaystyle \ sigma}

erreur standard

note normalisée

statistique

Résultat de l'application d'un algorithme statistique à un ensemble de données. Elle peut également être décrite comme une variable aléatoire observable

dispersion statistique

graphiques statistiques

test d'hypothèses statistiques

indépendance statistique

Deux événements sont indépendants si le résultat de l'un n'affecte pas celui de l'autre (par exemple, obtenir un 1 sur un jet de dé n'affecte pas la probabilité d'obtenir un 1 sur un second jet). De même, lorsque nous affirmons que deux variables aléatoires sont indépendantes, nous voulons dire intuitivement que connaître quelque chose sur la valeur de l'une d'elles ne donne aucune information sur la valeur de l'autre.

inférence statistique

Inférence sur une population d'un échantillon aléatoire tiré de celle-ci ou, plus généralement, sur un processus aléatoire à partir de son comportement observé pendant une période de temps finie

interférence statistique

modèle statistique

population statistique

Un ensemble d'entités sur lesquelles des inférences statistiques doivent être tirées, souvent basées sur un échantillonnage aléatoire. On peut aussi parler d'une population de mesures ou de valeurs

dispersion statistique

La variabilité statistique est une mesure de la diversité de certaines données. Il peut être exprimé par la variance ou l'écart type

paramètre statistique

Un paramètre qui indexe une famille de distributions de probabilité

signification statistique

statistiques

Test t de l'étudiant

affichage de la tige et de la feuille

échantillonnage stratifié

méthodologie d'enquête

fonction de survie

Biais de survie

distribution de probabilité symétrique

échantillonnage systématique

T

statistique de test

dans le domaine temporel

des séries chronologiques

Analyse des séries chronologiques

prévision de séries chronologiques

traitements

Variables dans une étude statistique qui sont conceptuellement manipulables. Par exemple, dans une étude sur la santé, suivre un certain régime est un traitement alors que l'âge ne l'est pas.

essai

Peut faire référence à chaque répétition individuelle quand on parle d'une expérience composée d'un nombre fixe d'entre elles. À titre d'exemple, on peut penser qu'une expérience est un nombre quelconque de un à n tirages de pièces, disons 17. Dans ce cas, un tirage au sort peut être appelé un essai pour éviter toute confusion, puisque toute l'expérience est composée de 17 unités.

estimateur coupé

erreurs de type I et de type II

U

distribution de probabilité unimodale

unités

Dans une étude statistique, les objets auxquels les traitements sont attribués. Par exemple, dans une étude examinant les effets de la cigarette, les unités seraient des personnes.

V

variance

Une mesure de sa dispersion statistique d'une variable aléatoire, indiquant à quelle distance de la valeur attendue ses valeurs sont généralement. La variance de la variable aléatoire X est généralement désigné comme , ou tout simplement

{\ displaystyle \ operatorname {var} (X)}

{\ displaystyle \ sigma _ {X} ^ {2}}

{\ displaystyle \ sigma ^ {2}}

W

moyenne arithmétique pondérée

médiane pondérée

X

XOR, disjonction exclusive

Oui

La correction de Yates pour la continuité

Z

test z

Voir également

Les références

Liens externes

"A Glossary of DOE Terminology" , NIST / SEMATECH e-Handbook of Statistical Methods , NIST , récupéré le 28 février 2009
Glossaire statistique, statistics.com , récupéré le 28 février 2009
Probabilité et statistiques sur les premières utilisations des pages (Univ. De Southampton)

Languages

In other projects

Glossaire de probabilités et statistiques - Glossary of probability and statistics

UNE

B

C

ré

E

F

g

H

je

J

K

L

M

N

O

P

Q

R

S

T

U

V

W

X

Oui

Z

Voir également

Les références

Liens externes