Interprétations de probabilité - Probability interpretations

Le mot probabilité a été utilisé de diverses manières depuis qu'il a été appliqué pour la première fois à l'étude mathématique des jeux de hasard . La probabilité mesure-t-elle la tendance réelle, physique, de quelque chose à se produire, ou est-ce une mesure de la force avec laquelle on croit que cela se produira, ou s'appuie-t-elle sur ces deux éléments ? En répondant à de telles questions, les mathématiciens interprètent les valeurs de probabilité de la théorie des probabilités .

Il existe deux grandes catégories d' interprétations de probabilités qui peuvent être appelées probabilités « physiques » et « évidentielles ». Les probabilités physiques, également appelées probabilités objectives ou de fréquence , sont associées à des systèmes physiques aléatoires tels que les roues de roulette, les dés et les atomes radioactifs. Dans de tels systèmes, un type donné d'événement (comme un dé donnant un six) a tendance à se produire à un rythme persistant, ou « fréquence relative », dans une longue série d'essais. Les probabilités physiques expliquent, ou sont invoquées pour expliquer, ces fréquences stables. Les deux principaux types de théorie des probabilités physiques sont les comptes fréquentistes (comme ceux de Venn, Reichenbach et von Mises) et les comptes de propension (comme ceux de Popper, Miller, Giere et Fetzer).

La probabilité probante, également appelée probabilité bayésienne , peut être attribuée à n'importe quel énoncé, même lorsqu'aucun processus aléatoire n'est impliqué, afin de représenter sa plausibilité subjective ou le degré auquel l'énoncé est étayé par les preuves disponibles. Dans la plupart des cas, les probabilités probantes sont considérées comme des degrés de croyance, définis en termes de dispositions à jouer à certaines cotes. Les quatre principales interprétations probantes sont l'interprétation classique (par exemple celle de Laplace), l'interprétation subjective ( de Finetti et Savage), l'interprétation épistémique ou inductive ( Ramsey , Cox ) et l'interprétation logique ( Keynes et Carnap ). Il existe également des interprétations probantes des groupes couvrant la probabilité, qui sont souvent étiquetés comme «intersubjectifs» (proposés par Gillies et Rowbottom).

Certaines interprétations de la probabilité sont associées à des approches d' inférence statistique , y compris des théories d' estimation et des tests d'hypothèses . L'interprétation physique, par exemple, est reprise par les adeptes des méthodes statistiques « fréquentistes », comme Ronald Fisher , Jerzy Neyman et Egon Pearson . Les statisticiens de l' école bayésienne opposée acceptent généralement l'interprétation de la fréquence lorsqu'elle a du sens (mais pas en tant que définition), mais il y a moins d'accord concernant les probabilités physiques. Les bayésiens considèrent que le calcul des probabilités probantes est à la fois valide et nécessaire en statistique. Cet article, cependant, se concentre sur les interprétations des probabilités plutôt que sur les théories de l'inférence statistique.

La terminologie de ce sujet est plutôt confuse, en partie parce que les probabilités sont étudiées dans une variété de domaines académiques. Le mot « fréquentiste » est particulièrement délicat. Pour les philosophes, il se réfère à une théorie particulière de la probabilité physique, qui a plus ou moins été abandonnée. Pour les scientifiques, en revanche, la « probabilité fréquentiste » n'est qu'un autre nom pour la probabilité physique (ou objective). Ceux qui promeuvent l'inférence bayésienne considèrent les « statistiques fréquentistes » comme une approche de l'inférence statistique basée sur l'interprétation fréquentielle de la probabilité, s'appuyant généralement sur la loi des grands nombres et caractérisée par ce qu'on appelle le « test de signification de l'hypothèse nulle » (NHST). De plus, le mot « objectif », appliqué à la probabilité, signifie parfois exactement ce que « physique » signifie ici, mais il est également utilisé pour des probabilités probantes qui sont fixées par des contraintes rationnelles, telles que les probabilités logiques et épistémiques.

Il est unanimement admis que les statistiques dépendent en quelque sorte de la probabilité. Mais, quant à ce qu'est la probabilité et comment elle est liée aux statistiques, il y a rarement eu un désaccord et une rupture de communication aussi complets depuis la tour de Babel. Sans aucun doute, une grande partie du désaccord est simplement terminologique et disparaîtrait sous une analyse suffisamment pointue.

—  (Sauvage, 1954, p 2)

Philosophie

La philosophie des probabilités présente des problèmes principalement en matière d' épistémologie et d'interface difficile entre les concepts mathématiques et le langage ordinaire tel qu'il est utilisé par les non-mathématiques. La théorie des probabilités est un domaine d'étude établi en mathématiques. Il a ses origines dans la correspondance discutant des mathématiques des jeux de hasard entre Blaise Pascal et Pierre de Fermat au XVIIe siècle, et a été formalisé et rendu axiomatique comme une branche distincte des mathématiques par Andrey Kolmogorov au XXe siècle. Sous forme axiomatique, les déclarations mathématiques sur la théorie des probabilités portent le même type de confiance épistémologique au sein de la philosophie des mathématiques que celles partagées par d'autres déclarations mathématiques.

L'analyse mathématique est née d'observations du comportement des équipements de jeu tels que les cartes à jouer et les dés , qui sont conçus spécifiquement pour introduire des éléments aléatoires et égalisés ; en termes mathématiques, ils sont des sujets d' indifférence . Ce n'est pas la seule façon dont les énoncés probabilistes sont utilisés dans le langage humain ordinaire : lorsque les gens disent qu'« il va probablement pleuvoir », ils ne signifient généralement pas que le résultat de la pluie par rapport à l'absence de pluie est un facteur aléatoire que les probabilités favorisent actuellement ; au lieu de cela, de telles déclarations sont peut-être mieux comprises comme qualifiant leurs attentes de pluie avec un certain degré de confiance. De même, lorsqu'il est écrit que « l'explication la plus probable » du nom de Ludlow, Massachusetts « est qu'il a été nommé d'après Roger Ludlow », ce que l'on veut dire ici n'est pas que Roger Ludlow est favorisé par un facteur aléatoire, mais plutôt que c'est l'explication la plus plausible de l'évidence, qui admet d'autres explications moins probables.

Thomas Bayes a tenté de fournir une logique qui pourrait gérer divers degrés de confiance ; en tant que telle, la probabilité bayésienne est une tentative de refonte de la représentation des énoncés probabilistes en tant qu'expression du degré de confiance par lequel les croyances qu'ils expriment sont détenues.

Bien que la probabilité ait initialement des motivations quelque peu banales, son influence et son utilisation modernes sont largement répandues, allant de la médecine fondée sur des preuves , en passant par six sigma , jusqu'à la preuve vérifiable de manière probabiliste et le paysage de la théorie des cordes .

Un résumé de quelques interprétations de probabilité
Classique Fréquentiste Subjectif Propension
Hypothèse principale Principe d'indifférence Fréquence d'occurrence Degré de croyance Degré de lien de causalité
Base conceptuelle Symétrie hypothétique Données passées et classe de référence Connaissance et intuition État actuel du système
Approche conceptuelle Conjectural Empirique Subjectif Métaphysique
Cas unique possible Oui Non Oui Oui
Précis Oui Non Non Oui
Problèmes Ambiguïté de principe d'indifférence Définition circulaire Problème de classe de référence Notion contestée

Définition classique

La première tentative de rigueur mathématique dans le domaine des probabilités, défendue par Pierre-Simon Laplace , est désormais connue sous le nom de définition classique . Développé à partir d'études sur les jeux de hasard (comme le lancer de dés ), il indique que la probabilité est partagée également entre tous les résultats possibles, à condition que ces résultats puissent être jugés également probables. (3.1)

La théorie du hasard consiste à réduire tous les événements du même genre à un certain nombre de cas également possibles, c'est-à-dire à ceux dont on peut être également indécis quant à leur existence, et à déterminer le nombre des cas. favorable à l'événement dont la probabilité est recherchée. Le rapport de ce nombre à celui de tous les cas possibles est la mesure de cette probabilité, qui n'est donc qu'une fraction dont le numérateur est le nombre de cas favorables et dont le dénominateur est le nombre de tous les cas possibles.

—  Pierre-Simon Laplace, Essai philosophique sur les probabilités
La définition classique de la probabilité fonctionne bien pour les situations avec seulement un nombre fini de résultats également probables.

Ceci peut être représenté mathématiquement comme suit : Si une expérience aléatoire peut aboutir à N résultats mutuellement exclusifs et également probables et si N A de ces résultats aboutit à l'occurrence de l'événement A , la probabilité de A est définie par

Il y a deux limitations claires à la définition classique. Premièrement, il ne s'applique qu'aux situations dans lesquelles il n'y a qu'un nombre « fini » de résultats possibles. Mais certaines expériences aléatoires importantes, telles que lancer une pièce jusqu'à ce qu'elle monte face, donnent lieu à un ensemble infini de résultats. Et deuxièmement, vous devez déterminer à l'avance que tous les résultats possibles sont également probables sans compter sur la notion de probabilité pour éviter la circularité, par exemple, par des considérations de symétrie.

Fréquentisme

Pour les fréquentistes, la probabilité que la balle atterrisse dans n'importe quelle poche ne peut être déterminée que par des essais répétés dans lesquels le résultat observé converge vers la probabilité sous-jacente à long terme .

Les fréquentistes postulent que la probabilité d'un événement est sa fréquence relative dans le temps, (3.4) c'est-à-dire sa fréquence relative d'occurrence après avoir répété un processus un grand nombre de fois dans des conditions similaires. Ceci est également connu sous le nom de probabilité aléatoire . Les événements sont supposés être régis par des phénomènes physiques aléatoires , qui sont soit des phénomènes prévisibles, en principe, avec suffisamment d'informations (voir déterminisme ) ; ou des phénomènes qui sont essentiellement imprévisibles. Les exemples du premier type incluent lancer des dés ou faire tourner une roue de roulette ; un exemple du deuxième type est la désintégration radioactive . Dans le cas du tirage à pile ou face, les fréquentistes disent que la probabilité d'obtenir une face est de 1/2, non pas parce qu'il y a deux résultats également probables, mais parce que des séries répétées d'un grand nombre d'essais démontrent que la fréquence empirique converge vers la limite 1 /2 lorsque le nombre d'essais tend vers l'infini.

Si nous désignons par le nombre d'occurrences d'un événement dans les essais, alors si nous disons que .

Le point de vue fréquentiste a ses propres problèmes. Il est bien sûr impossible d'effectuer réellement une infinité de répétitions d'une expérience aléatoire pour déterminer la probabilité d'un événement. Mais si seulement un nombre fini de répétitions du processus est effectué, différentes fréquences relatives apparaîtront dans différentes séries d'essais. Si ces fréquences relatives doivent définir la probabilité, la probabilité sera légèrement différente à chaque fois qu'elle est mesurée. Mais la probabilité réelle devrait être la même à chaque fois. Si nous reconnaissons le fait que nous ne pouvons mesurer qu'une probabilité avec une erreur de mesure attachée, nous rencontrons toujours des problèmes car l'erreur de mesure ne peut être exprimée qu'en tant que probabilité, le concept même que nous essayons de définir. Cela rend même la définition de fréquence circulaire ; voir par exemple « Quelle est la probabilité d'un tremblement de terre ? "

Subjectivisme

Les subjectivistes, également appelés bayésiens ou partisans de la probabilité épistémique , donnent à la notion de probabilité un statut subjectif en la considérant comme une mesure du « degré de croyance » de l'individu évaluant l'incertitude d'une situation particulière. La probabilité épistémique ou subjective est parfois appelée créance , par opposition au terme chance pour une probabilité de propension. Certains exemples de probabilité épistémique consistent à attribuer une probabilité à la proposition selon laquelle une loi physique proposée est vraie ou à déterminer la probabilité qu'un suspect ait commis un crime, sur la base des preuves présentées. L'utilisation de la probabilité bayésienne soulève le débat philosophique quant à savoir si elle peut apporter des justifications valables de la croyance . Les bayésiens citent les travaux de Ramsey (p 182) et de Finetti (p 103) comme prouvant que les croyances subjectives doivent suivre les lois de la probabilité pour être cohérentes. Les preuves jettent le doute sur le fait que les humains auront des croyances cohérentes. L'utilisation de la probabilité bayésienne consiste à spécifier une probabilité a priori . Ceci peut être obtenu en considérant si la probabilité préalable requise est supérieure ou inférieure à une probabilité de référence associée à un modèle d'urne ou à une expérience de pensée . Le problème est que pour un problème donné, plusieurs expériences de pensée peuvent s'appliquer, et en choisir une est une question de jugement : différentes personnes peuvent attribuer différentes probabilités a priori, connues sous le nom de problème de classe de référence . Le « problème du lever du soleil » en fournit un exemple.

Propension

Les théoriciens de la propension considèrent la probabilité comme une propension physique, une disposition ou une tendance d'un type donné de situation physique à produire un résultat d'un certain type ou à produire une fréquence relative à long terme d'un tel résultat. Ce type de probabilité objective est parfois appelé « chance ».

Les propensions, ou chances, ne sont pas des fréquences relatives, mais des causes supposées des fréquences relatives stables observées. Les propensions sont invoquées pour expliquer pourquoi la répétition d'un certain type d'expérience générera des types de résultats donnés à des taux persistants, appelés propensions ou chances. Les fréquentistes sont incapables d'adopter cette approche, car les fréquences relatives n'existent pas pour les coups simples, mais seulement pour les grands ensembles ou collectifs (voir "cas unique possible" dans le tableau ci-dessus). En revanche, un propensionniste est capable d'utiliser la loi des grands nombres pour expliquer le comportement des fréquences à long terme. Cette loi, qui est une conséquence des axiomes de probabilité, dit que si (par exemple) une pièce est lancée à plusieurs reprises, de telle sorte que sa probabilité de tomber face est la même à chaque lancer, et les résultats sont probabilistes indépendant, alors la fréquence relative des faces sera proche de la probabilité de face à chaque lancer. Cette loi permet que les fréquences stables à long terme soient une manifestation de probabilités invariantes à cas unique . En plus d'expliquer l'émergence de fréquences relatives stables, l'idée de propension est motivée par le désir de donner un sens aux attributions de probabilités à cas unique en mécanique quantique, telles que la probabilité de désintégration d'un atome particulier à un moment particulier.

Le principal défi auquel sont confrontées les théories de la propension est de dire exactement ce que signifie la propension. (Et puis, bien sûr, pour montrer que la propension ainsi définie a les propriétés requises.) À l'heure actuelle, malheureusement, aucun des comptes bien connus de la propension n'arrive à relever ce défi.

Une théorie de probabilité de propension a été donnée par Charles Sanders Peirce . Une théorie de la propension ultérieure a été proposée par le philosophe Karl Popper , qui n'avait cependant qu'une faible connaissance des écrits de C. S. Peirce. Popper a noté que le résultat d'une expérience physique est produit par un certain ensemble de « conditions génératrices ». Lorsque nous répétons une expérience, comme le dit le proverbe, nous réalisons en réalité une autre expérience avec un ensemble (plus ou moins) similaire de conditions génératrices. Dire qu'un ensemble de conditions génératrices a une propension p à produire le résultat E signifie que ces conditions exactes, si elles étaient répétées indéfiniment, produiraient une séquence de résultats dans laquelle E se produirait avec une fréquence relative limite p . Pour Popper, alors, une expérience déterministe aurait une propension 0 ou 1 pour chaque résultat, puisque les conditions génératrices auraient le même résultat à chaque essai. En d'autres termes, les propensions non triviales (celles qui diffèrent de 0 et 1) n'existent que pour des expériences véritablement non déterministes.

Un certain nombre d'autres philosophes, dont David Miller et Donald A. Gillies , ont proposé des théories de la propension quelque peu similaires à celles de Popper.

D'autres théoriciens de la propension (par exemple Ronald Giere) ne définissent pas du tout explicitement les propensions, mais voient plutôt la propension comme définie par le rôle théorique qu'elle joue dans la science. Ils ont fait valoir, par exemple, que les grandeurs physiques telles que la charge électrique ne peuvent pas non plus être explicitement définies, en termes de choses plus basiques, mais uniquement en termes de ce qu'elles font (comme attirer et repousser d'autres charges électriques). De la même manière, la propension est tout ce qui remplit les divers rôles que joue la probabilité physique en science.

Quels rôles joue la probabilité physique en science ? Quelles sont ses propriétés ? Une propriété centrale du hasard est que, lorsqu'il est connu, il contraint la croyance rationnelle à prendre la même valeur numérique. David Lewis a appelé cela le principe principal , (3.3 & 3.5) un terme que les philosophes ont la plupart du temps adopté. Par exemple, supposons que vous soyez certain qu'une pièce biaisée particulière a une propension de 0,32 à tomber face à chaque fois qu'elle est lancée. Quel est alors le prix correct pour un pari qui rapporte 1 $ si la pièce tombe face, et rien autrement ? Selon le principe principal, le juste prix est de 32 cents.

Probabilité logique, épistémique et inductive

Il est largement reconnu que le terme « probabilité » est parfois utilisé dans des contextes où il n'a rien à voir avec le hasard physique. Considérez, par exemple, l'affirmation selon laquelle l'extinction des dinosaures a probablement été causée par une grosse météorite frappant la terre. Des déclarations telles que « L'hypothèse H est probablement vraie » ont été interprétées comme signifiant que les preuves empiriques (actuellement disponibles) (E, disons) soutiennent H à un degré élevé. Ce degré de support de H par E a été appelé la probabilité logique de H étant donné E, ou la probabilité épistémique de H étant donné E, ou la probabilité inductive de H étant donné E.

Les différences entre ces interprétations sont plutôt faibles et peuvent sembler sans conséquence. L'un des principaux points de désaccord réside dans la relation entre probabilité et croyance. Les probabilités logiques sont conçues (par exemple dans le Traité de Keynes sur les probabilités ) comme des relations objectives et logiques entre des propositions (ou des phrases), et donc ne dépendent en aucune façon de la croyance. Ce sont des degrés d' implication (partielle) , ou des degrés de conséquence logique , et non des degrés de croyance . (Ils dictent néanmoins des degrés appropriés de croyance, comme cela est discuté ci-dessous.) Frank P. Ramsey , d'autre part, était sceptique quant à l'existence de telles relations logiques objectives et a fait valoir que la probabilité (évidente) est "la logique de croyance partielle". (p 157) En d'autres termes, Ramsey a soutenu que les probabilités épistémiques sont simplement des degrés de croyance rationnelle, plutôt que d'être des relations logiques qui contraignent simplement des degrés de croyance rationnelle.

Un autre point de désaccord concerne l' unicité de la probabilité probante, par rapport à un état de connaissance donné. Rudolf Carnap a soutenu, par exemple, que les principes logiques déterminent toujours une probabilité logique unique pour toute déclaration, par rapport à tout ensemble de preuves. Ramsey, en revanche, pensait que bien que les degrés de croyance soient soumis à certaines contraintes rationnelles (telles que, mais sans s'y limiter, les axiomes de probabilité), ces contraintes ne déterminent généralement pas une valeur unique. Les personnes rationnelles, en d'autres termes, peuvent différer quelque peu dans leurs degrés de croyance, même si elles ont toutes les mêmes informations.

Prédiction

Un autre compte rendu de la probabilité met l'accent sur le rôle de la prédiction - prédire les observations futures sur la base d'observations passées, et non sur des paramètres non observables. Dans sa forme moderne, il est principalement dans la veine bayésienne. C'était la fonction principale des probabilités avant le 20e siècle, mais elle est tombée en disgrâce par rapport à l'approche paramétrique, qui modélisait les phénomènes comme un système physique observé avec erreur, comme en mécanique céleste .

L'approche prédictive moderne a été lancée par Bruno de Finetti , avec l'idée centrale d' échangeabilité - que les observations futures doivent se comporter comme les observations passées. Ce point de vue a attiré l'attention du monde anglophone avec la traduction en 1974 du livre de de Finetti, et a depuis été proposé par des statisticiens tels que Seymour Geisser .

Probabilité axiomatique

Les mathématiques des probabilités peuvent être développées sur une base entièrement axiomatique et indépendante de toute interprétation : voir les articles sur la théorie des probabilités et les axiomes des probabilités pour un traitement détaillé.

Voir également

Les références

Lectures complémentaires

  • Cohen, L (1989). Introduction à la philosophie de l'induction et des probabilités . Oxford New York : Clarendon Press Oxford University Press. ISBN 978-0198750789.
  • Aigle, Antoine (2011). Philosophie des probabilités : lectures contemporaines . Abingdon, Oxon New York : Routledge. ISBN 978-0415483872.
  • Gillies, Donald (2000). Théories philosophiques des probabilités . Londres New York : Routledge. ISBN 978-0415182768.Une monographie complète couvrant les quatre principales interprétations actuelles : logique, subjective, fréquence, propension. Propose également une nouvelle interprétation intersubective.
  • Piratage, Ian (2006). L'émergence de la probabilité : une étude philosophique des premières idées sur la probabilité, l'induction et l'inférence statistique . Cambridge New York : Cambridge University Press. ISBN 978-0521685573.
  • Paul Humphreys , éd. (1994) Patrick Suppes : Philosophe scientifique , Bibliothèque de synthèse, Springer-Verlag.
    • Vol. 1 : Probabilité et causalité probabiliste .
    • Vol. 2: Philosophie de la physique, structure et mesure de la théorie et théorie de l'action .
  • Jackson, Frank et Robert Pargetter (1982) « Probabilité physique en tant que propension », Noûs 16(4) : 567-583.
  • Khrennikov, Andreï (2009). Interprétations de probabilité (2e éd.). Berlin New York : Walter de Gruyter. ISBN 978-3110207484.Couvre principalement les modèles de probabilité non-Kolmogorov, en particulier en ce qui concerne la physique quantique .
  • Lewis, David (1983). Documents philosophiques . New York : Oxford University Press. ISBN 978-0195036466.
  • Platon, Jan von (1994). Création de probabilités modernes : ses mathématiques, sa physique et sa philosophie dans une perspective historique . Cambridge Angleterre New York : Cambridge University Press. ISBN 978-0521597357.
  • Rowbottom, Darrell (2015). Probabilité . Cambridge : Politique. ISBN 978-0745652573.Une introduction très accessible à l'interprétation des probabilités. Couvre toutes les principales interprétations et propose une nouvelle interprétation au niveau du groupe (ou « intersubjective »). Couvre également les erreurs et les applications des interprétations dans les sciences sociales et naturelles.
  • Skyrms, Brian (2000). Choix et hasard : une introduction à la logique inductive . Australie Belmont, Californie : Wadsworth/Thomson Learning. ISBN 978-0534557379.

Liens externes