Remise hyperbolique - Hyperbolic discounting

En économie , l'actualisation hyperbolique est un modèle d' actualisation de retard incohérent dans le temps . C'est l'une des pierres angulaires de l'économie comportementale et sa base cérébrale est activement étudiée par les chercheurs en neuroéconomie .

Selon l'approche de l'utilité actualisée, les choix intertemporels ne sont pas différents des autres choix, sauf que certaines conséquences sont retardées et doivent donc être anticipées et actualisées (c'est-à-dire repondérées pour tenir compte du retard).

Compte tenu de deux récompenses similaires, les humains montrent une préférence pour celle qui arrive le plus tôt possible. On dit que les humains escomptent la valeur de la récompense ultérieure, d'un facteur qui augmente avec la durée du délai. Dans le monde financier, ce processus est normalement modélisé sous la forme d' une actualisation exponentielle , un modèle d'actualisation cohérent dans le temps . De nombreuses études psychologiques ont depuis démontré des écarts dans la préférence instinctive par rapport au taux d'actualisation constant supposé dans l'actualisation exponentielle. L'actualisation hyperbolique est un modèle mathématique alternatif qui est plus en accord avec ces résultats.

Selon l'actualisation hyperbolique, les valorisations chutent relativement rapidement pour les périodes de retard antérieures (comme dans, à partir de maintenant jusqu'à une semaine), mais chutent ensuite plus lentement pour les périodes de retard plus longues (par exemple, plus de quelques jours). Par exemple, dans une première étude, les sujets ont déclaré qu'ils seraient indifférents entre recevoir 15 $ immédiatement ou 30 $ après 3 mois, 60 $ après 1 an ou 100 $ après 3 ans. Ces indifférences reflètent les taux d'actualisation annuels qui sont passés de 277% à 139% à 63% à mesure que les délais s'allongeaient. Cela contraste avec l'actualisation exponentielle, dans laquelle l'évaluation diminue d'un facteur constant par unité de retard et le taux d'actualisation reste le même.

L'expérience standard utilisée pour révéler la courbe d'actualisation hyperbolique d'un sujet de test consiste à comparer les préférences à court terme avec les préférences à long terme. Par exemple : « Préféreriez-vous un dollar aujourd'hui ou trois dollars demain ? ou « Préféreriez-vous un dollar en un an ou trois dollars en un an et un jour ? Il a été affirmé qu'une fraction importante des sujets prendront le montant le moins élevé aujourd'hui, mais attendront volontiers un jour de plus par an pour recevoir le montant le plus élevé à la place. Les individus ayant de telles préférences sont décrits comme « biaisés par le présent ».

La conséquence la plus importante de l'actualisation hyperbolique est qu'elle crée des préférences temporaires pour les petites récompenses qui se produisent plus tôt que les plus grandes et plus tard. Les individus utilisant l'actualisation hyperbolique révèlent une forte tendance à faire des choix qui sont incohérents dans le temps - ils font aujourd'hui des choix que leur futur lui-même préférerait ne pas avoir fait, malgré la connaissance des mêmes informations. Cette incohérence dynamique se produit parce que les hyperboles déforment la valeur relative des options avec une différence fixe dans les délais proportionnellement à la distance entre le décideur et ces options.

Observations

Le phénomène d'actualisation hyperbolique est implicite dans la « loi d'appariement » de Richard Herrnstein , qui stipule que lorsqu'ils divisent leur temps ou leurs efforts entre deux sources de récompense continues et non exclusives, la plupart des sujets allouent en proportion directe au taux et à la taille des récompenses. des deux sources, et en proportion inverse de leurs retards. C'est-à-dire que les choix des sujets "correspondent" à ces paramètres.

Après le rapport de cet effet dans le cas du retard, George Ainslie a souligné que dans un choix unique entre une récompense plus grande, plus tard et une plus petite, plus tôt, la proportionnalité inverse au retard serait décrite par un graphique de valeur par retard qui avait un forme hyperbolique , et que lorsque la récompense la plus petite et la plus rapide est préférée, cette préférence peut être inversée en augmentant les délais des deux récompenses du même montant absolu. Les recherches d'Ainslie ont montré qu'un nombre important de sujets ont déclaré qu'ils préféreraient 50 $ immédiatement plutôt que 100 $ en six mois, mais ne préféreraient PAS 50 $ en 3 mois plutôt que 100 $ en neuf mois, même s'il s'agissait du même choix vu à 3 mois. plus grande distance. Plus important encore, les sujets qui ont dit qu'ils préféraient 50 $ en 3 mois à 100 $ en 9 mois ont dit qu'ils ne préféreraient PAS 50 $ en 12 mois à 100 $ en 18 mois - encore une fois, la même paire d'options à une distance différente - montrant que la préférence - l'effet d'inversion ne dépendait pas de l'excitation d'obtenir une récompense immédiate. Elle ne dépend pas non plus de la culture humaine ; les premiers résultats d'inversion de préférence ont été observés chez les rats et les pigeons.

De nombreuses expériences ultérieures ont confirmé que les préférences spontanées des sujets humains et non humains suivent une courbe hyperbolique plutôt que la courbe exponentielle conventionnelle qui produirait un choix cohérent au fil du temps. Par exemple, lorsqu'on leur offre le choix entre 50 $ maintenant et 100 $ dans un an, de nombreuses personnes choisiront les 50 $ immédiats. Cependant, étant donné le choix entre 50 $ en cinq ans ou 100 $ en six ans, presque tout le monde choisira 100 $ en six ans, même si c'est le même choix vu à cinq ans de plus.

L'actualisation hyperbolique s'est également avérée liée à des exemples réels de maîtrise de soi. En effet, une variété d'études ont utilisé des mesures d'actualisation hyperbolique pour constater que les individus dépendants à la drogue escomptent davantage les conséquences retardées que les témoins non dépendants appariés, suggérant que l'actualisation des retards extrêmes est un processus comportemental fondamental dans la toxicomanie. Certaines preuves suggèrent que les joueurs pathologiques escomptent également les résultats retardés à des taux plus élevés que les témoins appariés. On ignore actuellement si des taux élevés de rabais hyperboliques précèdent les dépendances ou vice versa, bien que certaines études aient signalé que les discounters à taux élevé sont plus susceptibles de consommer de l' alcool et de la cocaïne que les discounters à faible taux. De même, certains ont suggéré que la remise hyperbolique à taux élevé rend les résultats imprévisibles ( jeu ) plus satisfaisants.

Le degré d'actualisation est d'une importance vitale pour décrire l'actualisation hyperbolique, en particulier dans l'actualisation de récompenses spécifiques telles que l'argent. L'actualisation des récompenses monétaires varie selon les groupes d'âge en raison du taux d'actualisation variable. Le taux dépend de divers facteurs, notamment l'espèce observée, l'âge, l'expérience et le temps nécessaire pour consommer la récompense.

Modèle mathématique

Explication étape par étape

Supposons que dans une étude, les participants aient le choix entre prendre x dollars immédiatement ou prendre y dollars n jours plus tard. Supposons en outre qu'un participant à cette étude utilise l'actualisation exponentielle et qu'un autre utilise l'actualisation hyperbolique.

Chaque participant se rendra compte que a ) ils devraient prendre x dollars immédiatement s'ils peuvent investir le dollar dans une entreprise différente qui rapportera plus de y dollars n jours plus tard et b ) ils seront indifférents entre les choix (en sélectionnant un au hasard) si la meilleure alternative disponible rapportera également y dollars n jours plus tard. (Supposons, par souci de simplicité, que les valeurs de tous les investissements disponibles sont composées quotidiennement.) Chaque participant comprend correctement la question fondamentale posée : « Pour une valeur donnée de y dollars et n jours, quel est le montant minimum d'argent , c'est -à- dire la valeur minimale pour x dollars, que je devrais être prêt à accepter ? En d'autres termes, combien de dollars aurais-je besoin d'investir aujourd'hui pour obtenir y dollars dans n jours ?" Chacun prendra x dollars si x est supérieur à la réponse qu'ils calculent, et chacun prendra y dollars dans n jours si x est plus petit que cette réponse. Cependant, les méthodes qu'ils utilisent pour calculer ce montant et les réponses qu'ils obtiennent seront différentes, et seul l'escompteur exponentiel utilisera la bonne méthode et obtiendra un résultat fiable et correct :

  • L'escompteur exponentiel pensera « Le meilleur investissement alternatif disponible (c'est-à-dire le meilleur investissement disponible en l'absence de ce choix) me donne un rendement de r % par jour ; en d'autres termes, une fois par jour, il ajoute à sa valeur r % de la valeur qu'il avait la veille, c'est-à-dire qu'il multiplie chaque jour sa valeur par (100 % + r %). Donc, si je détiens l'investissement pendant n jours, sa valeur se sera multipliée par ce montant n fois , en faisant cette valeur (100% + r %)^ n de ce qu'elle était au début - c'est-à-dire (1 + r %)^ n fois ce qu'elle était au début. Donc, pour déterminer combien j'aurais besoin de commencer avec aujourd'hui pour obtenir y dollars n jours à partir de maintenant, je dois diviser y dollars par ([1 + r %]^ n ). Si mon autre choix de combien d'argent prendre est supérieur à ce résultat, alors je devrais prendre l'autre montant, investissez-le dans l'autre entreprise que j'ai en tête, et obtenez encore plus à la fin. Si ce résultat est supérieur à mon autre choix, alors je devrais prendre y dollars n jours à partir de maintenant, car il s'avère qu'en abandonnant l'autre choix, j'investis essentiellement cette plus petite somme d'argent pour obtenir y dollars dans n jours, ce qui signifie que j'obtiens un retour encore plus important en attendant n jours pour y dollars, ce qui rend c'est mon meilleur investissement disponible."
  • L'escompteur hyperbolique, cependant, pensera "Si je veux y dollars dans n jours, alors le montant que je dois investir aujourd'hui est y divisé par n , car ce montant multiplié par n est égal à y dollars. [Là se trouve l'erreur de l'escompteur hyperbolique .] Si mon autre choix est supérieur à ce résultat, je devrais le prendre à la place car x fois n sera supérieur à y fois n ; s'il est inférieur à ce résultat, alors je devrais attendre n jours pour y dollars."

Lorsque l'escompteur exponentiel raisonne correctement et que l'escompteur hyperbolique se trompe, c'est que lorsque n devient très grand, la valeur de (1 + r  %)^ n devient beaucoup plus grande que la valeur de n , avec pour effet que la valeur de y / [ (1 + r  %)^ n ] devient beaucoup plus petit que la valeur de y / n . Par conséquent, la valeur minimale de x (le nombre de dollars dans le choix immédiat) qui suffit pour être supérieure à ce montant sera beaucoup plus petite que ne le pense l'escompteur hyperbolique, de sorte qu'il percevra des valeurs x dans la plage de y / [(1 + r  %)^ n ] à y / n (y compris au bas de l'échelle) comme étant trop petits et, par conséquent, rejettent irrationnellement ces alternatives alors qu'elles sont en fait le meilleur investissement.

Modèle formel

L'actualisation hyperbolique est mathématiquement décrite comme

g ( D ) est le facteur de remise qui multiplie la valeur de la récompense, D est le retard de la récompense et k est un paramètre régissant le degré de remise. Ceci est comparé à la formule d'actualisation exponentielle :

Comparaison

Si est une fonction d'actualisation exponentielle et une fonction hyperbolique (avec D le nombre de semaines de retard), alors l'actualisation exponentielle une semaine plus tard à partir de "maintenant" ( D = 0) est , et l'actualisation exponentielle une semaine à partir de la semaine D est , ce qui veut dire qu'ils sont identiques. Pour g ( D ), , qui est le même que pour f , tandis que . De là, on peut voir que les deux types d'actualisation sont les mêmes "maintenant", mais lorsque D est bien supérieur à 1, par exemple 52 (un an), aura tendance à passer à 1, de sorte que l'actualisation hyperbolique d'une semaine dans un avenir lointain est pratiquement nul, tandis que le facteur d'actualisation exponentiel est toujours de 1/2, il y a donc encore une actualisation substantielle dans un avenir lointain.

Approximation quasi-hyperbolique

La fonction d'actualisation "quasi-hyperbolique", proposée par Laibson (1997), se rapproche de la fonction d'actualisation hyperbolique ci-dessus en temps discret par

et

β et δ sont des constantes comprises entre 0 et 1; et encore D est le retard dans la récompense, et f QH ( D ) est le facteur de remise. La condition f (0) = 1 indique que les récompenses prises à l'heure actuelle ne sont pas actualisées.

Les préférences temporelles quasi-hyperboliques sont également appelées préférences « bêta-delta ». Ils conservent une grande partie de la souplesse analytique de l'actualisation exponentielle tout en capturant la caractéristique qualitative clé de l'actualisation avec de véritables hyperboles.

Explications

Risques incertains

Que l'actualisation des gains futurs soit rationnelle ou non, et à quel taux ces gains doivent être actualisés, dépend fortement des circonstances. De nombreux exemples existent dans le monde financier, par exemple, où il est raisonnable de supposer qu'il existe un risque implicite que la récompense ne soit pas disponible à une date future, et de plus que ce risque augmente avec le temps. Envisagez de payer 50 $ pour le dîner aujourd'hui ou de retarder le paiement de soixante ans, mais de payer 100 000 $. Dans ce cas, le restaurateur serait raisonnable d'escompter la valeur future promise car il existe un risque important qu'elle ne soit pas payée (par exemple en raison du décès du restaurateur ou du convive).

Une incertitude de ce type peut être quantifiée par l'analyse bayésienne . Par exemple, supposons que la probabilité que la récompense soit disponible après le temps t est, pour un taux de risque connu λ,

mais le taux est inconnu du décideur. Si la distribution de probabilité a priori de est

alors le décideur s'attendra à ce que la probabilité de la récompense après le temps t soit

qui est exactement le taux d'actualisation hyperbolique. Des conclusions similaires peuvent être obtenues à partir d'autres distributions plausibles pour λ.

Applications

Plus récemment, ces observations sur les fonctions d'escompte ont été utilisées pour étudier l' épargne-retraite , les emprunts par carte de crédit et la procrastination . Il a souvent été utilisé pour expliquer la dépendance . L'actualisation hyperbolique a également été proposée pour expliquer la divergence entre les attitudes et le comportement en matière de protection de la vie privée.

Valeurs actuelles des rentes

Valeur actuelle d'une rente standard

La valeur actuelle d'une série de flux de trésorerie annuels égaux à terme échu actualisés de manière hyperbolique est

V est la valeur actuelle, P est le flux de trésorerie annuel, D est le nombre de paiements annuels et k est le facteur régissant l'actualisation.

Critique

Plusieurs explications alternatives de l'actualisation non exponentielle ont été proposées. Un article de 2003 a noté que ce modèle pourrait être mieux expliqué par une heuristique de similarité que par l'actualisation hyperbolique. Les sujets ont également signalé des changements de préférences relatives à mesure qu'ils voient plus de détails sur ce qu'ils choisissent - un effet de « conception temporelle ».

Une étude de Daniel Read introduit l'« actualisation sous-additive » : le fait que l'actualisation sur un délai augmente si le délai est divisé en intervalles plus petits. Cette hypothèse peut expliquer la principale conclusion de nombreuses études à l'appui de l'actualisation hyperbolique - l'observation que l'impatience diminue avec le temps - tout en tenant compte des observations non prédites par l'actualisation hyperbolique. Cependant, bien que ces observations s'écartent de l'actualisation exponentielle, elles n'entraînent pas d'inversion des préférences à mesure que le temps entre le choix et la récompense précédente augmente.

L'éveil de l'appétit ou de l'émotion conduit parfois à une inversion des préférences, et cela a été l'alternative la plus largement acceptée à une fonction simplement hyperbolique : l'actualisation hyperboloïde ou quasi-hyperbolique fusionne les courbes exponentielles avec une bosse d'excitation alors qu'une récompense viscérale devient imminente. De tels cas sont évidemment importants, mais ne tiennent toujours pas compte des cas où les deux ou aucun des deux choix n'est fait pendant l'excitation.

L'objection la plus évidente à l'actualisation hyperbolique est que beaucoup ou la plupart des gens apprennent à choisir de manière cohérente au fil du temps dans la plupart des situations. De même, un article de 2014 a critiqué les études existantes parce qu'elles utilisaient principalement des données recueillies auprès d'étudiants universitaires et étaient trop rapides pour conclure que le modèle hyperbolique d'actualisation est correct. Les expériences humaines ont fréquemment rapporté de grandes variations entre les sujets. Si surmonter la tendance à la préférence temporaire nécessite un apprentissage, la prochaine tâche évidente pour les expérimentateurs est de tester les théories sur comment et quand cet apprentissage se produit (par exemple, Ainslie, 2012).

Voir également

Les références

Lectures complémentaires