Théorie du contrôle perceptuel - Perceptual control theory

La théorie du contrôle perceptuel ( PCT ) est un modèle de comportement basé sur les principes de la rétroaction négative . Une boucle de contrôle maintient une variable détectée à ou près d'une valeur de référence au moyen des effets de ses sorties sur cette variable, tels que médiés par les propriétés physiques de l'environnement. Dans la théorie du contrôle technique , les valeurs de référence sont définies par un utilisateur extérieur au système. Un exemple est un thermostat. Dans un organisme vivant, les valeurs de référence des variables perceptives contrôlées sont maintenues de manière endogène. L' homéostasie biologique et les réflexes sont des exemples simples et de bas niveau. La découverte des principes mathématiques de contrôle a introduit un moyen de modéliser une boucle de rétroaction négative fermée à travers l'environnement (causalité circulaire), qui diffère fondamentalement des théories du béhaviorisme et de la psychologie cognitive qui modélisent les stimuli comme causes du comportement (causalité linéaire). La recherche PCT est publiée dans la psychologie expérimentale , neurosciences , éthologie , anthropologie , linguistique , sociologie , la robotique , la psychologie du développement , psychologie organisationnelle et de gestion, et un certain nombre d'autres domaines. La PCT a été appliquée à la conception et à l'administration de systèmes éducatifs et a conduit à une psychothérapie appelée méthode des niveaux .

Histoire

Le PCT a ses racines dans les connaissances physiologiques de Claude Bernard et dans l' ingénierie des systèmes de contrôle et la cybernétique du 20e siècle . Le contrôle de rétroaction négatif classique a été élaboré par des ingénieurs dans les années 1930 et 1940, et développé plus avant par Wiener , Ashby et d'autres au début du développement du domaine de la cybernétique . À partir des années 1950, William T. Powers a appliqué les concepts et les méthodes des systèmes de contrôle techniques aux systèmes de contrôle biologique et a développé la méthodologie expérimentale du PCT.

Une idée clé de la PCT est que la variable contrôlée n'est pas la sortie du système (les actions comportementales), mais son entrée, c'est-à-dire une fonction détectée et transformée d'un état de l'environnement que la sortie du système de contrôle peut affecter. Parce que ces entrées détectées et transformées peuvent apparaître comme des aspects consciemment perçus de l'environnement, Powers a étiqueté la variable contrôlée "perception". La théorie est devenue connue sous le nom de « Théorie du contrôle perceptuel » ou PCT plutôt que « Théorie du contrôle appliquée à la psychologie » parce que les théoriciens du contrôle affirment ou supposent souvent que c'est la sortie du système qui est contrôlée. En PCT, c'est la représentation interne de l'état d'une variable de l'environnement – ​​une « perception » dans le langage courant – qui est contrôlée. Les principes de base du PCT ont été publiés pour la première fois par Powers, Clark et MacFarland en tant que « théorie générale du comportement par rétroaction » en 1960, avec des crédits aux auteurs cybernétiques Wiener et Ashby , et ont été systématiquement développés depuis lors dans la communauté de recherche qui s'est réunie. autour de. Au départ, il a été éclipsé par les promesses de la « révolution cognitive », mais est maintenant mieux connu.

Powers et d'autres chercheurs dans le domaine signalent des problèmes de but, de causalité et de téléologie aux fondements de la psychologie que la théorie du contrôle résout. D'Aristote à William James et John Dewey, il a été reconnu que le comportement est intentionnel et pas simplement réactif, mais comment expliquer cela a été problématique parce que la seule preuve des intentions était subjective. Comme Powers l'a souligné, les comportementalistes suivant Wundt , Thorndyke , Watson et d'autres ont rejeté les rapports introspectifs en tant que données pour une science objective de la psychologie. Seuls les comportements observables pouvaient être admis comme données. Il découle de cette position l'hypothèse que les événements environnementaux (stimuli) provoquent des actions comportementales (réponses). Cette hypothèse persiste en psychologie cognitive , qui interpose des cartes cognitives et d'autres traitements d'informations postulés entre le stimulus et la réponse, mais conserve par ailleurs l'hypothèse d'une causalité linéaire de l'environnement au comportement.

Une autre raison plus spécifique que Powers a observée pour le rejet par les psychologues des notions de but ou d'intention était qu'ils ne pouvaient pas voir comment un but (un état qui n'existait pas encore) pouvait provoquer le comportement qui y a conduit. Le PCT résout ces arguments philosophiques sur la téléologie parce qu'il fournit un modèle du fonctionnement des organismes dans lequel le but a un statut objectif sans recours à l' introspection , et dans lequel la causalité est circulaire autour de boucles de rétroaction .

Exemple

Un simple système de contrôle de rétroaction négative est un système de régulateur de vitesse pour une voiture. Un système de régulateur de vitesse a un capteur qui "perçoit" la vitesse comme le taux de rotation de l'arbre de transmission directement connecté aux roues. Il a également un « objectif » réglable par le conducteur spécifiant une vitesse particulière. La vitesse détectée est continuellement comparée à la vitesse spécifiée par un dispositif (appelé « comparateur ») qui soustrait la valeur d'entrée actuellement détectée de la valeur d'objectif stockée. La différence (le signal d'erreur) détermine le réglage de l'accélérateur (la dépression de l'accélérateur), de sorte que la puissance du moteur varie en continu pour empêcher la vitesse de la voiture d'augmenter ou de diminuer par rapport à la vitesse souhaitée lorsque les conditions environnementales changent.

Si la vitesse de la voiture commence à descendre en dessous de la vitesse cible, par exemple lors de la montée d'une colline, la petite augmentation du signal d'erreur, amplifiée, provoque une augmentation de la puissance du moteur, ce qui maintient l'erreur presque à zéro. Si la vitesse commence à dépasser l'objectif, par exemple lors de la descente d'une colline, le moteur est ralenti pour agir comme un frein. nécessaire seulement si la colline est trop raide). Le résultat est que le système de régulateur de vitesse maintient une vitesse proche de l'objectif lorsque la voiture monte et descend des collines, et que d'autres perturbations telles que le vent affectent la vitesse de la voiture. Tout cela se fait sans aucune planification d'actions spécifiques et sans aucune réaction aveugle aux stimuli. En effet, le régulateur de vitesse ne détecte pas du tout les perturbations telles que la pression du vent, il ne détecte que la variable contrôlée, la vitesse. Il ne contrôle pas non plus la puissance générée par le moteur, il utilise le « comportement » de la puissance du moteur comme moyen de contrôler la vitesse détectée.

Les mêmes principes de contrôle par rétroaction négative (y compris la capacité d'annuler les effets de perturbations externes ou internes imprévisibles) s'appliquent aux systèmes de contrôle vivants. La thèse du PCT est que les animaux et les humains ne contrôlent pas leur comportement ; au contraire, ils varient leur comportement comme moyen de contrôler leurs perceptions, avec ou sans perturbations externes. Cela contredit directement l'hypothèse historique et encore répandue selon laquelle le comportement est le résultat final des stimuli et des plans cognitifs.

La méthodologie de modélisation, et le PCT comme modèle

La donnée principale de la méthodologie PCT est la variable contrôlée. L'étape fondamentale de la recherche PCT, le test des variables contrôlées, commence par l'application lente et douce d'influences perturbatrices à l'état d'une variable dans l'environnement que le chercheur présume est déjà sous contrôle par l'organisme observé. Il est essentiel de ne pas surcharger la capacité de contrôle de l'organisme, car c'est ce qui est à l'étude. Si l'organisme modifie ses actions juste de manière à empêcher l'influence perturbatrice d'avoir l'effet attendu sur cette variable, c'est une preuve solide que l'action expérimentale a perturbé une variable contrôlée. Il est crucial de distinguer les perceptions et le point de vue de l'observateur de ceux de l'organisme observé. Il peut falloir un certain nombre de variantes du test pour isoler exactement quel aspect de la situation environnementale est sous contrôle, tel que perçu par l'organisme observé.

PCT utilise une méthodologie de boîte noire . La variable contrôlée telle que mesurée par l'observateur correspond quantitativement à une valeur de référence pour une perception que l'organisme contrôle. La variable contrôlée est donc un indice objectif du but ou de l'intention de ces actions comportementales particulières de l'organisme - le but que ces actions s'efforcent constamment d'atteindre malgré les perturbations. À quelques exceptions près, dans l'état actuel des neurosciences, cette valeur de référence maintenue en interne est rarement observée directement en tant que telle (par exemple, en tant que taux de décharge dans un neurone), car peu de chercheurs tracent les variables électriques et chimiques pertinentes par leurs voies spécifiques pendant qu'un vivant organisme s'engage dans ce que nous observons extérieurement comme un comportement. Cependant, lorsqu'un système de rétroaction négative simulé sur un ordinateur numérique fonctionne essentiellement de la même manière que les organismes observés, alors la structure de rétroaction négative bien comprise de la simulation ou du modèle (la boîte blanche) est comprise comme démontrant la structure de rétroaction négative invisible au sein de l'organisme ( la boîte noire).

Les données pour les individus ne sont pas agrégées pour l'analyse statistique ; au lieu de cela, un modèle génératif est construit qui reproduit les données observées pour les individus avec une très haute fidélité (0,95 ou mieux). Construire un tel modèle d'une situation comportementale donnée nécessite des mesures minutieuses de trois variables observées :

q je La quantité d'entrée, cet aspect du stimulus que le sujet perçoit et dont il a été démontré qu'il contrôle.
q o La quantité de sortie, cet aspect du comportement du sujet qui affecte l'état de q i .
La perturbation, une valeur additionnant les effets que toute autre influence de l'environnement a sur l'état de q i . Dans une expérience contrôlée, on vise à n'avoir qu'une seule influence perturbatrice qui est sous le contrôle de l'enquêteur, mais dans l'observation naturaliste, la situation est souvent plus complexe.

Une quatrième valeur, la référence interne r (une variable « consigne »), est déduite de la valeur à laquelle l'organisme est observé pour maintenir q i , tel que déterminé par le test des variables contrôlées (décrit au début de cette section) .

Avec deux variables spécifiées, l'entrée contrôlée q i et la référence r , un système de contrôle correctement conçu, simulé sur un ordinateur numérique, produit des sorties q o qui opposent presque précisément des perturbations imprévisibles d à l'entrée contrôlée. De plus, l'écart par rapport au contrôle parfait s'accorde bien avec celui observé pour les organismes vivants. Un contrôle parfait se traduirait par un effet nul de la perturbation, mais les organismes vivants ne sont pas des contrôleurs parfaits, et le but du PCT est de modéliser les organismes vivants. Lorsqu'une simulation informatique fonctionne avec une conformité > 95% aux valeurs mesurées expérimentalement, s'opposant à l'effet des changements imprévisibles de d en générant des valeurs (presque) égales et opposées de q o , il est entendu qu'il modélise le comportement et la structure de la boucle de contrôle interne de l'organisme.

Par extension, l'élaboration de la théorie constitue un modèle général des processus cognitifs et comportementaux. Avec chaque modèle spécifique ou simulation de comportement qui est construit et testé par rapport aux données observées, le modèle général qui est présenté dans la théorie est exposé à un défi potentiel qui pourrait nécessiter une révision ou conduire à une réfutation.

Mathématiques

Pour illustrer les calculs mathématiques utilisés dans une simulation PCT, considérons une tâche de suivi de poursuite dans laquelle le participant garde le curseur de la souris aligné avec une cible en mouvement sur un écran d'ordinateur.

Le modèle suppose qu'un signal perceptuel chez le participant représente l'amplitude de la quantité d'entrée q i . (Il a été démontré qu'il s'agit d'un taux de décharge dans un neurone, au moins aux niveaux les plus bas.) Dans la tâche de suivi, la quantité d'entrée est la distance verticale entre la position cible T et la position du curseur C , et la variation aléatoire de la position cible agit comme la perturbation d de cette quantité d'entrée. Cela suggère que le signal perceptif p représente quantitativement la position du curseur C moins la position cible T, telle qu'exprimée dans l'équation p = CT .

Entre la perception de la cible et du curseur et la construction du signal représentant la distance entre eux, il y a un retard de τ millisecondes, de sorte que le signal perceptif de travail à l'instant t représente la distance cible-curseur à un instant antérieur, t - τ . Par conséquent, l'équation utilisée dans le modèle est

1. p ( t ) = C ( t–τ ) – T ( t–τ )

Le système de contrôle de rétroaction négative reçoit un signal de référence r qui spécifie l'amplitude du signal de perception donné qui est actuellement prévu ou souhaité. (Pour l'origine de r dans l'organisme, voir sous " Une hiérarchie de contrôle ", ci-dessous.) Les deux r et p sont entrés dans une structure neuronale simple avec r excitateur et p inhibiteur. Cette structure est appelée "comparateur". L'effet est de soustraire p de r , produisant un signal d'erreur e qui indique l'amplitude et le signe de la différence entre l'amplitude souhaitée r et l'amplitude actuellement entrée p de la perception donnée. L'équation représentant cela dans le modèle est :

2. e = r–p

Le signal d'erreur e doit être transformé en la quantité de sortie q o (représentant les efforts musculaires du participant affectant la position de la souris). Des expériences ont montré que dans le meilleur modèle pour la fonction de sortie, la vitesse de la souris V curseur est proportionnelle au signal d'erreur e par un facteur de gain G (c'est-à-dire V curseur = G * e ). Ainsi, lorsque le signal de perception p est inférieur au signal de référence r , le signal d'erreur e a un signe positif, et à partir de celui-ci le modèle calcule une vitesse ascendante du curseur qui est proportionnelle à l'erreur.

La position suivante du curseur C new est la position actuelle C old plus la vitesse V du curseur multipliée par la durée dt d'une itération du programme. Par algèbre simple, nous substituons G * e (comme indiqué ci-dessus) à V curseur , ce qui donne une troisième équation :

3. C nouveau = C ancien + G * e * dt

Ces trois équations simples ou étapes de programme constituent la forme la plus simple du modèle pour la tâche de suivi. Lorsque ces trois équations simultanées sont évaluées à plusieurs reprises avec les mêmes perturbations aléatoires d de la position cible que le participant humain a subies, les positions de sortie et les vitesses du curseur dupliquent les actions du participant dans la tâche de suivi ci-dessus à moins de 4,0% de leur pic. plage de pointe, dans les moindres détails.

Ce modèle simple peut être affiné avec un facteur d'amortissement d qui réduit l'écart entre le modèle et le participant humain à 3,6% lorsque la perturbation d est réglée à la difficulté maximale.

3'. C nouveau = C vieux + [( G * e )–( d * C vieux )]* dt

Une discussion détaillée de ce modèle dans (Powers 2008) comprend à la fois le code source et le code exécutable, avec lesquels le lecteur peut vérifier dans quelle mesure ce programme simple simule un comportement réel. Aucune considération n'est nécessaire pour les non-linéarités possibles telles que la loi de Weber-Fechner , le bruit potentiel dans le système, les angles variables en continu au niveau des articulations et de nombreux autres facteurs qui pourraient affecter les performances s'il s'agissait d'un simple modèle linéaire. Aucune cinématique inverse ou calcul prédictif n'est requis. Le modèle réduit simplement l'écart entre l'entrée p et la référence r en continu au fur et à mesure qu'il apparaît en temps réel, et c'est tout ce qui est requis, comme le prédit la théorie.

Distinctions avec la théorie du contrôle technique

Dans les systèmes artificiels qui sont spécifiés par la théorie du contrôle technique , le signal de référence est considéré comme une entrée externe à la « plante ». Dans la théorie du contrôle technique, le signal de référence ou le point de consigne est public ; en PCT, il ne l'est pas, mais doit plutôt être déduit des résultats du test des variables contrôlées, comme décrit ci-dessus dans la section méthodologie . En effet, dans les systèmes vivants, un signal de référence n'est pas une entrée accessible de l'extérieur, mais provient plutôt de l'intérieur du système. Dans le modèle hiérarchique, la sortie d'erreur des boucles de contrôle de niveau supérieur, comme décrit dans la section suivante ci-dessous , évoque le signal de référence r de la mémoire locale synaptique, et la force de r est proportionnelle à la force (pondérée) du signal d'erreur ou des signaux d'un ou plusieurs systèmes de niveau supérieur.

Dans les systèmes de contrôle d'ingénierie, dans le cas où il existe plusieurs de ces entrées de référence, un « contrôleur » est conçu pour manipuler ces entrées de manière à obtenir l'effet sur la sortie du système souhaité par le concepteur du système, et la tâche de une théorie du contrôle (ainsi conçue) consiste à calculer ces manipulations de manière à éviter l'instabilité et l'oscillation. Le concepteur d'un modèle ou d'une simulation PCT ne spécifie aucun effet souhaité particulier sur la sortie du système, si ce n'est qu'il doit s'agir de tout ce qui est nécessaire pour mettre l'entrée de l'environnement (le signal perceptuel) en conformité avec la référence. Dans la théorie du contrôle perceptuel, la fonction d'entrée pour le signal de référence est une somme pondérée de signaux générés en interne (dans le cas canonique, des signaux d'erreur de niveau supérieur), et la stabilité de la boucle est déterminée localement pour chaque boucle de la manière esquissée dans la section précédente. sur les mathématiques du PCT (et développé plus en détail dans la littérature référencée ). La somme pondérée s'entend comme résultant de la réorganisation .

La théorie du contrôle technique est exigeante en termes de calcul, mais comme le montre la section précédente , la PCT ne l'est pas. Par exemple, comparez la mise en œuvre d'un modèle de pendule inversé dans la théorie du contrôle technique avec la mise en œuvre du PCT en tant que hiérarchie de cinq systèmes de contrôle simples.

Une hiérarchie de contrôle

Les perceptions, en PCT, sont construites et contrôlées selon une hiérarchie de niveaux. Par exemple, la perception visuelle d'un objet est construite à partir de différences d'intensité lumineuse ou de différences de sensations telles que la couleur sur ses bords. Contrôler la forme ou l'emplacement de l'objet nécessite de modifier les perceptions des sensations ou des intensités (qui sont contrôlées par des systèmes de niveau inférieur). Ce principe organisateur est appliqué à tous les niveaux, jusqu'aux constructions philosophiques et théoriques les plus abstraites.

Le physiologiste russe Nicolas Bernstein est arrivé indépendamment à la même conclusion que le comportement doit être multiordinal - organisé hiérarchiquement, en couches. Un problème simple a conduit à cette conclusion à peu près au même moment à la fois dans PCT et dans les travaux de Bernstein. Les réflexes spinaux agissent pour stabiliser les membres contre les perturbations. Pourquoi n'empêchent-ils pas les centres supérieurs du cerveau d'utiliser ces membres pour effectuer un comportement ? Puisque le cerveau utilise évidemment les systèmes spinaux pour produire un comportement, il doit y avoir un principe qui permet aux systèmes supérieurs de fonctionner en incorporant les réflexes, pas seulement en les surmontant ou en les éteignant. La réponse est que la valeur de référence (consigne) pour un réflexe spinal n'est pas statique ; au contraire, il est varié par des systèmes de niveau supérieur comme moyen de déplacer les membres. Ce principe s'applique aux boucles de rétroaction plus élevées, car chaque boucle présente le même problème aux sous-systèmes situés au-dessus.

Alors qu'un système de contrôle technique a une valeur de référence ou un point de consigne ajusté par un organisme externe, la valeur de référence pour un système de contrôle biologique ne peut pas être définie de cette manière. Le point de consigne doit provenir d'un processus interne. S'il existe un moyen pour le comportement de l'affecter, toute perception peut être amenée à l'état momentanément spécifié par les niveaux supérieurs, puis être maintenue dans cet état contre des perturbations imprévisibles. Dans une hiérarchie de systèmes de contrôle, les niveaux supérieurs ajustent les objectifs des niveaux inférieurs comme leur moyen d'approcher leurs propres objectifs fixés par des systèmes encore plus élevés. Cela a des conséquences importantes pour tout contrôle externe proposé d'un système de contrôle vivant autonome (organisme). Au plus haut niveau, les valeurs de référence (objectifs) sont fixées par l'hérédité ou des processus adaptatifs.

Réorganisation dans l'évolution, le développement et l'apprentissage

Si un organisme contrôle des perceptions inappropriées, ou s'il contrôle certaines perceptions à des valeurs inappropriées, il est alors moins susceptible d'amener une descendance à maturité et peut mourir. Par conséquent, par sélection naturelle, les générations successives d'organismes évoluent de manière à contrôler ces perceptions qui, lorsqu'elles sont contrôlées avec des valeurs de consigne appropriées, tendent à maintenir les variables internes critiques à des niveaux optimaux, ou du moins dans des limites non létales. Powers a appelé ces variables internes critiques « variables intrinsèques » (les « variables essentielles » d'Ashby).

Le mécanisme qui influence le développement des structures de perceptions à contrôler est appelé « réorganisation », un processus au sein de l'organisme individuel qui est soumis à la sélection naturelle tout comme l'est la structure évoluée des individus au sein d'une espèce.

Ce « système de réorganisation » est proposé comme faisant partie de la structure héritée de l'organisme. Il modifie les paramètres sous-jacents et la connectivité de la hiérarchie de contrôle de manière aléatoire. Il existe un taux de variation continu de base des variables intrinsèques qui se déroule à une vitesse fixée par l'erreur totale (et s'arrête à zéro erreur), ponctué de changements aléatoires de direction dans un hyperespace avec autant de dimensions qu'il y a de variables critiques. Il s'agit d'une adaptation plus ou moins directe de « l' homéostat » d'Ashby , adopté pour la première fois en PCT dans l'article de 1960, puis modifié pour utiliser la méthode d'E. coli pour naviguer dans les gradients de nutriments, comme décrit par Koshland (1980).

La réorganisation peut se produire à n'importe quel niveau lorsque la perte de contrôle à ce niveau fait s'écarter les variables intrinsèques (essentielles) des points de consigne génétiquement déterminés. C'est le mécanisme de base impliqué dans l'apprentissage par essais et erreurs, qui conduit à l'acquisition de types de processus d'apprentissage plus systématiques.

Psychothérapie : la méthode des niveaux (MOL)

Le concept de réorganisation a conduit à une méthode de psychothérapie appelée la méthode des niveaux (MOL). En utilisant MOL, le thérapeute vise à aider le patient à déplacer sa conscience vers des niveaux de perception plus élevés afin de résoudre les conflits et de permettre une réorganisation.

Neurosciences

Apprentissage

Actuellement, aucune théorie n'a été acceptée pour expliquer la base synaptique, neuronale ou systémique de l'apprentissage. Cependant, depuis 1973, l'idée que la potentialisation à long terme (LTP) des populations de synapses induit un apprentissage par le biais de mécanismes pré- et post-synaptiques (Bliss & Lømo, 1973; Bliss & Gardner-Medwin, 1973) est prédominante. LTP est une forme d' apprentissage Hebbian , qui a proposé que l'activation tonique à haute fréquence d'un circuit de neurones augmente l'efficacité avec laquelle ils sont activés et la taille de leur réponse à un stimulus donné par rapport au neurone standard (Hebb, 1949 ). Ces mécanismes sont les principes qui sous-tendent la célèbre explication simple de Hebb : « Ceux qui tirent ensemble, se connectent ensemble » (Hebb, 1949).

Le LTP a reçu beaucoup de soutien depuis sa première observation par Terje Lømo en 1966 et fait toujours l'objet de nombreuses études et recherches cliniques modernes. Cependant, il existe des mécanismes alternatifs possibles sous-jacents à la LTP, tels que présentés par Enoki, Hu, Hamilton et Fine en 2009, publiés dans la revue Neuron . Ils concèdent que LTP est la base de l'apprentissage. Cependant, ils proposent d'abord que la LTP se produit dans les synapses individuelles, et cette plasticité est graduée (par opposition à un mode binaire) et bidirectionnelle (Enoki et al., 2009). Deuxièmement, le groupe suggère que les changements synaptiques sont exprimés uniquement de manière présynaptique, via des changements dans la probabilité de libération de l'émetteur (Enoki et al., 2009). Enfin, l'équipe prédit que la survenue de la PLT pourrait être dépendante de l'âge, car la plasticité d'un cerveau néonatal serait supérieure à celle d'un cerveau mature. Par conséquent, les théories diffèrent, car l'une propose une occurrence on/off de PLT par des mécanismes pré- et post-synaptiques et l'autre ne propose que des changements présynaptiques, une capacité graduée et une dépendance à l'âge.

Ces théories s'accordent sur un élément de la LTP, à savoir qu'elle doit se produire par des modifications physiques de la ou des membranes synaptiques, c'est-à-dire la plasticité synaptique. La théorie du contrôle perceptuel englobe ces deux points de vue. Il propose le mécanisme de « réorganisation » comme base de l'apprentissage. La réorganisation se produit au sein du système de contrôle inhérent à un humain ou à un animal en restructurant les inter- et intraconnexions de son organisation hiérarchique, semblable au phénomène neuroscientifique de la plasticité neuronale. Cette réorganisation permet dans un premier temps la forme d'apprentissage par essais et erreurs, qui est observée chez les bébés, puis progresse vers un apprentissage plus structuré par association, apparent chez les nourrissons, et enfin vers un apprentissage systématique, couvrant la capacité adulte d'apprendre à la fois en interne et stimuli et événements générés de l'extérieur. De cette manière, la PCT fournit un modèle d'apprentissage valide qui combine les mécanismes biologiques de la PLT avec une explication de la progression et du changement des mécanismes associés à la capacité de développement (Plooij 1984, 1987, 2003, Plooij & Plooij (1990), 2013).

Powers (2008) a produit une simulation de la coordination des bras. Il a suggéré que pour déplacer votre bras, quatorze systèmes de contrôle qui contrôlent quatorze angles articulaires soient impliqués, et qu'ils se réorganisent simultanément et indépendamment. Il a été constaté que pour des performances optimales, les fonctions de sortie doivent être organisées de manière à ce que la sortie de chaque système de contrôle n'affecte que la seule variable environnementale qu'il perçoit. Dans cette simulation, le processus de réorganisation fonctionne comme il se doit, et tout comme Powers suggère qu'il fonctionne chez l'homme, réduisant les sorties qui causent des erreurs et augmentant celles qui réduisent les erreurs. Initialement, les perturbations ont des effets importants sur les angles des articulations, mais au fil du temps, les angles des articulations correspondent plus étroitement aux signaux de référence en raison de la réorganisation du système. Powers (2008) suggère qu'afin de parvenir à une coordination des angles articulaires pour produire les mouvements souhaités, au lieu de calculer comment plusieurs angles articulaires doivent changer pour produire ce mouvement, le cerveau utilise des systèmes de rétroaction négative pour générer les angles articulaires nécessaires. Un seul signal de référence qui est varié dans un système d'ordre supérieur peut générer un mouvement qui nécessite plusieurs angles communs pour changer en même temps.

Organisation hiérarchique

Botvinick (2008) a proposé que l'une des idées fondatrices de la révolution cognitive était la reconnaissance de la structure hiérarchique dans le comportement humain. Malgré des décennies de recherche, cependant, les mécanismes informatiques qui sous-tendent le comportement hiérarchiquement organisé ne sont toujours pas entièrement compris. Bedre, Hoffman, Cooney & D'Esposito (2009) proposent que l'objectif fondamental des neurosciences cognitives est de caractériser l'organisation fonctionnelle du cortex frontal qui soutient le contrôle de l'action.

Des données récentes de neuroimagerie ont soutenu l'hypothèse selon laquelle les lobes frontaux sont organisés hiérarchiquement, de sorte que le contrôle est pris en charge dans les régions progressivement caudales à mesure que le contrôle passe à une spécification plus concrète de l'action. Cependant, il n'est toujours pas clair si les processeurs de contrôle d'ordre inférieur sont affectés différemment par les déficiences du contrôle d'ordre supérieur lorsque des interactions entre les niveaux sont nécessaires pour accomplir une tâche, ou s'il existe des influences de rétroaction de niveau inférieur sur le contrôle de niveau supérieur. (Bedre, Hoffman, Cooney & D'Esposito 2009).

Botvinik (2008) a constaté que tous les modèles existants de comportement hiérarchiquement structuré partagent au moins une hypothèse générale - que l'organisation hiérarchique, partielle ou totale de l'action humaine se reflète dans les représentations internes ou neuronales qui la sous-tendent. Plus précisément, l'hypothèse est qu'il existe des représentations non seulement de comportements moteurs de bas niveau, mais aussi des représentations séparables d'unités comportementales de niveau supérieur. La dernière génération de modèles fournit de nouvelles informations, mais pose également des questions nouvelles ou affinées pour la recherche empirique, notamment comment les représentations abstraites de l'action émergent à travers l'apprentissage, comment elles interagissent avec les différents modes de contrôle de l'action et comment elles se trient dans le cortex préfrontal (PFC ).

La théorie du contrôle perceptuel (PCT) peut fournir un modèle explicatif de l'organisation neuronale qui traite les problèmes actuels. PCT décrit le caractère hiérarchique du comportement comme étant déterminé par le contrôle de la perception hiérarchiquement organisée. Les systèmes de contrôle dans le corps et dans l'environnement interne de milliards de neurones interconnectés dans le cerveau sont chargés de maintenir les signaux perceptifs dans des limites de survie dans l'environnement variable de manière imprévisible à partir duquel ces perceptions sont dérivées. PCT ne propose pas qu'il existe un modèle interne dans lequel le cerveau simule le comportement avant d'émettre des commandes pour exécuter ce comportement. Au lieu de cela, l'une de ses caractéristiques est le manque de principe d'organisation cérébrale du comportement. Le comportement est plutôt le moyen variable de l'organisme pour réduire l'écart entre les perceptions et les valeurs de référence qui sont basées sur divers apports externes et internes (Cools, 1985). Le comportement doit constamment s'adapter et changer pour qu'un organisme maintienne ses objectifs perceptifs. De cette façon, PCT peut fournir une explication de l'apprentissage abstrait par une réorganisation spontanée de la hiérarchie. Le PCT propose qu'un conflit se produise entre des valeurs de référence disparates pour une perception donnée plutôt qu'entre des réponses différentes (Mansell 2011), et que l'apprentissage soit mis en œuvre sous forme de modifications par essais et erreurs des propriétés des systèmes de contrôle (Marken & Powers 1989), plutôt que toute réponse spécifique étant renforcée . De cette façon, le comportement reste adaptatif à l'environnement au fur et à mesure qu'il se déroule, plutôt que de s'appuyer sur des modèles d'action appris qui peuvent ne pas correspondre.

Des hiérarchies de contrôle perceptif ont été simulées dans des modèles informatiques et se sont avérées correspondre étroitement aux données comportementales. Par exemple, Marken a mené une expérience comparant le comportement d'un modèle informatique de hiérarchie de contrôle perceptuel avec celui de six volontaires sains dans trois expériences. Les participants devaient garder la distance entre une ligne gauche et une ligne médiane égale à celle de la ligne médiane et une ligne droite. Il leur a également été demandé de maintenir les deux distances égales à 2 cm. Ils avaient 2 pagaies en main, l'une contrôlant la ligne gauche et l'autre contrôlant la ligne médiane. Pour ce faire, ils ont dû résister à des perturbations aléatoires appliquées aux positions des lignes. Lorsque les participants ont atteint le contrôle, ils ont réussi à annuler l'effet attendu des perturbations en déplaçant leurs pagaies. La corrélation entre le comportement des sujets et le modèle dans toutes les expériences approchait 0,99. Il est proposé que l'organisation de modèles de systèmes de contrôle hiérarchique comme celui-ci nous renseigne sur l'organisation des sujets humains dont elle reproduit si fidèlement le comportement.

Situation actuelle et perspectives

L'explication précédente des principes du PCT fournit une justification de la façon dont cette théorie peut fournir une explication valable de l'organisation neuronale et comment elle peut expliquer certains des problèmes actuels des modèles conceptuels.

La théorie du contrôle perceptuel propose actuellement une hiérarchie de 11 niveaux de perceptions contrôlés par des systèmes dans l'esprit humain et l'architecture neuronale. Ce sont : l'intensité, la sensation, la configuration, la transition, l'événement, la relation, la catégorie, la séquence, le programme, le principe et le concept de système. Divers signaux perceptifs à un niveau inférieur (par exemple, perceptions visuelles d'intensités) sont combinés dans une fonction d'entrée pour construire une perception unique à un niveau supérieur (par exemple, perception visuelle d'une sensation de couleur). Les perceptions qui sont construites et contrôlées aux niveaux inférieurs sont transmises comme les entrées perceptives aux niveaux supérieurs. Les niveaux supérieurs contrôlent à leur tour en ajustant les niveaux de référence (objectifs) des niveaux inférieurs, indiquant en fait aux niveaux inférieurs ce qu'ils doivent percevoir.

Alors que de nombreuses démonstrations informatiques de principes ont été développées, les niveaux supérieurs proposés sont difficiles à modéliser car on en sait trop peu sur le fonctionnement du cerveau à ces niveaux. Des processus de contrôle de niveau supérieur isolés peuvent être étudiés, mais les modèles d'une hiérarchie étendue de contrôle ne sont encore que conceptuels, ou au mieux rudimentaires.

La théorie du contrôle perceptuel n'a pas été largement acceptée dans la psychologie traditionnelle, mais a été efficacement utilisée dans un éventail considérable de domaines des facteurs humains, de la psychologie clinique et de la psychothérapie (la « Méthode des niveaux »), c'est la base d'un nombre considérable de recherche en sociologie, et il a constitué la base conceptuelle du modèle de référence utilisé par une succession de groupes d'étude de recherche de l' OTAN . Il est enseigné dans plusieurs universités à travers le monde et fait l'objet de plusieurs thèses de doctorat.

Bibliographie sélectionnée

  • Cziko, Gary (1995). Sans miracles : la théorie de la sélection universelle et la deuxième révolution darwinienne . Cambridge, MA : MIT Press (Un livre de Bradford). ISBN  0-262-53147-X
  • Cziko, Gary (2000). Les choses que nous faisons : Utiliser les leçons de Bernard et Darwin pour comprendre le quoi, le comment et le pourquoi de notre comportement . Cambridge, MA : MIT Press (Un livre de Bradford). ISBN  0-262-03277-5
  • Forssell, Dag (éd.), 2016. Théorie du contrôle perceptuel, un aperçu de la troisième grande théorie en psychologie: introductions, lectures et ressources . Hayward, Californie : Édition de systèmes de contrôle vivants. ISBN  978-1938090134 .
  • Mansell, Warren (éd.), (2020). Le manuel interdisciplinaire de la théorie du contrôle perceptuel : les systèmes de contrôle vivants IV . Cambridge : Presse académique. ISBN  978-0128189481 .
  • Marken, Richard S. (1992) Mind readings: Experimental studies of goal . Publications de référence : New Canaan, CT.
  • Marken, Richard S. (2002) Plus de lectures d'esprit : Méthodes et modèles dans l'étude du but . Chapel Hill, Caroline du Nord : nouvelle vue. ISBN  0-944337-43-0
  • Plooij, FX (1984). Le développement comportemental des bébés et nourrissons chimpanzés vivant en liberté . Norwood, New Jersey : Ablex.
  • Plooij, FX (2003). "La trilogie de l'esprit". Dans M. Heimann (Ed.), Périodes de régression dans l'enfance humaine (pp. 185-205). Mahwah, New Jersey : Erlbaum.
  • Pouvoirs, William T. (1973). Comportement : Le contrôle de la perception. Chicago : Aldine de Gruyter. ISBN  0-202-25113-6 . [2e exp. éd. = Pouvoirs (2005)].
  • Pouvoirs, William T. (1989). Systèmes de contrôle vivants . [Articles choisis 1960-1988.] New Canaan, CT: Benchmark Publications. ISBN  0-9647121-3-X .
  • Pouvoirs, William T. (1992). Systèmes de contrôle vivants II . [Articles choisis 1959-1990.] New Canaan, CT: Benchmark Publications.
  • Pouvoirs, William T. (1998). Donner un sens au comportement : le sens du contrôle. New Canaan, Connecticut : Publications de référence. ISBN  0-9647121-5-6 .
  • Pouvoirs, William T. (2005). Comportement : Le contrôle de la perception. New Canaan : Publications de référence. ISBN  0-9647121-7-2 . [2e exp. éd. des Pouvoirs (1973). tr. chinois. (2004) Guongdong Higher Learning Education Press, Guangzhou, Chine. ISBN  7-5361-2996-3 .]
  • Pouvoirs, William T. (2008). Living Control Systems III : Le fait de contrôler. [Annexe mathématique par le Dr Richard Kennaway. Inclut des programmes informatiques pour que le lecteur démontre et teste expérimentalement la théorie.] New Canaan, CT: Benchmark Publications. ISBN  978-0-9647121-8-8 .
  • Pouvoirs, Guillaume. T., Clark, RK et McFarland, RL (1960). "Une théorie générale de la rétroaction du comportement humain [Partie 1; Partie 2]. Compétences perceptives et motrices 11, 71-88; 309-323.
  • Powers, William T. et Runkel, Philip J. 2011. Dialogue concernant les deux principales approches d'une science de la vie : images de mots et corrélations versus modèles de travail . Hayward, CA: Living Control Systems Publishing ISBN  0-9740155-1-2 .
  • Robertson, RJ & Powers, WT (1990). Introduction à la psychologie moderne : le point de vue de la théorie du contrôle. Gravel Switch, KY : Groupe de systèmes de contrôle.
  • Robertson, RJ, Goldstein, DM, Mermel, M. et Musgrave, M. (1999). Test de soi comme système de contrôle : enjeux théoriques et méthodologiques. Int. J. Human-Computer Studies, 50, 571-580.
  • Runkel, Philip J[ulian]. 1990. Filets de coulée et spécimens d'essai : Deux grandes méthodes de psychologie . New York : Praeger. ISBN  0-275-93533-7 . [Repr. 2007, Hayward, CA: Living Control Systems Publishing ISBN  0-9740155-7-1 .]
  • Runkel, Philip J[ulian]. (2003). Les gens comme des êtres vivants . Hayward, Californie : Living Control Systems Publishing ISBN  0-9740155-0-4
  • Taylor, Martin M. (1999). "Editorial: Perceptual Control Theory and its Application," International Journal of Human-Computer Studies , Vol 50, No. 6, June 1999, pp. 433-444.

Sociologie

  • McClelland, Kent (1994). "Contrôle perceptif et pouvoir social". Perspectives sociologiques . 37 (4) : 461-496. doi : 10.2307/1389276 . JSTOR  1389276 . S2CID  144872350 .
  • McClelland, Kent (2004). « Le contrôle collectif des perceptions : construire l'ordre à partir du conflit ». Journal international d'études humaines-informatiques . 60 : 65-99. doi : 10.1016/j.ijhcs.2003.08.003 .
  • McClelland, Kent et Thomas J. Fararo , éd. (2006). But, signification et action : théories des systèmes de contrôle en sociologie. New York : Palgrave Macmillan.
  • McPhail, Clark. 1991. Le mythe de la foule folle . New York : Aldine de Gruyter.

Les références

Liens externes

Des articles

l'audio

Sites Internet