Hypothèse de codage efficace - Efficient coding hypothesis

L' hypothèse du codage efficace a été proposée par Horace Barlow en 1961 comme modèle théorique du codage sensoriel dans le cerveau . Dans le cerveau, les neurones communiquent entre eux en envoyant des impulsions électriques appelées potentiels d'action ou pointes. L'un des objectifs des neurosciences sensorielles est de déchiffrer la signification de ces pointes afin de comprendre comment le cerveau représente et traite les informations sur le monde extérieur. Barlow a émis l'hypothèse que les pointes dans le système sensoriel formaient un code neuronal pour représenter efficacement les informations sensorielles. Par efficace Barlow signifiait que le code minimisait le nombre de pointes nécessaires pour transmettre un signal donné. Ceci est quelque peu analogue à la transmission d'informations sur Internet, où différents formats de fichiers peuvent être utilisés pour transmettre une image donnée. Différents formats de fichiers nécessitent un nombre différent de bits pour représenter la même image à un niveau de distorsion donné, et certains sont mieux adaptés pour représenter certaines classes d'images que d'autres. Selon ce modèle, le cerveau utiliserait un code adapté à la représentation d'informations visuelles et sonores représentatives de l'environnement naturel d'un organisme.

Neurone étiqueté

Codage efficace et théorie de l'information

Le développement de l'hypothèse de Barlow a été influencé par la théorie de l'information introduite par Claude Shannon seulement une décennie auparavant. La théorie de l'information fournit le cadre mathématique pour l'analyse des systèmes de communication. Il définit formellement des concepts tels que l' information , la capacité de canal et la redondance . Le modèle de Barlow traite la voie sensorielle comme un canal de communication où le pic neuronal est un code efficace pour représenter les signaux sensoriels. Le code de dopage vise à maximiser la capacité de canal disponible en minimisant la redondance entre les unités de représentation. H. Barlow n'est pas le premier à introduire l'idée : elle apparaît déjà dans un article de 1954 écrit par F. Attneave.

Une prédiction clé de l'hypothèse de codage efficace est que le traitement sensoriel dans le cerveau doit être adapté aux stimuli naturels. Les neurones du système visuel (ou auditif) doivent être optimisés pour coder des images (ou des sons) représentatives de celles trouvées dans la nature. Des chercheurs ont montré que des filtres optimisés pour coder des images naturelles conduisent à des filtres qui ressemblent aux champs récepteurs des cellules simples de V1 . Dans le domaine auditif, l'optimisation d'un réseau de codage des sons naturels conduit à des filtres qui ressemblent à la réponse impulsionnelle des filtres cochléaires présents dans l' oreille interne .

Contraintes sur le système visuel

En raison de contraintes sur le système visuel telles que le nombre de neurones et l'énergie métabolique requise pour les "activités neuronales", le système de traitement visuel doit avoir une stratégie efficace pour transmettre autant d'informations que possible. L'information doit être compressée au fur et à mesure qu'elle se déplace de la rétine vers le cortex visuel . Alors que les récepteurs rétiniens peuvent recevoir des informations à 10^9 bit/s, le nerf optique , qui est composé de 1 million de cellules ganglionnaires transmettant à 1 bit/s, n'a qu'une capacité de transmission de 10^6 bit/s. Une réduction supplémentaire se produit qui limite la transmission globale à 40 bits/s, ce qui entraîne une cécité d'inattention . Ainsi, l'hypothèse stipule que les neurones devraient coder les informations aussi efficacement que possible afin de maximiser les ressources neuronales. Par exemple, il a été démontré que les données visuelles peuvent être compressées jusqu'à 20 fois sans perte notable d'informations.

Les preuves suggèrent que notre système de traitement visuel s'engage dans une sélection ascendante. Par exemple, la cécité d'inattention suggère qu'il doit y avoir une suppression de données tôt dans la voie visuelle. Cette approche ascendante nous permet de réagir plus rapidement aux événements inattendus et saillants et est souvent dirigée par la sélection attentionnelle. Cela donne également à notre système visuel la propriété d'être orienté vers un but. Beaucoup ont suggéré que le système visuel est capable de fonctionner efficacement en décomposant les images en composants distincts. De plus, il a été avancé que le système visuel tire parti des redondances dans les entrées afin de transmettre autant d'informations que possible tout en utilisant le moins de ressources.

Système neuronal basé sur l'évolution

Simoncelli et Olshausen décrivent les trois concepts majeurs qui sont supposés être impliqués dans le développement des neurosciences des systèmes :

  1. un organisme a des tâches spécifiques à accomplir
  2. les neurones ont des capacités et des limites
  3. un organisme se trouve dans un environnement particulier.

Une hypothèse utilisée pour tester l'hypothèse de codage efficace est que les neurones doivent être adaptés de manière évolutive et développementale aux signaux naturels de leur environnement. L'idée est que les systèmes perceptifs seront les plus rapides lorsqu'ils répondront aux "stimuli environnementaux". Le système visuel doit éliminer toute redondance dans l'entrée sensorielle.

Images naturelles et statistiques

Au cœur de l'hypothèse de Barlow se trouve la théorie de l'information , qui, lorsqu'elle est appliquée aux neurosciences , soutient qu'un système neuronal codant efficacement « devrait correspondre aux statistiques des signaux qu'ils représentent ». Il est donc important de pouvoir déterminer les statistiques des images naturelles qui produisent ces signaux. Les chercheurs ont examiné divers composants des images naturelles, notamment le contraste de luminance, la couleur et la manière dont les images sont enregistrées au fil du temps. Ils peuvent analyser les propriétés des scènes naturelles via des appareils photo numériques, des spectrophotomètres et des télémètres.

Les chercheurs examinent la répartition spatiale des contrastes de luminance dans une image : les contrastes de luminance sont fortement corrélés plus ils sont proches à une distance mesurable et moins corrélés plus les pixels sont éloignés les uns des autres. L'analyse en composantes indépendantes (ICA) est un système d' algorithme qui tente de « transformer linéairement des entrées (sensorielles) données en sorties indépendantes (courants synaptiques) ». ICA élimine la redondance en décorrélant les pixels dans une image naturelle. Ainsi, les composants individuels qui composent l'image naturelle sont rendus statistiquement indépendants . Cependant, les chercheurs ont pensé que l'ICA est limité car il suppose que la réponse neuronale est linéaire, et donc décrit insuffisamment la complexité des images naturelles. Ils soutiennent que, malgré ce qui est supposé sous ICA, les composants de l'image naturelle ont une « structure d'ordre supérieur » qui implique des corrélations entre les composants. Au lieu de cela, les chercheurs ont maintenant développé une analyse des composants indépendants dans le temps (TICA), qui représente mieux les corrélations complexes qui se produisent entre les composants d'une image naturelle. De plus, un « modèle de covariance hiérarchique » développé par Karklin et Lewicki développe des méthodes de codage éparses et peut représenter des composants supplémentaires d'images naturelles telles que « l'emplacement, l'échelle et la texture de l'objet ».

Les spectres chromatiques tels qu'ils proviennent de la lumière naturelle, mais aussi tels qu'ils sont réfléchis par des "matériaux naturels" peuvent être facilement caractérisés par l' analyse en composantes principales (ACP). Étant donné que les cônes absorbent une quantité spécifique de photons de l'image naturelle, les chercheurs peuvent utiliser les réponses des cônes pour décrire l'image naturelle. Les chercheurs ont découvert que les trois classes de récepteurs coniques de la rétine peuvent coder avec précision les images naturelles et que la couleur est déjà décorrélée dans le LGN . Le temps a également été modélisé : les images naturelles se transforment au fil du temps, et nous pouvons utiliser ces transformations pour voir comment l'entrée visuelle change au fil du temps.

Une revue pédagogique du codage efficace dans le traitement visuel --- codage spatial efficace, codage couleur, codage temporel/mouvement, codage stéréo et leur combinaison --- se trouve dans le chapitre 3 du livre "Comprendre la vision : théorie, modèles, et données". Il explique comment un codage efficace est réalisé lorsque le bruit d'entrée rend la réduction de redondance plus adéquate, et comment un codage efficace dans différentes situations est lié les uns aux autres ou différent les uns des autres.

Hypothèses pour tester l'hypothèse de codage efficace

Si les neurones codent selon l'hypothèse de codage efficace, alors les neurones individuels doivent exprimer leur pleine capacité de sortie. Avant de tester cette hypothèse, il est nécessaire de définir ce qui est considéré comme une réponse neuronale. Simoncelli et Olshausen suggèrent qu'un neurone efficace doit recevoir une valeur de réponse maximale afin que nous puissions mesurer si un neurone atteint efficacement le niveau maximal. Deuxièmement, une population de neurones ne doit pas être redondante dans la transmission de signaux et doit être statistiquement indépendante. Si l'hypothèse de codage efficace est exacte, les chercheurs devraient observer qu'il y a une rareté dans les réponses des neurones : c'est-à-dire que seuls quelques neurones à la fois devraient se déclencher pour une entrée.

Approches méthodologiques pour tester les hypothèses

Une approche consiste à concevoir un modèle de traitement sensoriel précoce basé sur les statistiques d'une image naturelle, puis à comparer ce modèle prédit à la façon dont les vrais neurones répondent réellement à l'image naturelle. La deuxième approche consiste à mesurer un système neuronal répondant à un environnement naturel et à analyser les résultats pour voir s'il existe des propriétés statistiques à cette réponse.

Exemples de ces approches

1. Approche du modèle prédit

Dans une étude de Doi et al. en 2012, les chercheurs ont créé un modèle de réponse prédite des cellules ganglionnaires rétiniennes qui serait basé sur les statistiques des images naturelles utilisées, tout en considérant le bruit et les contraintes biologiques. Ils ont ensuite comparé la transmission réelle de l'information telle qu'observée dans de vraies cellules ganglionnaires de la rétine à ce modèle optimal pour déterminer l'efficacité. Ils ont découvert que la transmission d'informations dans les cellules ganglionnaires rétiniennes avait une efficacité globale d'environ 80 % et ont conclu que « la connectivité fonctionnelle entre les cônes et les cellules ganglionnaires rétiniennes présente une structure spatiale unique... compatible avec l'efficacité du codage.

Une étude de van Hateren et Ruderman en 1998 a utilisé l'ICA pour analyser des séquences vidéo et a comparé la façon dont un ordinateur a analysé les composants indépendants de l'image aux données de traitement visuel obtenues à partir d'un chat dans DeAngelis et al. 1993. Les chercheurs ont décrit les composants indépendants obtenus à partir d'une séquence vidéo comme les « blocs de construction de base d'un signal », avec le filtre de composant indépendant (ICF) mesurant « à quel point chaque bloc de construction est présent ». Ils ont émis l'hypothèse que si des cellules simples sont organisées pour sélectionner la "structure sous-jacente" des images au fil du temps, les cellules devraient alors agir comme des filtres de composants indépendants. Ils ont découvert que les ICF déterminés par l'ordinateur étaient similaires aux « champs récepteurs » observés dans les neurones réels.

Emplacement du cortex visuel primaire sur le côté droit

2. Analyser le système neuronal réel en réponse à des images naturelles

Dans un rapport publié dans Science de 2000, William E. Vinje et Jack Gallant ont décrit une série d'expériences utilisées pour tester des éléments de l'hypothèse de codage efficace, y compris une théorie selon laquelle le champ récepteur non classique (nCRF) décorréle les projections du cortex visuel primaire. . Pour tester cela, ils ont pris des enregistrements des neurones V1 chez des macaques éveillés lors de « la visualisation libre d'images et de conditions naturelles » qui simulaient des conditions de vision naturelles. Les chercheurs ont émis l'hypothèse que le V1 utilise un code clairsemé , qui est minimalement redondant et "métaboliquement plus efficace". Ils ont également émis l'hypothèse que les interactions entre le champ récepteur classique (CRF) et le nCRF produisaient ce modèle de codage clairsemé lors de la visualisation de ces scènes naturelles. Afin de tester cela, ils ont créé des chemins de balayage oculaire et ont également extrait des taches dont la taille variait de 1 à 4 fois le diamètre du CRF. Ils ont constaté que la rareté du codage augmentait avec la taille du patch. Des patchs plus grands englobaient une plus grande partie du nCRF, ce qui indique que les interactions entre ces deux régions ont créé un code clairsemé. De plus, à mesure que la taille du stimulus augmentait, la rareté augmentait également. Cela suggère que le V1 utilise du code clairsemé lorsque les images naturelles couvrent l'ensemble du champ visuel . Le CRF a été défini comme la zone circulaire entourant les emplacements où les stimuli ont évoqué des potentiels d'action . Ils ont également testé pour voir si la stimulation du nCRF augmentait l'indépendance des réponses des neurones V1 en sélectionnant au hasard des paires de neurones. Ils ont constaté qu'en effet, les neurones étaient plus fortement découplés lors de la stimulation du nCRF. En conclusion, les expériences de Vinje et Gallant ont montré que le V1 utilise un code clairsemé en utilisant à la fois le CRF et le nCRF lors de la visualisation d'images naturelles, le nCRF montrant un effet de décorrélation définitif sur les neurones qui peut augmenter leur efficacité en augmentant la quantité d'informations indépendantes. ils portent. Ils proposent que les cellules puissent représenter les composants individuels d'une scène naturelle donnée, ce qui peut contribuer à la reconnaissance des formes

Une autre étude réalisée par Baddeley et al. avaient montré que les distributions de taux de décharge des neurones V1 de l'aire visuelle du chat et des neurones inférotemporaux (IT) du singe étaient exponentielles dans des conditions naturalistes, ce qui implique une transmission optimale de l'information pour un taux de décharge moyen fixe. Une étude ultérieure sur des neurones informatiques de singe a révélé que seule une minorité était bien décrite par une distribution de décharge exponentielle. De Polavieja a fait valoir plus tard que cet écart était dû au fait que la solution exponentielle n'est correcte que pour le cas sans bruit, et a montré qu'en tenant compte du bruit, on pouvait rendre compte des résultats observés.

Une étude menée par Dan, Attick et Reid en 1996 a utilisé des images naturelles pour tester l'hypothèse qu'au début de la voie visuelle, les signaux visuels entrants seront décorrélés pour optimiser l'efficacité. Cette décorrélation peut être observée comme le « blanchiment » des spectres de puissance temporel et spatial des signaux neuronaux". Les chercheurs ont joué des films d'images naturelles devant des chats et ont utilisé un réseau multi - électrodes pour enregistrer les signaux neuronaux. les yeux des chats, puis les lentilles de contact y étant insérées . Ils ont découvert que dans le LGN , les images naturelles étaient décorrélées et ont conclu que « la voie visuelle précoce s'est spécifiquement adaptée pour un codage efficace des informations visuelles naturelles au cours de l'évolution et/ou du développement ». .

Rallonges

L'une des implications de l'hypothèse de codage efficace est que le codage neuronal dépend des statistiques des signaux sensoriels. Ces statistiques sont fonction non seulement de l'environnement (par exemple, les statistiques de l'environnement naturel), mais aussi du comportement de l'organisme (par exemple, comment il se déplace dans cet environnement). Cependant, la perception et le comportement sont étroitement liés dans le cycle perception-action. Par exemple, le processus de la vision implique divers types de mouvements oculaires . Une extension de l'hypothèse de codage efficace appelée codage efficace actif (AEC) étend le codage efficace à la perception active . Il émet l'hypothèse que les agents biologiques optimisent non seulement leur codage neuronal, mais aussi leur comportement pour contribuer à une représentation sensorielle efficace de l'environnement. Dans cette optique, des modèles de développement de la vision binoculaire active et du suivi visuel actif ont été proposés.

Le cerveau a des ressources limitées pour traiter l'information, dans la vision, cela se manifeste par le goulot d'étranglement attentionnel visuel. Le goulot d'étranglement oblige le cerveau à ne sélectionner qu'une petite fraction des informations d'entrée visuelles pour un traitement ultérieur, car le simple codage efficace des informations n'est plus suffisant. Une théorie ultérieure, l' hypothèse de saillance V1 , a été développée sur la sélection attentionnelle exogène d'informations d'entrée visuelles pour un traitement ultérieur guidé par une carte de saillance ascendante dans le cortex visuel primaire.

des reproches

Les chercheurs doivent considérer comment les informations visuelles sont utilisées : L'hypothèse n'explique pas comment les informations d'une scène visuelle sont utilisées, ce qui est le but principal du système visuel. Il semble nécessaire de comprendre pourquoi nous traitons des statistiques d'images de l'environnement car cela peut être pertinent pour la façon dont ces informations sont finalement traitées. Cependant, certains chercheurs peuvent voir la non-pertinence du but de la vision dans la théorie de Barlow comme un avantage pour la conception d'expériences.

Certaines expériences montrent des corrélations entre les neurones : lorsque l'on considère plusieurs neurones à la fois, les enregistrements "montrent une corrélation, une synchronisation ou d'autres formes de dépendance statistique entre les neurones". Cependant, il est pertinent de noter que la plupart de ces expériences n'ont pas utilisé de stimuli naturels pour provoquer ces réponses : cela peut ne pas correspondre directement à l'hypothèse de codage efficace car cette hypothèse concerne les statistiques d'images naturelles. Dans son article de synthèse, Simoncelli note que nous pouvons peut-être interpréter la redondance dans l'hypothèse de codage efficace un peu différemment : il soutient que la dépendance statistique pourrait être réduite au cours des « étapes successives du traitement », et pas seulement dans un domaine de la voie sensorielle.

Redondance observée : Une comparaison du nombre de cellules ganglionnaires rétiniennes avec le nombre de neurones du cortex visuel primaire montre une augmentation du nombre de neurones sensoriels dans le cortex par rapport à la rétine. Simoncelli note qu'un argument majeur des critiques est que plus haut dans la voie sensorielle, il y a un plus grand nombre de neurones qui gèrent le traitement des informations sensorielles, cela devrait donc sembler produire une redondance. Cependant, cette observation peut ne pas être entièrement pertinente car les neurones ont un codage neuronal différent . Dans sa revue, Simoncelli note que « les neurones corticaux ont tendance à avoir des taux de décharge plus faibles et peuvent utiliser une forme de code différente de celle des neurones rétiniens ». Les neurones corticaux peuvent également avoir la capacité de coder des informations sur des périodes plus longues que leurs homologues rétiniens. Des expériences faites dans le système auditif ont confirmé que la redondance est diminuée.

Difficile à tester : L'estimation des quantités théoriques de l'information nécessite d'énormes quantités de données, et est donc peu pratique pour la vérification expérimentale. De plus, les estimateurs informationnels sont connus pour être biaisés. Cependant, certains succès expérimentaux ont eu lieu.

Besoin de critères bien définis pour ce qu'il faut mesurer : Cette critique illustre l'un des enjeux les plus fondamentaux de l'hypothèse. Ici, des hypothèses sont faites sur les définitions des entrées et des sorties du système. Les entrées dans le système visuel ne sont pas complètement définies, mais elles sont supposées être englobées dans une collection d'images naturelles. La sortie doit être définie pour tester l'hypothèse, mais la variabilité peut se produire ici aussi en fonction du choix du type de neurones à mesurer, de leur emplacement et du type de réponses, telles que le taux de décharge ou les temps de pointe, qui sont choisis pour être mesurés. .

Comment prendre en compte le bruit : Certains soutiennent que les expériences qui ignorent le bruit ou d'autres contraintes physiques sur le système sont trop simplistes. Cependant, certains chercheurs ont pu intégrer ces éléments dans leurs analyses, créant ainsi des systèmes plus sophistiqués.

Cependant, avec des formulations appropriées, un codage efficace peut également résoudre certains des problèmes soulevés ci-dessus. Par exemple, un certain degré quantifiable de redondance dans les représentations neuronales des entrées sensorielles (se manifestant par des corrélations dans les réponses neuronales) devrait se produire lorsqu'un codage efficace est appliqué aux entrées sensorielles bruyantes. Des prédictions théoriques falsifiables peuvent également être faites, et certaines d'entre elles testées par la suite.

Applications biomédicales

Implant cochléaire

Les applications possibles de l'hypothèse de codage efficace comprennent la conception d' implants cochléaires . Ces appareils neuroprothétiques stimulent le nerf auditif par une impulsion électrique qui permet à une partie de l'audition de revenir aux personnes malentendantes ou même sourdes . Les implants sont considérés comme efficaces et efficaces et les seuls actuellement utilisés. L'utilisation de cartographies fréquence-lieu dans l'algorithme de codage efficace peut être bénéfique pour l'utilisation d'implants cochléaires à l'avenir. Des changements de conception basés sur cette hypothèse pourraient augmenter l'intelligibilité de la parole chez les patients malentendants. Des recherches utilisant la parole vocodée traitée par différents filtres ont montré que les humains avaient une plus grande précision dans le déchiffrement de la parole lorsqu'elle était traitée à l'aide d'un filtre à code efficace par opposition à un filtre cochléotrope ou à un filtre linéaire. Cela montre qu'un codage efficace des données sur le bruit offrait des avantages perceptuels et fournissait aux auditeurs plus d'informations. Des recherches supplémentaires sont nécessaires pour appliquer les découvertes actuelles aux changements médicalement pertinents de la conception des implants cochléaires.

Les références