Calcul basé sur l'homme - Human-based computation

L'informatique basée sur l'homme ( HBC ), l'informatique assistée par l'homme , l'informatique humaine omniprésente ou la pensée distribuée (par analogie à l' informatique distribuée ) est une technique informatique dans laquelle une machine remplit sa fonction en sous-traitant certaines étapes à l'homme, généralement sous forme de microtravail . Cette approche utilise les différences de capacités et les coûts alternatifs entre les humains et les agents informatiques pour réaliser une interaction symbiotique homme-ordinateur. Pour les tâches informatiques difficiles telles que la reconnaissance d'images, le calcul basé sur l'homme joue un rôle central dans la formation des systèmes d' intelligence artificielle basés sur l' apprentissage profond . Dans ce cas, le calcul basé sur l'homme a été appelé intelligence artificielle assistée par l'homme .

Dans le calcul traditionnel, un humain utilise un ordinateur pour résoudre un problème ; un humain fournit une description formalisée du problème et un algorithme à un ordinateur, et reçoit une solution à interpréter. Le calcul basé sur l'homme inverse fréquemment les rôles ; l'ordinateur demande à une personne ou à un grand groupe de personnes de résoudre un problème, puis recueille, interprète et intègre leurs solutions. Cela transforme les réseaux hybrides d'humains et d'ordinateurs en "réseaux informatiques distribués à grande échelle" où le code est partiellement exécuté dans le cerveau humain et sur des processeurs à base de silicium.

Premiers travaux

La recherche sur le calcul basé sur l'homme (en dehors de la signification historique du terme « ordinateur ») a ses origines dans les premiers travaux sur le calcul évolutif interactif (CE). L'idée derrière les algorithmes évolutionnaires interactifs est due à Richard Dawkins . Dans le logiciel Biomorphs accompagnant son livre The Blind Watchmaker (Dawkins, 1986), la préférence d'un expérimentateur humain est utilisée pour guider l'évolution d'ensembles bidimensionnels de segments de ligne. Essentiellement, ce programme demande à un humain d'être la fonction de fitness d'un algorithme évolutif, de sorte que l'algorithme puisse utiliser la perception visuelle humaine et le jugement esthétique pour faire quelque chose qu'un algorithme évolutif normal ne peut pas faire. Cependant, il est difficile d'obtenir suffisamment d'évaluations d'un seul humain si nous voulons faire évoluer des formes plus complexes. Victor Johnston et Karl Sims ont étendu ce concept en exploitant le pouvoir de nombreuses personnes pour l'évaluation de la condition physique (Caldwell et Johnston, 1991 ; Sims, 1991). En conséquence, leurs programmes pourraient évoluer de beaux visages et des œuvres d'art attrayantes pour le public. Ces programmes ont effectivement inversé l'interaction commune entre les ordinateurs et les humains. Dans ces programmes, l'ordinateur n'est plus un agent de son utilisateur, mais plutôt un coordinateur agrégeant les efforts de nombreux évaluateurs humains. Ces efforts de recherche et d'autres similaires sont devenus le sujet de recherche en sélection esthétique ou en calcul évolutif interactif (Takagi, 2001), mais la portée de cette recherche était limitée à l'externalisation de l'évaluation et, par conséquent, elle n'explorait pas pleinement le plein potentiel de l'externalisation.

Un concept du test automatique de Turing lancé par Moni Naor (1996) est un autre précurseur du calcul basé sur l'homme. Dans le test de Naor, la machine peut contrôler l'accès des humains et des ordinateurs à un service en les défiant avec un problème de traitement du langage naturel (NLP) ou de vision par ordinateur (CV) pour identifier les humains parmi eux. L'ensemble des problèmes est choisi de manière à ce qu'ils n'aient pas de solution algorithmique à la fois efficace et efficiente pour le moment. S'il existait, un tel algorithme pourrait être facilement exécuté par un ordinateur, déjouant ainsi le test. En fait, Moni Naor était modeste en appelant cela un test de Turing automatisé. Le jeu d'imitation décrit par Alan Turing (1950) ne proposait pas d'utiliser des problèmes de CV. Il ne proposait qu'une tâche spécifique de PNL, alors que le test Naor identifie et explore une large classe de problèmes, pas nécessairement du domaine de la PNL, qui pourraient être utilisés dans le même but dans les versions automatisées et non automatisées du test.

Enfin, l'algorithme génétique basé sur l' humain (HBGA) encourage la participation humaine dans plusieurs rôles différents. Les humains ne sont pas limités au rôle d'évaluateur ou à un autre rôle prédéfini, mais peuvent choisir d'effectuer un ensemble de tâches plus diversifié. En particulier, ils peuvent apporter leurs solutions innovantes au processus évolutif, apporter des modifications incrémentielles aux solutions existantes et effectuer une recombinaison intelligente. En bref, HBGA permet aux humains de participer à toutes les opérations d'un algorithme génétique typique . De ce fait, HBGA peut traiter des solutions pour lesquelles aucun opérateur d'innovation informatique n'est disponible, par exemple les langages naturels. Ainsi, HBGA a évité le besoin d'un schéma de représentation fixe qui était un facteur limitant à la fois de la CE standard et interactive. Ces algorithmes peuvent également être considérés comme de nouvelles formes d'organisation sociale coordonnées par un ordinateur (Kosorukoff et Goldberg, 2002).

Classes de calcul basé sur l'homme

Les méthodes de calcul basées sur l'homme combinent les ordinateurs et les humains dans des rôles différents. Kosorukoff (2000) a proposé une façon de décrire la division du travail dans le calcul, qui regroupe les méthodes humaines en trois classes. Le tableau suivant utilise le modèle de calcul évolutif pour décrire quatre classes de calcul, dont trois reposent sur des humains dans un certain rôle. Pour chaque classe, un exemple représentatif est présenté. La classification est en termes de rôles (innovation ou sélection) joués dans chaque cas par les humains et les processus informatiques. Cette table est une tranche de table en trois dimensions. La troisième dimension définit si la fonction organisationnelle est exécutée par des humains ou un ordinateur. Ici, il est supposé être effectué par un ordinateur.

Division du travail dans le calcul
Agente d'innovation
Ordinateur Humain

Agent de sélection
Ordinateur Algorithme génétique Tests informatisés
Humain Algorithme génétique interactif Algorithme génétique humain

Les classes de calcul basé sur l'homme de ce tableau peuvent être référencées par des abréviations à deux lettres : HC, CH, HH. Ici, la première lettre identifie le type d'agents effectuant l'innovation, la deuxième lettre précise le type d'agents de sélection. Dans certaines implémentations ( wiki est l'exemple le plus courant), la fonctionnalité de sélection humaine peut être limitée, elle peut être affichée avec un petit h.

Méthodes de calcul basées sur l'homme

  • (HC) Darwin (Vyssotsky, Morris, McIlroy, 1961) et Core War (Jones, Dewdney 1984) Ce sont des jeux où plusieurs programmes écrits par des personnes s'affrontent dans un tournoi (simulation informatique) dans lequel les programmes les plus adaptés survivront. Les auteurs des programmes copient, modifient et recombinent des stratégies efficaces pour améliorer leurs chances de gagner.
  • (CH) Interactive EC (Dawkins, 1986; Caldwell et Johnston, 1991; Sims, 1991) IEC permet à l'utilisateur de créer un dessin abstrait uniquement en sélectionnant ses images préférées, de sorte que l'homme n'effectue que des calculs de fitness et que le logiciel joue un rôle innovant. [Unemi 1998] Le style d'élevage simulé n'introduit pas de fitness explicite, juste une sélection, ce qui est plus facile pour l'homme.
  • (HH 2 ) Wiki (Cunningham, 1995) a permis d'éditer le contenu Web par plusieurs utilisateurs, c'est-à-dire pris en charge deux types d'innovation humaine (contribuer à une nouvelle page et ses éditions incrémentielles). Cependant, le mécanisme de sélection était absent jusqu'en 2002, lorsque le wiki a été augmenté d'un historique de révision permettant d'inverser les changements inutiles. Cela a fourni des moyens de sélection parmi plusieurs versions de la même page et a transformé le wiki en un outil prenant en charge l'évolution du contenu collaboratif (serait classé comme stratégie d'évolution basée sur l'homme en termes CE).
  • (HH 3 ) L'algorithme génétique basé sur l' humain (Kosorukoff, 1998) utilise à la fois la sélection basée sur l'humain et trois types d'innovation basée sur l'humain (apport de nouveau contenu, mutation et recombinaison). Ainsi, tous les opérateurs d'un algorithme génétique typique sont sous-traités à l'homme (d'où l'origine de l' human-based ). Cette idée est étendue à l'intégration des foules avec un algorithme génétique pour étudier la créativité en 2011 (Yu et Nickerson, 2011).
  • (HH 1 ) Les applications de recherche sociale acceptent les contributions des utilisateurs et tentent d'utiliser l'évaluation humaine pour sélectionner les contributions les plus appropriées qui arrivent en tête de liste. Ceux-ci utilisent un type d'innovation humaine. Les premiers travaux ont été effectués dans le contexte de l'HBGA. Digg et Reddit sont des exemples récemment populaires. Voir aussi Filtrage collaboratif .
  • (HC) Tests informatisés. Un ordinateur génère un problème et le présente pour évaluer un utilisateur. Par exemple, CAPTCHA informe les utilisateurs humains des programmes informatiques en présentant un problème qui est censé être facile pour un humain et difficile pour un ordinateur. Bien que les CAPTCHA soient des mesures de sécurité efficaces pour prévenir les abus automatisés des services en ligne, l'effort humain consacré à leur résolution est sinon gaspillé. Le système reCAPTCHA utilise ces cycles humains pour aider à numériser des livres en présentant des mots de vieux livres numérisés que la reconnaissance optique de caractères ne peut pas déchiffrer. (von Ahn et al., 2008).
  • (HC) Jeux interactifs en ligne : ce sont des programmes qui extraient des connaissances des gens de manière divertissante (Burgener, 1999 ; von Ahn 2003).
  • (HC) "Human Swarming" ou "Social Swarming" (Rosenberg, 2015). La plate-forme UNU pour l'essaimage humain établit des systèmes en boucle fermée en temps réel autour de groupes d'utilisateurs en réseau modelés sur des essaims biologiques, permettant aux participants humains de se comporter comme une intelligence collective unifiée .
  • (NHC) Le calcul humain naturel consiste à tirer parti du comportement humain existant pour extraire un travail informatique significatif sans perturber ce comportement. (Estrada et Lawhead, 2013) NHC se distingue des autres formes de calcul basé sur l'homme en ce que, plutôt que d'impliquer l'externalisation du travail de calcul à l'activité humaine en demandant aux humains d'effectuer de nouvelles tâches de calcul, il consiste à tirer parti de l'importance de calcul auparavant inaperçue dans le comportement existant .

Incitations à la participation

Dans différents projets de calcul basés sur l'homme, les gens sont motivés par un ou plusieurs des éléments suivants.

  • Recevoir une juste part du résultat
  • Compensation monétaire directe (par exemple dans Amazon Mechanical Turk , guide de recherche ChaCha , membres de Mahalo.com Answers)
  • Possibilité de participer à l'économie mondiale de l'information
  • Désir de diversifier son activité (ex : "on ne demande pas aux gens dans leur vie quotidienne d'être créatifs")
  • Satisfaction esthétique
  • Curiosité, envie de tester si ça marche
  • Volontariat, envie de soutenir une cause du projet
  • Réciprocité, échange, entraide
  • Désir de se divertir avec l'esprit de compétition ou de coopération d'un jeu
  • Désir de communiquer et de partager des connaissances
  • Désir de partager une innovation utilisateur pour voir si quelqu'un d'autre peut l'améliorer
  • Désir de jouer avec le système et d'influencer le résultat final
  • Amusant
  • Augmenter la réputation/la reconnaissance en ligne

De nombreux projets avaient exploré diverses combinaisons de ces incitations. Voir plus d'informations sur la motivation des participants à ces projets dans Kosorukoff (2000) et von Hippel (2005).

Le calcul basé sur l'humain comme forme d'organisation sociale

Considéré comme une forme d'organisation sociale, le calcul basé sur l'homme s'avère souvent, de manière surprenante, plus robuste et productif que les organisations traditionnelles (Kosorukoff et Goldberg, 2002). Ces derniers dépendent des obligations de maintenir leur structure plus ou moins figée, d'être fonctionnels et stables. Chacun d'eux est similaire à un mécanisme soigneusement conçu avec des humains en tant que parties. Cependant, cela limite la liberté de leurs employés humains et les soumet à divers types de stress. La plupart des gens, contrairement aux pièces mécaniques, ont du mal à s'adapter à certains rôles fixes qui correspondent le mieux à l'organisation. Les projets évolutifs de calcul humain offrent une solution naturelle à ce problème. Ils adaptent la structure organisationnelle à la spontanéité humaine, s'adaptent aux erreurs humaines et à la créativité et utilisent les deux de manière constructive. Cela laisse leurs participants libres d'obligations sans mettre en danger la fonctionnalité de l'ensemble, ce qui rend les gens plus heureux. Il y a encore des problèmes de recherche difficiles qui doivent être résolus avant que nous puissions réaliser le plein potentiel de cette idée.

Les techniques d'externalisation algorithmique utilisées dans le calcul humain sont beaucoup plus évolutives que les techniques manuelles ou automatisées utilisées pour gérer l'externalisation traditionnellement. C'est cette évolutivité qui permet de répartir facilement l'effort entre des milliers de participants. Il a été suggéré récemment que cette externalisation de masse est suffisamment différente de l'externalisation traditionnelle à petite échelle pour mériter un nouveau nom de crowdsourcing (Howe, 2006). Cependant, d'autres ont fait valoir que le crowdsourcing devrait être distingué du véritable calcul basé sur l'homme. Le crowdsourcing implique en effet la répartition des tâches de calcul entre un certain nombre d'agents humains, mais Michelucci soutient que cela ne suffit pas pour qu'il soit considéré comme du calcul humain. Le calcul humain nécessite non seulement qu'une tâche soit répartie entre différents agents, mais également que l'ensemble d'agents sur lesquels la tâche est répartie soit mélangé : certains d'entre eux doivent être des humains, mais d'autres doivent être des ordinateurs traditionnels. C'est ce mélange de différents types d'agents dans un système informatique qui donne au calcul basé sur l'homme son caractère distinctif. Certains cas de crowdsourcing répondent effectivement à ce critère, mais pas tous.

Human Computation organise les travailleurs via un marché des tâches avec des API, des prix des tâches et des protocoles de logiciel en tant que service qui permettent aux employeurs / demandeurs de recevoir les données produites par les travailleurs directement dans les systèmes informatiques. En conséquence, de nombreux employeurs tentent de gérer les travailleurs automatiquement via des algorithmes plutôt que de répondre aux travailleurs au cas par cas ou de répondre à leurs préoccupations. Répondre aux travailleurs est difficile à adapter aux niveaux d'emploi permis par les plates-formes de microtravail de calcul humain. Les travailleurs du système Mechanical Turk, par exemple, ont signalé que les employeurs en informatique humaine peuvent ne pas répondre à leurs préoccupations et à leurs besoins.

Applications

L'assistance humaine peut être utile pour résoudre tout problème d' IA , qui par définition est une tâche impossible à faire pour les ordinateurs mais réalisable pour les humains. Les applications pratiques spécifiques incluent :

Critique

L'informatique basée sur l'homme a été critiquée comme exploitante et trompeuse avec le potentiel de saper l'action collective (Zittrain 2010 ; Jafarinaimi 2012).

En philosophie sociale, il a été soutenu que le calcul basé sur l'homme est une forme implicite de travail en ligne (Mühlhoff 2019). Le philosophe Rainer Mühlhoff distingue cinq types différents de « capture machinique » du microtravail humain dans les « réseaux hybrides homme-ordinateur » : (1) la gamification, (2) « le piégeage et le suivi » (par exemple, les CAPTCHA ou le suivi des clics dans la recherche Google), (3) exploitation sociale (par exemple, taguer des visages sur Facebook), (4) extraction d'informations et (5) travail au clic (comme sur Amazon Mechanical Turk ). Mühlhoff soutient que le calcul basé sur l'homme alimente souvent les systèmes d' intelligence artificielle basés sur l' apprentissage en profondeur , un phénomène qu'il analyse comme « l'intelligence artificielle assistée par l'homme » (Mühlhoff 2019).

Voir également

Les références

  • Turing, AM (1950). Machines informatiques et intelligence. Esprit, 59, 433-460.
  • Dawkins, R. (1986) L'horloger aveugle, Longman, 1986; Livres Pingouin 1988.
  • Caldwell, C. et Johnston VS (1991), Tracking a Criminal Suspect through "Face-Space" with a Genetic Algorithm, dans Actes de la quatrième conférence internationale sur l'algorithme génétique, Morgan Kaufmann Publisher, pp. 416-421, juillet 1991. (Brevet américain 5 375 195 déposé le 29.06.1992) Brevet américain 5 375 195
  • Dong, H., Hussain, FK, Chang, E. : Une plate-forme de services sémantiques centrée sur l'humain pour l'environnement des écosystèmes numériques. World Wide Web 13(1-2) (mars 2010) pp. 75-103
  • Dong, H., Hussain, FK, Chang, E. : UCOSAIS : Un cadre pour la recherche d'informations publicitaires sur les services en ligne centrée sur l'utilisateur. La 14e conférence internationale sur l'ingénierie des systèmes d'information Web (WISE 2013) (octobre 2013) pp. 267-276
  • Dong, H., Hussain, FK : modèle de sélection et de classement des services centré sur le demandeur de service pour les écosystèmes de transport numériques. L'informatique. 97(1) (janvier 2015) p. 79-102.
  • Sims, K. (1991) Artificial Evolution for Computer Graphics, Computer Graphics, 25(4) (SIGGRAPH'91), 319-328 (brevet américain 6,088,510 déposé 1992.07.02) Brevet américain 6,088,510
  • Herdy, M. (1996) Stratégies d'évolution avec sélection subjective. Dans Parallel Problem Solving from Nature, PPSN IV, Volume 1141 de LNCS (pp. 22–31)
  • Moni Naor (1996) Vérification d'un humain dans la boucle, ou Identification via le test de Turing, en ligne .
  • Unemi, T. (1998) A Design of multi-field user interface for simulationd reproduction, Actes du troisième symposium asiatique sur les systèmes flous et intelligents, 489–494
  • Kosorukoff (1998) Alex Kosorukoff, Free Knowledge Exchange, algorithme génétique basé sur l'homme sur la description de l' archive web
  • Lillibridge, MD, et al. (1998) Méthode pour restreindre sélectivement l'accès aux systèmes informatiques, brevet américain US Patent 6,195,698
  • Burgener (1999) Vingt questions : le réseau neuronal sur le site d' archives Internet
  • Kosorukoff, A. (2000) Structures de classification sociale. Prise de décision optimale dans une organisation, Conférence sur le calcul génétique et évolutionnaire, GECCO-2000, Articles de dernière minute, 175-178 en ligne
  • Kosorukoff, A. (2000) Algorithme génétique humain en ligne
  • Cunningham, Ward et Leuf, Bo (2001) : La manière Wiki. Collaboration rapide sur le Web. Addison-Wesley, ISBN  0-201-71499-X .
  • Hideyuki Takagi (2001) Calcul évolutif interactif : Fusion des capacités d'optimisation EC et d'évaluation humaine, Actes de l'IEEE, vol.89, no. 9, p. 1275-1296
  • Kosorukoff, A. (2001) Algorithme génétique à base humaine. Transactions IEEE sur les systèmes, l'homme et la cybernétique, SMC-2001, 3464-3469
  • Kosorukoff, A. & Goldberg, DE (2001) Algorithmes génétiques pour l'innovation sociale et la créativité (rapport Illigal n° 2001005). Urbana, Illinois : Université de l'Illinois à Urbana-Champaign en ligne
  • Kosorukoff, A., Goldberg DE (2002) L'algorithme génétique en tant que forme d'organisation, Actes de la conférence sur le calcul génétique et évolutionnaire, GECCO-2002, pp 965-972 en ligne
  • Fogarty, TC, (2003) Automatic concept evolution, Actes de la deuxième conférence internationale de l'IEEE sur l'informatique cognitive.
  • Mühlhoff, R, (2019) Intelligence artificielle assistée par l'homme : ou comment exécuter de grands calculs dans le cerveau humain ? Vers une sociologie des médias du machine learning, in New Media & Society. ISSN 1461-4448, pp 1–17, doi:10.1177/1461444819885334 ( sagepub.com , philpapers.org preprint ).
  • von Ahn, L., Blum, M., Hopper, N., et Langford, J. (2003) CAPTCHA: Using Hard AI Problems for Security, in Advances in Cryptology, E. Biham, Ed., vol. 2656 de Lecture Notes in Computer Science (Springer, Berlin, 2003), pp. 294-311. en ligne
  • von Ahn, L. (2003) Méthode d'étiquetage d'images via un jeu informatique Demande de brevet américain 10/875913
  • von Ahn, L. et Dabbish, L. (2004) Étiquetage d'images avec un jeu informatique. Actes de la conférence SIGCHI sur les facteurs humains dans les systèmes informatiques (Association for Computing Machinery, New York, 2004), pp. 319-326. en ligne
  • Estrada, D. et Lawhead, J. (2014) Gaming the Attention Economy. Dans The Handbook of Human Computation, Pietro Michelucci (éd.), (Springer, 2014) en ligne
  • Fogarty, TC et Hammond, MO (2005) Co-operative OuLiPian Generative Literature using Human Based Evolutionary Computing, GECCO 2005, Washington DC.
  • Jafarinaimi, Nassim. "Explorer le caractère de la participation aux médias sociaux : le cas de Google Image Labeler." Actes de la iConférence 2012. ACM, 2012. en ligne
  • von Hippel, E. (2005) Démocratiser l'innovation, MIT Press en ligne
  • Gentry, C., et al. (2005) Secure Distributed Human Computation à la neuvième conférence internationale sur la cryptographie financière et la sécurité des données FC'2005 en ligne
  • Howe, J. (2006) The Rise of Crowdsourcing, Wired Magazine, juin 2006. en ligne
  • von Ahn, L., Kedia, M. et Blum, M. (2006) Verbosity: A Game for Collecting Common-Sense Facts, ACM CHI Notes 2006 en ligne
  • von Ahn, L., Ginosar, S., Kedia, M. et Blum, M. (2006) Améliorer l'accessibilité du Web avec un jeu informatique, ACM CHI Notes 2006 en ligne
  • Sunstein, C. (2006) Infotopia: How Many Minds Produce Knowledge, Oxford University Press, site web site web
  • Tapscott, D., Williams, AD (2007) Wikinomics, Portfolio Site à couverture rigide
  • Shahaf, D., Amir, E. (2007) Vers une théorie de la complétude de l'IA. Commonsense 2007, 8e Symposium international sur les formalisations logiques du raisonnement de sens commun en ligne .
  • von Ahn, L., Maurer, B., McMillen, C., Abraham, D. et Blum, M. (2008) reCAPTCHA : reconnaissance de caractères basée sur l'homme via des mesures de sécurité Web. Science, 12 septembre 2008. Pages 1465-1468. en ligne
  • Malone, TW, Laubacher, R., Dellarocas (2009) Exploiter les foules : cartographier le génome de l'intelligence collective en ligne
  • Yu, L. et Nickerson, JV (2011) Cuisiniers ou cordonniers ? La créativité des foules par la combinaison en ligne
  • Zittrain, J., Minds for Sale., mars 2010. en ligne

Notes de bas de page