_: Université de Savoie U.F.R . Lettres , Langues et Sciences Humaines Les réseaux de neurones écologiques : leurs apports à la compréhension et à la simulation de phénomènes psychologiques Thèse de doctorat nouveau régime mention Psychologie présentée et soutenue publiquement le 19 décembre 2003 par Adeline PAIGNON Laboratoire de Psychologie et NeuroCognition ( CNRS , UMR 5105 ) Ecole doctorale Sciences de l' Homme , des Humanités et de la Société Directeur de Thèse : Serge CARBONNEL , Professeur à l' Université de Savoie ( Laboratoire de Psychologie et NeuroCognition , Grenoble-Chambéry ) Co-directeurs : Olivier DESRICHARD et Thierry BOLLON , Maîtres de Conférences à l' Université de Savoie ( Laboratoire de Psychologie Sociale , Grenoble-Chambéry ) Membres du jury Nicole Dubois , Professeur à l' université de Nancy II Bernard Amy , Ingénieur recherche au CNRS , IMAG Yannick Blandin , Professeur à la faculté des Sciences du Sport de Poitiers Frank van Overwalle , Professeur à Vrije Universiteit Brussel Sommaire PREAMBULE L' intérêt grandissant des chercheurs en psychologie pour l' utilisation des modèles connexionistes a suscité la question de départ de ce travail de thèse : ce formalisme peut -il constituer une nouvelle stratégie de recherche en psychologie sociale ? Le connexionisme permet de concevoir des modèles répliquant le fonctionnement cognitif de l' individu au cours d' une situation sociale ( Chapitre théorique 1 ) . Par référence à l' inspiration neurologique dont ils sont issus , les modèles connexionistes , ou en réseaux de neurones artificiels , postulent que le système cognitif est une structure d' unités simples interconnectées qui sont capables d' apprendre en codant les informations de façon non symbolique ( Hatfield , 1991 ; Hinton , McClelland & Rumelhart , 1986 ) . L' introduction des modèles connexionistes en psychologie sociale marque l' intérêt de cette approche comme une nouvelle façon de concevoir et d' interpréter les phénomènes psychologiques en proposant des stratégies de recherches radicalement différentes ( Kashima van Overwalle Smith , 1996 ) . En effet , les propriétés inhérentes au traitement parallèle des informations et leur format de stockage contribuent à la compréhension des activités cognitives mises en jeu lors des interactions sociales . De plus , les modèles connexionistes peuvent fournir un substrat d' étude et proposer des hypothèses alternatives à celles des théories classiques . Ceci , en donnant la possibilité de considérer des mécanismes intégratifs explicatifs des phénomènes étudiés , à partir de la structure et du fonctionnement du modèle connexioniste ( Smith & DeCoster , 1998 ) . De plus , ils peuvent être utilisés , à partir de la simulation , pour proposer des prédictions comportementales humaines et ils permettent la réflexion dynamique autour des processus qu' ils modélisent . Ce sont toutes ces propriétés qui finalement intéressent les chercheurs en psychologie sociale et nous intéressent nous même . Néanmoins , les modèles connexionistes actuels présentent une contrainte d' utilisation forte . En effet , le réseau de neurones implémentant le phénomène étudié nécessite une phase préalable de définition des informations dont il doit disposer pour être en mesure d' émettre des réponses appropriées . Dès lors , cela implique de définir au préalable le type d' exemplaires devant être appris par le réseau de neurones pour répliquer un phénomène existant et de créer une seconde base d' exemplaires sur laquelle le réseau de neurones pourra être testé . Nous proposerons de dépasser cette contrainte , en nous inspirant de l' idée du formalisme écologique développée en vie artificielle ( Cecconi , Nolfi & Parisi , 1990 ; Parisi , 1997 ) pour développer nous même un modèle dont les contraintes d' apprentissage seront définies par l' environnement social et/ou physique . Tout en maintenant les mêmes propriétés que celles des modèles connexionistes classiques , ce formalisme offre la possibilité de prendre en compte non seulement les processus impliqués pour l' individu , mais de considérer ses interactions avec l' environnement . Dans cette perspective , le modèle connexioniste n' est plus envisagé comme un outil statique de réception d' informations prédéfinies , mais comme un outil dynamique d' intégration d' informations provenant de l' environnement . Le réseau de neurones est considéré comme un agent actif pour lequel les conditions d' apprentissage résultent de ses interactions avec l' environnement , et non d' une base d' informations prédéfinies . L' originalité réside ici dans la conception d' agents considérés comme acteur de leur perception et de leur apprentissage puisqu' ils bénéficient de leur interaction avec l' environnement . Afin de rendre compte de l' intérêt d' introduire ce nouveau formalisme en psychologique sociale , nous nous appuierons sur une théorie impliquant par essence la présence de plusieurs individus : la théorie de l' apprentissage par observation ( Bandura , 1977 , 1986 ) . Cette théorie propose qu' à partir de l' observation des comportements émis par autrui , l' individu est en mesure de les apprendre , de les intégrer et de les reproduire dans des situations analogues , ou de les adapter à de nouvelles situations ( Chapitre théorique 2 ) . Selon Bandura ( 1977 ) , l' apprentissage par observation met en jeu des processus cognitifs répartis en une phase d' acquisition permettant l' élaboration d' une représentation symbolique des comportements observés et en une phase de production impliquant l' utilisation de cette représentation comme guide au comportement ultérieur . Ceci est soutenu par nombre d' études indiquant que la seule phase d' acquisition ( observation ) ne suffit pas à reproduire le comportement observé et qu' une phase de production est indispensable . Selon certains auteurs , cette phase où l' individu produit effectivement le comportement s' avère déterminante de la qualité de la performance obtenue en reproduction ( Deakin & Proteau , 2000 ) . Nous émettrons cependant quelques réserves quant à l' efficacité supposée de cette phase de production . Nous nous intéresserons en particulier à l' apprentissage par observation des habiletés motrices pour lesquelles nous montrerons que la nécessité de la construction d' une représentation symbolique ne va pas de soi . Bien que nombre d' auteurs s' accordent sur l' importance de la représentation symbolique construite ( Abravanel Bandura Carroll & Bandura , 1982 , 1985 , 1987 , 1990 ; Berger , Carli , Hammersla , Kashmer & Sanchez , 1979 ; Williams , 1987 ) , peu d' éléments nous semblent soutenir que la transformation des actions perçues en symbole soit le seul moyen de parvenir à un apprentissage efficace . Nous envisagerons l' hypothèse d' un apprentissage par observation médiatisé par la construction d' une représentation distribuée du comportement observé . Dans la deuxième partie de ce manuscrit , nous proposons de concevoir un modèle connexioniste écologique de l' apprentissage par observation des habiletés motrices et de tester sa fiabilité et sa capacité prédictive . Après avoir exposé les caractéristiques de base que nous avons retenues pour concevoir l' implémentation connexioniste écologique de l' apprentissage par observation , nous testerons sa fiabilité à répliquer le phénomène d' apprentissage par observation ( chapitre expérimental 1 ) . Pour cela nous vérifierons qu' il simule efficacement l' acquisition de nouveaux comportements comme résultants du déterminisme réciproque entre facteur personnel , comportement et environnement ( Bandura , 1986 ) . Suite à la vérification du fonctionnement du modèle , et notamment l' efficacité de l' implémentation du guidage du comportement émis par la représentation distribuée ( simulation 1 ) , nous nous intéresserons à sa capacité à produire des comportements différenciés ( simulation 2 ) . Ces simulations nous amènerons à considérer le formalisme connexioniste écologique comme un moyen de rendre compte de ce multi déterminisme de l' apprentissage . Par ailleurs , nous pensons que la validation d' un modèle connexioniste nécessite de vérifier sa capacité à répliquer certains résultats classiques . Nous nous appuierons , pour cela , sur les résultats obtenus par Bandura et Jeffery ( 1973 ) sur la dégradation de performance entre représentation construite et comportement produit . Nous verrons qu' au-delà de la simple réplication , notre modèle permet de suggérer une explication de cette dégradation ( simulation 3 ) . De plus , nous avons indiqué que l' utilisation du formalisme écologique maintenait les mêmes propriétés que celles exhibées par les modèles connexionistes classiques . Néanmoins , il convient d' en proposer une vérification . Ainsi , nous vérifierons que l' utilisation du formalisme écologique maintient les propriétés de généralisation et de transfert des connaissances et ce en regard des résultats obtenus sur des tâches de transfert avec des sujets humains ( simulation 4 ) . Si notre modèle connexioniste satisfait les critères de fiabilité précédents , nous proposons de tester sa capacité prédictive ( chapitre expérimental 2 ) . Pour cela , nous présenterons trois études au cours desquelles desquelles les prédictions proposées par le modèle seront confrontées aux données recueillies auprès de sujets humains pour une tâche équivalente . La théorie de l' apprentissage par observation conduit à considérer les phases d' acquisition et de production comme indispensables à l' apprentissage efficace de nouveaux comportements . Cependant , l' influence de chacune de ces phases est difficilement dissociable dans les études actuelles . En effet , selon Carroll et Bandura ( 1990 ) la phase d' acquisition est déterminante de la performance puisque cette phase conduit à l' élaboration d' une représentation du comportement observé à partir de laquelle la production est guidée . Cela conduit à suggérer que plus la représentation est fiable , meilleure est la reproduction . Néanmoins , selon Deakin et Proteau ( 2000 ) la phase de production est déterminante , puisqu' elle permet de détecter et de corriger les erreurs de comportement et par extension les erreurs de mémorisation . Si les deux propositions nous semblent complémentaires , il n' en demeure pas moins qu' elles font suite à des études où l' influence de chacune des phases ne peut être dissociée puisqu' elles sont conduites selon un protocole intercalant l' observation et la pratique . Pour répondre à cette ambiguïté , nous envisagerons de façon spécifique l' influence de chacune des phases , en examinant l' évolution de l' apprentissage en fonction des conditions d' observation et de pratique ( étude 1 et 2 ) . Par ailleurs , nous nous intéresserons à l' influence de la qualité de la démonstration observée sur l' apprentissage ( étude 3 ) . Nous proposerons dans une dernière partie d' envisager les contributions d' un tel modèle . Nous discuterons ainsi de l' hypothèse d' un apprentissage par observation médiatisé par la construction écologique d' une représentation non symbolique et des capacités prédictives du modèle . PARTIE THEORIQUE Chapitre 1 : Apport de l' approche connexioniste à la psychologie sociale Le connexionisme réapparaît au milieu des années 1980 suite à la publication influente des travaux de McClelland et du groupe PDP ( Parallel Distributed Process ) en 1986 . Cette approche considère les activités cognitives non plus comme relevant de la manipulation de symboles , mais comme un système unique dans lequel connaissances et processus ne sont pas dissociés . L' approche connexioniste s' inspire des propriétés de base des neurones du cerveau humain et postule qu' un système cognitif peut être simulé par un réseau de neurones artificiel capable d' apprendre en codant les informations de façon non symbolique ( Hinton , McClelland Hatfield , 1991 ) . L' hypothèse principale à la base de l' essor du connexionisme est que le comportement intelligent est sous-tendu par un ensemble de mécanismes mentaux qui peuvent être simulés par un réseau de neurones artificiel . Le point d' ancrage des recherches fondées sur cette approche se situe dans la compréhension des activités cognitives , et leur introduction en psychologie sociale marque l' intérêt de cette approche comme une nouvelle façon de concevoir et d' interpréter les phénomènes psychologiques en proposant des stratégies de recherche radicalement différentes . En effet , dans les postulats de tels modèles , il est considéré que les unités et les processus sont un ensemble indissociable . L' information est traitée en parallèle et aucune règle pré-établie ne définit la façon dont cette information doit être traitée . Néanmoins , comme nous le verrons , les modèles connexionistes développés en psychologie sociale utilisent le formalisme classique des réseaux de neurones dont les contraintes d' utilisation ne permettent pas de rendre compte des interactions auxquelles les individus sont soumis . Nous nous proposons de prendre en compte ces interactions d' une façon plus dynamique en utilisant le formalisme des réseaux de neurones écologiques ( Parisi , Cecconi & Nolfi , 1990 ) . Ce formalisme propose d' utiliser le réseau de neurones non plus comme une entité statique mais comme un agent actif . Ce principe permet de prendre en compte non plus les processus impliqués pour l' individu dans des situations prédéfinies , mais de considérer qu' il est acteur de ses perceptions et qu' il entretient avec son environnement une relation qui détermine ses apprentissages . Après avoir exposé brièvement les principes fondamentaux de l' approche symbolique , nous examinerons quelques notions relatives à l' organisation des réseaux de neurones . Il existe certes de nombreux modèles de réseaux de neurones , nous ne présenterons cependant que les éléments nécessaires à la suite de l' exposé . Nous proposons pour cela de décrire successivement leur architecture et leur fonctionnement pour illustrer ensuite les notions d' apprentissage et de mémorisation . Nous exposerons par ailleurs le principe des réseaux de neurones écologiques afin d' en définir les apports complémentaires au formalisme classique . La dernière section de ce chapitre est destinée à présenter quelques travaux actuellement réalisés en psychologie sociale à partir de ce type de modèle et les apports d' un tel formalisme à la compréhension des phénomènes sociaux . 1 . D' une conception symbolique à une conception connexioniste 1.1 . Les modèles symboliques Les modèles symboliques postulent que l' individu stocke en mémoire des représentations construites à partir des symboles langagiers ( concepts ) . Ce sont les règles de manipulation de ces symboles qui sont à l' origine des activités cognitives . Comme le définit Newell ( 1980 ) , l' approche symbolique propose de considérer « un ensemble d' entités , appelées symboles , qui sont des structures physiques qui peuvent apparaître comme des composantes d' un autre type d' entités dites expressions . ( ... ) En outre , le système contient un ensemble de procédures qui transforment les expressions en d' autres expressions » . Ainsi , les symboles stockés sont traités par combinaison , comparaison , ou ajustement , et renvoient les réponses de l' individu . Par exemple , un individu peut utiliser les concepts de « verre » , « rempli » et « eau » , pour construire une proposition du type « le verre est rempli d' eau » . Les modèles symboliques postulent que l' individu stocke en mémoire des représentations construites à partir des symboles langagiers ( concepts ) . Ce sont les règles de manipulation de ces symboles qui sont à l' origine des activités cognitives . Comme le définit Newell ( 1980 ) , l' approche symbolique propose de considérer « un ensemble d' entités , appelées symboles , qui sont des structures physiques qui peuvent apparaître comme des composantes d' un autre type d' entités dites expressions . ( ... ) En outre , le système contient un ensemble de procédures qui transforment les expressions en d' autres expressions » . Ainsi , les symboles stockés sont traités par combinaison , comparaison , ou ajustement , et renvoient les réponses de l' individu . Par exemple , un individu peut utiliser les concepts de « verre » , « rempli » et « eau » , pour construire une proposition du type « le verre est rempli d' eau » . Parmi les caractéristiques principales de ces modèles , les notions de représentations discrètes et de distinction entre représentation et processus sont les plus importantes . La construction des représentations symboliques implique chez l' individu une activité cognitive particulière qui conduit , à partir de la perception des informations à la construction de concepts . Ces représentations symboliques ont la particularité d' être stockées et maintenues en mémoire sous forme d' unités discrètes et indépendantes , chacune étant porteuse de sens ( Honavar , 1994 ) . Suite aux diverses situations rencontrées , l' individu construit un ensemble de schémas représentant des successions d' événements reliés entre eux . Chaque unité ( ou schéma ) peut être accessible , changée , ou ajoutées sans qu' aucune des autres unités n' en soit pour autant modifiée . Ces unités porteuses de sens se distinguent des processus impliqués dans leurs manipulations . Même si elles sont parfois altérées par certains processus , elles n' en demeurent pas moins sous forme statique et figée . Les processus impliqués dans la manipulation des symboles peuvent être définis comme des règles qui permettent la transformation et la génération de nouvelles représentations . Le développement des modèles symboliques a permis jusqu'alors de comprendre comment en situation sociale , l' individu traite l' information et l' utilise . Par exemple , lors de la perception des personnes , l' individu cherche à travers les concepts stockés en mémoire ceux qui coïncident au plus près avec les caractéristiques de la personne perçue afin de lui attribuer un ensemble de traits , de stéréotypes . Ce processus implique un traitement séquentiel des informations et une recherche de correspondance entre ce qui est perçu et ce qui est stocké en mémoire . La rapidité avec laquelle l' individu réalise ce traitement suppose un effet automatique sous-jacent à la perception . Bien que les modèles classiques proposent des solutions adéquates à l' explication de ce phénomène et à bien d' autres , l' introduction des modèles connexionistes permet d' envisager ces phénomènes sous l' angle d' une indissociation entre les connaissances et leurs traitements . 1.2 . Les modèles connexionistes 1.2.1 . Origine du connexionisme Le connexionisme trouve son origine dans les travaux de McCulloch et Pitts ( 1943 ) sur le neurone formel . Ces auteurs essayaient de comprendre le fonctionnement du système nerveux à partir de ses composants élémentaires : les neurones . Ils considéraient le neurone comme un calculateur logique , répondant de façon binaire ( 1 ou 0 ) aux activations des synapses qui lui étaient connectées . Ces neurones calculaient leur niveau d' activation et étaient considérés comme actifs à partir d' une valeur seuil . Le résultat le plus important de ces recherches a été de montrer que tous processus pouvant être satisfaits par un nombre fini d' opérations logiques pouvaient être exécutés par un réseau de neurones composé d' unités dont l' activation est binaire ( excite ou inhibe l' unité suivante ) . Pendant la même période , Hebb ( 1949 ) cherchait à expliquer les effets de mémorisation et proposait qu' un groupe de cellule est capable d' apprendre en modifiant l' intensité des connexions qui les relient . Il énonçait ainsi ce qui deviendra le fondement de la loi de Hebb : l' activation simultanée de plusieurs cellules renforce leurs liens . Le Perceptron de Rosenblatt ( 1957 ) a permis d' introduire la notion de poids de connexions comme une force reliant les unités de façon continue plutôt que binaire et de proposer que si plusieurs unités d' entrée sont connectées à une même unité de sortie , alors il est possible d' obtenir une réponse fiable sans que les réponses des unités prises séparément ne le soient . S' intéressant à la modélisation de l' activité perceptive , Rosenblatt a développé un modèle de la rétine . Ce modèle lui a permis de mettre en évidence que s' il existe un ensemble de poids qui donne les réponses correctes à un ensemble de configuration , alors le réseau apprend à répondre correctement au terme d' un nombre fini de répétitions de la procédure d' apprentissage . L' extension du Perceptron par l' Adaline de Widrow-Hoff dans les années soixante a permis d' aller plus loin en proposant de coder les informations de façon continue plutôt que binaire ; cela étant rendu possible par l' introduction de nouvelles fonctions , sur lesquelles nous reviendrons ultérieurement . Cependant , malgré ces développements , les chercheurs se sont heurtés à différentes limites : l' incapacité de ce type de réseau à résoudre des problèmes non linéairement séparables , c' est-à-dire pour lesquels il n' existait pas de surface de décision de type hyper plan séparant les cas présentés en classes ; l' utilisation d' un apprentissage limité à une association plus ou moins forte entre les unités ; la lenteur observée pour l' acquisition des connaissances et la faiblesse de performances ont été largement soulignés lors de la publication de l' ouvrage Perceptrons par Minsky et Papert ( 1969 révisé en 1988 ) . Cet ouvrage est reconnu pour sonner le glas des réseaux de neurones en insistant notamment sur l' incapacité du Perceptron à résoudre des problèmes aussi simple que l' opération logique du « ou exclusif » ( XOR ) . Il a fallu attendre 1986 et la publication des deux volumes de McClelland , Rumelhart et le groupe PDP pour que les réseaux de neurones voient un développement nouveau . De nouvelles architectures sont apparues , telles que le Perceptron Multi Couche qui implique non plus une couche d' unités d' entrée et une couche d' unités de sortie mais plusieurs couches de cellules intercalées ( Anderson & Hinton , 1981 ) , les réseaux de Hopfield , les réseaux de Kohonen ( 1995 ) et de nouvelles règles d' apprentissage telles que la règle delta ( ou de Widrow-Hoff ) , le delta généralisé ont amené un nouvel essor dans la modélisation en réseaux de neurones ou modélisation connexioniste . Essor qui va dès lors se propager dans de nombreuses disciplines telles que la physique , la biologie et la psychologie . 1.2.2 . Caractéristiques de base et fonctionnement des modèles connexionistes Avant d' entrer dans le détail de l' utilisation des réseaux de neurones , il convient d' introduire quelques notions fondamentales de la modélisation connexioniste . Nous proposons dans cette sous-section quelques définitions et principes afin de nous familiariser avec les concepts et le langage utilisé par la suite . Il convient tout d' abord de préciser que nous distinguerons le modèle connexioniste du réseau de neurones qui l' implémente . Nous utiliserons le terme de réseaux de neurones lorsque nous définirons les caractéristiques techniques des modèles connexionistes , et parlerons de modèles connexionistes comme modèles théoriques à la base de l' explication d' un phénomène . Définir ce qu' est un modèle connexioniste nécessiterait un exposé entier , et nous nous attacherons à considérer la notion dans son sens le plus large , à savoir un outil proposant une nouvelle façon de concevoir et d' interpréter les phénomènes psychologiques . Ces modèles conduisent à proposer des explications alternatives à celle envisagées par les théories classiques , en considérant dans une seule et même structure les connaissances , leurs traitements et leurs applications . Pour cela , ils sont implémentés par des réseaux de neurones permettant de simuler les activités cognitives telles que la mémorisation et la récupération d' information . Figure 1 : Illustration d' un réseau de neurones du type Perceptron Comme nous l' avons précédemment mentionné un réseau de neurones est un ensemble d' unités élémentaires actives ( ou neurones ) reliées par des connexions représentées schématiquement sur la figure 1 . Le rôle d' un réseau de neurones est double : traiter et produire de l' information . Pour cela , il possède trois caractéristiques fondatrices : une architecture des unités computationnelles interconnectées , une méthode de codage de l' information et une méthode de récupération de cette information . Architecture des unités computationnelles L' architecture des unités composant un réseau de neurones définit la façon dont les informations , codées sous forme de valeur d' activation , vont être traitées et produites . Ces informations vont être transmises entre les unités selon un flux d' activation qui se propage par le biais des connexions qui les relient . La structure des connexions entre les unités définit l' architecture d' un réseau de neurones , et de cette architecture dépend la façon dont le flux d' activation entre unités va être propagé . Nombre d' architectures sont possibles et dépendent de l' existence ou non , à l' intérieur de la structure , de connexions de rétro-action ( cf. Annexe 1 , p . 2 ) . Parmi ces architectures , le Perceptron et le Perceptron Multi Couche possèdent une structure d' unités arrangées en couches , où la propagation du flux d' activation est unidirectionnelle . Il n' y a pas de connexion entre les unités d' une même couche , et la propagation de l' activation au travers des connexions ne se fait qu' avec les unités des couches suivantes . Ce type d' architecture permet de définir la couche d' unités d' entrée , celles qui reçoivent les informations de l' extérieur et la couche d' unités de sortie qui émettent la réponse du réseau en regard des informations d' entrée . Le Perceptron Multi Couche possède en plus une couche d' unités intermédiaires correspondant à une couche cachée . Le flux d' activation se propage donc des unités d' entrée aux unités de sortie . Nous reviendrons plus en détail sur ce type d' architecture qui nous intéresse tout particulièrement . Les réseaux de neurones récurrents se composent d' unités disposées en couche , pour lesquelles des connexions de retour sont introduites entre les unités d' une même couche ou avec des unités des couches antérieures . Ils sont principalement utilisés pour leur capacité à accéder aux informations passées . Le flux d' activation passe de la couche d' entrée à la couche de sortie , tout en effectuant une boucle de récurrence sur certaines couches ou certaines unités d' une même couche . D' autres architectures , telles que les mémoires auto-associatives et les réseaux de Hopfield , se caractérisent par des unités toutes connectées entre elles . Les unités d' entrée et de sortie sont alors les mêmes . Ce type de réseau stocke de l' information récupérable à partir de l' interrogation du système sur une partie de l' information . Ce sont des mémoires adressables par le contenu qui sont , par exemple , utilisées pour la reconstruction de l' information ( complétion ) . Les mémoires hétéro-associatives et les cartes de Kohonen distinguent les unités d' entrée et celles de sortie , et proposent d' associer à chaque information d' entrée une réponse différenciée . Ces réseaux de neurones sont utilisés en particulier pour la reconnaissance de formes ou la classification . Bien que ces différents types de réseaux de neurones partagent des principes communs , nous ne présenterons que le fonctionnement des réseaux de type Perceptron Multi Couche que nous utiliserons dans la suite de notre travail . Architecture d' un Perceptron Multi Couche A la base d' un Perceptron Multi Couche , nous trouvons des unités reliées par des connexions . Il existe deux types d' unités potentielles , celles en contact direct avec l' extérieur - les unités d' entrée et les unités de sortie - et celles sans lien direct avec l' extérieur - les unités cachées . Les unités d' entrée sont des unités qui reçoivent des informations de l' extérieur , elles représentent la couche d' entrée du réseau de neurones . Les unités de sortie sont des unités émettant de l' information à destination de l' extérieur , elles définissent la couche de sortie . Les unités cachées qui n' ont aucun lien direct avec l' extérieur s' insèrent entre les unités d' entrée et de sortie auxquelles elles sont connectées et définissent la ou les couche ( s ) cachée ( s ) . La présence et le nombre d' unités composant la couche cachée dépend du type de phénomène étudié . Par ailleurs , la couche cachée permet de donner au réseau de neurones un espace de solution plus ou moins important à la résolution d' une tâche . Nous illustrons par la figure 2 , un exemple de réseau de neurones de type Perceptron Multi Couche qui se compose d' une couche d' entrée ( trois unités de codage de l' information ) , d' une couche cachée ( deux unités ) et d' une couche de sortie ( trois unités de codage de la réponse ) . Figure 2 : Succession des couches représentatives d' un réseau de neurones de type Perceptron Multi Couche Principe de fonctionnement des unités computationnelles Si les principes qui suivent sont applicables à nombre de réseaux de neurones , nous considérerons plus particulièrement le fonctionnement de ces unités dans le cadre d' un Perceptron Multi Couche . L' activité de toutes les unités est définie par deux éléments : l' activation d' entrée de l' unité et l' activation de sortie de l' unité . Chaque unité reçoit une activation d' entrée ( aSi les principes qui suivent sont applicables à nombre de réseaux de neurones , nous considérerons plus particulièrement le fonctionnement de ces unités dans le cadre d' un Perceptron Multi Couche . L' activité de toutes les unités est définie par deux éléments : l' activation d' entrée de l' unité et l' activation de sortie de l' unité . Chaque unité reçoit une activation d' entrée ( aii ) et propose une activation de sortie ( s ) et propose une activation de sortie ( sii ) calculée par l' application d' une fonction de transfert ( f ) sur l' activation d' entrée , illustrée par l' équation : s ) calculée par l' application d' une fonction de transfert ( f ) sur l' activation d' entrée , illustrée par l' équation : sii = f ( a = f ( aii ) . Le choix de la fonction de transfert dépend du problème à traiter et de l' intervalle de valeurs que le chercheur souhaite obtenir ( les fonctions identité , seuil , logarithmique , sigmoïde sont illustrées en annexe 2 , p . 3 ) . ) . Le choix de la fonction de transfert dépend du problème à traiter et de l' intervalle de valeurs que le chercheur souhaite obtenir ( les fonctions identité , seuil , logarithmique , sigmoïde sont illustrées en annexe 2 , p . 3 ) . Unités de la couche d' entrée Les unités d' entrée codent les informations extérieures sous forme de valeurs numériques continues ou non . Ces valeurs décomposent les caractéristiques de la situation à laquelle est confronté le réseau de neurones . L' ensemble de ces valeurs est présenté aux unités de la couche d' entrée sous forme de vecteur de valeurs et chacune des unités calcule son activation de sortie par application d' une fonction de transfert . Par exemple , les unités d' entrée peuvent coder la proposition de description d' un individu « c' est un homme , bien habillé , intelligent , et beau » par un vecteur où chaque valeur correspond à un concept de la proposition . Ce vecteur pourrait avoir la forme de « bien habillé » , « intelligent » et « beau » . Au contraire , ces unités pourraient recevoir un vecteur de type [ 1 0 0 0 ] correspondant à la description du prototype inverse ( un homme , mal habillé , pas intelligent et laid ) . Unités de la couche cachée et de la couche de sortie L' activation d' entrée des unités cachées et de sortie est définie en fonction des activations de sortie des unités précédentes et des connexions entre unités . Chacune des connexions est indépendante et possède une valeur : le poids . L' activation d' entrée ( aL'activation d' entrée des unités cachées et de sortie est définie en fonction des activations de sortie des unités précédentes et des connexions entre unités . Chacune des connexions est indépendante et possède une valeur : le poids . L' activation d' entrée ( aii ) est alors générée par la somme des activations de sortie ( s ) est alors générée par la somme des activations de sortie ( sii ) reçues des unités précédentes , qui lui sont reliées , pondérées par les poids de connexions ( w ) reçues des unités précédentes , qui lui sont reliées , pondérées par les poids de connexions ( wijij ) selon l' équation a ) selon l' équation aii = = & 239;& 129;& 147;& 239;& 129;& 147;wwijij . s . sii . . De la même façon que les unités d' entrée , les unités cachées et de sortie calculent leur activation de sortie par l' application d' une fonction de transfert . L' activation produite par les unités cachées est propagée au niveau des unités de sortie et l' activation de sortie proposée par les unités de sortie correspond à la réponse du réseau de neurones . Cette réponse dépend donc du flux d' activation propagé au travers du réseau de neurones en fonction des valeurs du vecteur d' entrée auquel le réseau a été soumis et des poids de connexions . Par exemple , en réponse au vecteur d' entrée [ 1 1 1 1 ] codant la description d' un « homme bien habillé , intelligent , et beau » , une unité de sortie pourrait émettre une réponse codant le niveau de sympathie estimé pour cet individu , par exemple émettre la réponse 1 correspondant à « sympathique » . Pour résumer , un réseau de neurones est composé d' unités correspondant à une entité qui calcule l' activation qu' elle reçoit et propage ce résultat aux unités auxquelles elle est connectée . Chaque unité possède une activation d' entrée ( aPour résumer , un réseau de neurones est composé d' unités correspondant à une entité qui calcule l' activation qu' elle reçoit et propage ce résultat aux unités auxquelles elle est connectée . Chaque unité possède une activation d' entrée ( aii ) et une activation de sortie ( s ) et une activation de sortie ( sii ) qui est calculée par une fonction de transfert . La transmission de l' activation est réalisée à travers les poids de connexions qui déterminent la pondération de l' activation transmise entre unités . Comme le résume la figure 3 , pour la présentation d' un vecteur d' information ( v ) qui est calculée par une fonction de transfert . La transmission de l' activation est réalisée à travers les poids de connexions qui déterminent la pondération de l' activation transmise entre unités . Comme le résume la figure 3 , pour la présentation d' un vecteur d' information ( vii ) en entrée d' un Perceptron Multi Couche , les unités propagent un flux d' activation déterminant la réponse du réseau de neurones à cette information en sortie . ) en entrée d' un Perceptron Multi Couche , les unités propagent un flux d' activation déterminant la réponse du réseau de neurones à cette information en sortie . Figure 3 : Propagation du flux d' activation induit par la présentation d' un vecteur [ v 1 , v 2 ] sur les unités de la couche d' entrée ( a 1 , a 2 ) jusqu'à l' émission d' une réponse ( s 4 ) sur l' unité de la couche de sortie ( a 4 ) dans un réseau de neurones de type Perceptron Multi Couche Méthode de codage de l' information Nous avons indiqué que les informations étaient codées sous forme de valeur d' activation , il convient cependant de distinguer deux approches du codage de l' information dans un réseau de neurones : l' approche localiste et l' approche distributive ( cf. Rumelhart & Todd , 1993 ) . L' approche localiste considère chaque unité du réseau comme porteuse de sens . La représentation d' un concept est alors contenue par une seule et même unité . Lorsqu' une unité est activée , le chercheur peut en donner une signification conceptuelle précise : chaque unité représente alors un concept ( Grainger & Jacobs , 1998 , McClelland & Rumelhart , 1981 ) . Par exemple , dans un réseau localiste la représentation correspondant à « un homme noir avocat » et celle correspondant à « une femme blanche avocate » peuvent être codées sur cinq unités . Deux unités codent le genre : lorsque la première est activée par une valeur de 1 alors le concept « homme » est présent lorsque c' est la seconde qui est activée alors le concept « femme » est présent . De la même façon , deux autres unités peuvent coder la couleur , enfin une troisième codera la profession . L' approche localiste présente l' avantage de faciliter l' explication du sens de chaque unité activée ; néanmoins elle implique des contraintes d' utilisations très fortes . Notamment , la quantité d' unités nécessaires au codage . En effet , cette approche implique de définir spécifiquement chaque concept devant être représenté , donc d' envisager le nombre d' unités nécessaires au codage des concepts . Cela rend difficile l' implémentation de situations complexes puisqu' elles nécessiteraient un réseau comportant un très grand nombre d' unités . Si nous voulions implémenter dans un réseau localiste toutes les informations contenues dans un stéréotype , il faudrait un nombre conséquent d' unités pour les coder toutes ou sélectionner au préalable les concepts strictement nécessaires . Afin de remédier à cet inconvénient , l' approche distribuée considère qu' une unité n' a pas de sens en elle-même . La représentation est distribuée sur plusieurs unités si bien qu' un concept est représenté par un ensemble indissociable d' unités . De prime abord , cela peut conduire à penser que si un concept est représenté par plusieurs unités , alors il en faudra d' autant plus que le nombre de concepts à représenter est important . Pourtant il n' en est rien : l' unité n' a certes pas de signification en soi , mais la signification résulte de l' activation générée sur un ensemble d' unité . Pour chaque Afin de remédier à cet inconvénient , l' approche distribuée considère qu' une unité n' a pas de sens en elle-même . La représentation est distribuée sur plusieurs unités si bien qu' un concept est représenté par un ensemble indissociable d' unités . De prime abord , cela peut conduire à penser que si un concept est représenté par plusieurs unités , alors il en faudra d' autant plus que le nombre de concepts à représenter est important . Pourtant il n' en est rien : l' unité n' a certes pas de signification en soi , mais la signification résulte de l' activation générée sur un ensemble d' unité . Pour chaque pattern d' activation différent des mêmes unités , un concept différent peut être associé . Comme le souligne Hinton , d' activation différent des mêmes unités , un concept différent peut être associé . Comme le souligne Hinton , McClelland , et Rumelhart ( 1986 ) , « chaque concept est associé à un ensemble d' unités et chaque unité participe à la représentation du concept » . L' unité n' a dès lors pas signification en dehors de sa prise en considération dans l' ensemble du ( 1986 ) , « chaque concept est associé à un ensemble d' unités et chaque unité participe à la représentation du concept » . L' unité n' a dès lors pas signification en dehors de sa prise en considération dans l' ensemble du pattern d' activation dans lequel elle intervient ( cf. van Gelder , 1991 ) . D' après van Gelder ( 1990 , 1991 , 1998 ) la représentation distribuée des connaissances dans un réseau de neurones peut être considérée comme une superposition intégrative des situations rencontrées . Chaque situation peut être vue comme une feuille de papier différente , et la représentation distribuée comme la compression de toutes ces feuilles jusqu'à en obtenir une seule . Cette dernière possédant toutes les informations stockées sur chacune des feuilles de départ . Accéder à l' une des connaissances , c' est nécessairement accéder à toutes , puisque toutes les connaissances sont contenues dans la même structure d' unités . Il y a donc émergence de caractéristiques dont les propriétés ne peuvent être prédites à partir d' une quelconque combinaison de ses composantes élémentaires ( Rumelhart & McClelland , 1986 ) . d' activation dans lequel elle intervient ( cf. van Gelder , 1991 ) . D' après van Gelder ( 1990 , 1991 , 1998 ) la représentation distribuée des connaissances dans un réseau de neurones peut être considérée comme une superposition intégrative des situations rencontrées . Chaque situation peut être vue comme une feuille de papier différente , et la représentation distribuée comme la compression de toutes ces feuilles jusqu'à en obtenir une seule . Cette dernière possédant toutes les informations stockées sur chacune des feuilles de départ . Accéder à l' une des connaissances , c' est nécessairement accéder à toutes , puisque toutes les connaissances sont contenues dans la même structure d' unités . Il y a donc émergence de caractéristiques dont les propriétés ne peuvent être prédites à partir d' une quelconque combinaison de ses composantes élémentaires ( Rumelhart & McClelland , 1986 ) . Par exemple , un réseau de neurones ayant « rencontré » un « homme noir avocat » et « une femme blanche avocate » en élabore une représentation distribuée sur plusieurs unités . D' une part , aucune unité ne codera en particulier chacun des concepts présents dans chacune des propositions . D' autre part , toutes les unités participeront à la reconstruction de la représentation de l' une ou l' autre des propositions . Il n' est alors pas possible de dissocier chaque concept sans prendre en compte l' intégralité des unités qu' il active . C' est à partir de la re-création d' un état d' activation particulierPar exemple , un réseau de neurones ayant « rencontré » un « homme noir avocat » et « une femme blanche avocate » en élabore une représentation distribuée sur plusieurs unités . D' une part , aucune unité ne codera en particulier chacun des concepts présents dans chacune des propositions . D' autre part , toutes les unités participeront à la reconstruction de la représentation de l' une ou l' autre des propositions . Il n' est alors pas possible de dissocier chaque concept sans prendre en compte l' intégralité des unités qu' il active . C' est à partir de la re-création d' un état d' activation particulier [ 1 ] , suite à l' activation des unités d' entrée , que la représentation émerge et que la production de la réponse est possible . Contrairement à l' approche localiste , l' approche distribuée permet d' intégrer sur un nombre restreint d' unités un grand nombre de concepts . Cette intégration conduit à superposer toutes les situations dans une seule et même représentation , ce qui en facilite l' apprentissage et la récupération. , suite à l' activation des unités d' entrée , que la représentation émerge et que la production de la réponse est possible . Contrairement à l' approche localiste , l' approche distribuée permet d' intégrer sur un nombre restreint d' unités un grand nombre de concepts . Cette intégration conduit à superposer toutes les situations dans une seule et même représentation , ce qui en facilite l' apprentissage et la récupération . Ainsi , qu' ils soient d' architecture unidirectionnelle ou récurrente , les réseaux de neurones peuvent être considérés comme localistes ou distribués . Si pour l' approche localiste l' unité possède une signification interprétable en soi , l' approche distribuée considère la représentation comme étant stockée sous forme de Ainsi , qu' ils soient d' architecture unidirectionnelle ou récurrente , les réseaux de neurones peuvent être considérés comme localistes ou distribués . Si pour l' approche localiste l' unité possède une signification interprétable en soi , l' approche distribuée considère la représentation comme étant stockée sous forme de pattern d' activité , distribuée sur un ensemble d' éléments où chacun est impliqué dans la représentation de plusieurs concepts ( Hatfield , 1991 d' activité , distribuée sur un ensemble d' éléments où chacun est impliqué dans la représentation de plusieurs concepts ( Hatfield , 1991 ; Hinton , 1986 ; Goschke & Koppelberg , 1991 ) . Selon l' approche utilisée , la signification des concepts est proposée par une ou plusieurs unités , et les liens qui les relient déterminent dans quelle mesure ces unités doivent être prises en considération . ; Hinton , 1986 ; Goschke & Koppelberg , 1991 ) . Selon l' approche utilisée , la signification des concepts est proposée par une ou plusieurs unités , et les liens qui les relient déterminent dans quelle mesure ces unités doivent être prises en considération . Méthode de stockage et de récupération de l' information Stockage de l' information dans un réseau de neurones Pour que les informations contenues dans les unités puissent être interprétées et pour qu' un réseau de neurones soit en mesure de traiter ou récupérer de l' information , il faut que celle -ci soit stockée . Ceci qu' il ait été conçu selon une approche localiste ou distribuée de la représentation des concepts . Pour cela , la première phase d' utilisation d' un réseau de neurones consiste en une phase d' apprentissage . Selon Touzet ( 1992 ) « l' apprentissage est une phase du développement d' un réseau de neurones durant laquelle le comportement du réseau est modifié jusqu'à l' obtention du comportement désiré . L' apprentissage neuronal fait appel à des exemples de comportement » . Cette phase nécessite de définir , au préalable , une méthode d' ajustement des paramètres internes du réseau de neurones afin de traiter ( i.e. apprendre ) efficacement les exemplaires rencontrés . L' apprentissage consiste en fait en une mise à jour des poids de connexions afin de réussir la tâche demandée . Deux types d' apprentissages sont régulièrement opposés dans l' approche connexioniste : l' apprentissage non supervisé et l' apprentissage supervisé . L' apprentissage non supervisé consiste à laisser le réseau de neurones déterminer les similarités des exemplaires auxquels il est confronté . Aucune indication sur la réponse attendue n' est fournit au réseau de neurones suite à la présentation d' un vecteur d' entrée particulier . Le réseau s' adapte pas à pas par détection des régularités statistiques entre les consiste à laisser le réseau de neurones déterminer les similarités des exemplaires auxquels il est confronté . Aucune indication sur la réponse attendue n' est fournit au réseau de neurones suite à la présentation d' un vecteur d' entrée particulier . Le réseau s' adapte pas à pas par détection des régularités statistiques entre les patterns d' activations présentés en entrée . En détectant les similitudes , il est à même de générer des catégories et de classer correctement de nouvelles informations . Différentes formes d' apprentissage non supervisé ont été développées telles que : la méthode compétitive du Vector Quantitization » , les « Self Organizing Map » de Kohonen ( 1995 ) et l' « Adaptative Resonance Theory » de Carpenter et Grossberg ( 1988 ) . d' activations présentés en entrée . En détectant les similitudes , il est à même de générer des catégories et de classer correctement de nouvelles informations . Différentes formes d' apprentissage non supervisé ont été développées telles que : la méthode compétitive du Vector Quantitization » , les « Self Organizing Map » de Kohonen ( 1995 ) et l' « Adaptative Resonance Theory » de Carpenter et Grossberg ( 1988 ) . L' apprentissage supervisé , que nous utiliserons ultérieurement , consiste à faire apprendre au réseau de neurones un ensemble de couples entrée-sortie . Pour cela , il est nécessaire de présenter au réseau de neurones un ensemble d' exemplaires associant une information présentée en entrée à une réponse attendue en sortie et utiliser une règle d' apprentissage . L' objectif est d' obtenir une configuration de poids permettant au réseau de neurones de proposer en sortie , une réponse aussi proche que possible de celle attendue suite à la présentation des informations en entrée . Cela résulte de l' application d' une règle d' apprentissage permettant d' intégrer tous les exemples de situations auxquels le réseau est confronté dans un seul et même , que nous utiliserons ultérieurement , consiste à faire apprendre au réseau de neurones un ensemble de couples entrée-sortie . Pour cela , il est nécessaire de présenter au réseau de neurones un ensemble d' exemplaires associant une information présentée en entrée à une réponse attendue en sortie et utiliser une règle d' apprentissage . L' objectif est d' obtenir une configuration de poids permettant au réseau de neurones de proposer en sortie , une réponse aussi proche que possible de celle attendue suite à la présentation des informations en entrée . Cela résulte de l' application d' une règle d' apprentissage permettant d' intégrer tous les exemples de situations auxquels le réseau est confronté dans un seul et même pattern de poids de connexions . Pour réaliser cet objectif , plusieurs règles d' apprentissage peuvent être utilisées , par exemple celle de Widrow-Hoff ou delta généralisé ou la règle du gradient descendant de l' erreur ( cf . Abdi , 1994 ) . Quelle que soit la règle , il s' agit d' adapter les valeurs de poids de connexions pour converger vers une solution stable dans l' approximation d' une fonction liant les entrées aux sorties ( Bourret , Reggia Jodouin , 1994a et b ; de poids de connexions . Pour réaliser cet objectif , plusieurs règles d' apprentissage peuvent être utilisées , par exemple celle de Widrow-Hoff ou delta généralisé ou la règle du gradient descendant de l' erreur ( cf. Abdi , 1994 ) . Quelle que soit la règle , il s' agit d' adapter les valeurs de poids de connexions pour converger vers une solution stable dans l' approximation d' une fonction liant les entrées aux sorties ( Bourret , Reggia Jodouin , 1994a et b ; Renders , 1994 ) . L' adaptation des poids de connexions est réalisée suite à l' apparition simultanée d' une information présentée en entrée et d' une réponse proposée en sortie du réseau de neurones . Par exemple , la règle de Hebb ( 1949 ) consiste à renforcer les connexions entre deux unités lorsqu' elles sont activées simultanément . Ainsi , par l' augmentation ou la diminution des poids de certaines connexions il est possible de sélectionner les réponses en sortie qui correspondent à la réponse correcte . La règle delta ( ou de Widrow-Hoff ) a pour but de faire évoluer le réseau de neurones vers une solution d' approximation des couples entrée-sortie la plus efficace possible . Pour cela , les poids des connexions sont modifiés à chaque présentation d' un exemplaire en entrée afin de réduire l' écart obtenu entre l' activation de sortie attendue et celle observée , et sont adaptés selon l' équation : W ( t + 1 ) = W ( t ) + n . ( tRenders , 1994 ) . L' adaptation des poids de connexions est réalisée suite à l' apparition simultanée d' une information présentée en entrée et d' une réponse proposée en sortie du réseau de neurones . Par exemple , la règle de Hebb ( 1949 ) consiste à renforcer les connexions entre deux unités lorsqu' elles sont activées simultanément . Ainsi , par l' augmentation ou la diminution des poids de certaines connexions il est possible de sélectionner les réponses en sortie qui correspondent à la réponse correcte . La règle delta ( ou de Widrow-Hoff ) a pour but de faire évoluer le réseau de neurones vers une solution d' approximation des couples entrée-sortie la plus efficace possible . Pour cela , les poids des connexions sont modifiés à chaque présentation d' un exemplaire en entrée afin de réduire l' écart obtenu entre l' activation de sortie attendue et celle observée , et sont adaptés selon l' équation : W ( t + 1 ) = W ( t ) + n . ( tii- s- sii ) . a ) . aii , avec W le poids , t , avec W le poids , tii l' activation de sortie attendue , s l' activation de sortie attendue , sii l' activation de sortie observée , a l' activation de sortie observée , aii l' activation d' entrée et n le coefficient d' apprentissage ( le pas d' apprentissage ) choisi par le chercheur entre 0 et 1 . l' activation d' entrée et n le coefficient d' apprentissage ( le pas d' apprentissage ) choisi par le chercheur entre 0 et 1 . L' algorithme d' apprentissage par rétropropagation du gradient descendant de l' erreur , que nous utiliserons nous-même , correspond à la généralisation de la règle delta . Lorsqu' une information est présentée en entrée du réseau , il produit en sortie une réponse qui est comparée à la réponse attendue . L' algorithme permet l' ajustement des réponses du réseau à la réponse souhaitée par adaptation des poids ( cf. Stroeve , 1998 ) . Pour cela , l' algorithme cherche à minimiser l' erreur entre sortie attendue et sortie obtenue , c' est-à-dire à minimiser la fonction coût ( coût correspondant à chaque configuration des poids ) . Cela peut consiste à chercher sur la surface de coût la position de coût minimal . La minimisation du gradient ( estimation de la pente de la surface de coût ) permet de parcourir cette surface pour trouver la configuration de poids résultant en un coût le plus faible possible , ce qui traduit le minima global . Ce que beaucoup considère comme un problème majeur de cet algorithme est que l' apprentissage peut conduire à des minima locaux dans lesquels la configuration de poids peut « tomber » . Ces configurations de poids permettent seulement une solution approximative de la résolution de la tâche . Nous verrons qu' il est parfois intéressant d' utiliser ces minima locaux notamment afin d' obtenir des propositions de solutions différentes pour une même tâche . Plus précisément , la règle de rétropropagation du gradient descendant de l' erreur se décompose en deux étapes . La première consiste à mettre à jour l' activation des unités de sortie en fonction du vecteur d' entrée , et la seconde à rétropropager l' erreur observée entre la sortie obtenue et la sortie attendue . Par exemple , si nous souhaitons qu' un réseau de neurones apprenne à juger la sympathie des personnes selon leur apparence physique . Plusieurs exemplaires sont présentés en entrée du réseau codant , par exemple , la beauté ( beau et laid ) et la tenue vestimentaire ( bien habillé et mal habillé ) de chaque personne . A chaque exemplaire est associé une réponse attendue indiquant le niveau de sympathie devant être estimé par le réseau . Ainsi , pour une personne dont les caractéristiques sont « beau et bien habillé » , la réponse attendue pourrait être une valeur en sortie de 1 correspondant à une personne sympathique . Pour une personne « mal habillée et laide » , la réponse attendue serait une valeur de 0 correspondant à une personne non sympathique . Pour chaque exemplaire présenté en entrée le réseau propose , avant apprentissage , une réponse incohérente du point de vue du niveau de sympathie . L' apprentissage consiste alors à déterminer l' erreur entre l' activation des sorties proposée et celle attendue , et de la rétropropager au travers du réseau . Ce qui améliore l' estimation de la réponse que le réseau propose par la suite . De façon simplifiée , lorsque la sortie prédite est supérieure à celle attendue , les poids sont diminués ; lorsqu' elle est inférieure les poids sont augmentés . Cette règle permet l' adaptation des poids de connexion pour ajuster les réponses du réseau de neurones à un stimulus donné en entrée , et permet l' apprentissage d' un ensemble d' associations entrée-sortie ( Egmont-Peterson , Talmon , Hasman & Ambergen , 1998 ; Freeman & Skapura , 1992 ) . Pour chaque entrée présentée , le réseau est alors capable de proposer une réponse adaptée dépendante de toutes les associations apprises ou des expériences passées . Plus précisément , la règle de rétropropagation du gradient descendant de l' erreur se décompose en deux étapes . La première consiste à mettre à jour l' activation des unités de sortie en fonction du vecteur d' entrée , et la seconde à rétropropager l' erreur observée entre la sortie obtenue et la sortie attendue . Par exemple , si nous souhaitons qu' un réseau de neurones apprenne à juger la sympathie des personnes selon leur apparence physique . Plusieurs exemplaires sont présentés en entrée du réseau codant , par exemple , la beauté ( beau et laid ) et la tenue vestimentaire ( bien habillé et mal habillé ) de chaque personne . A chaque exemplaire est associé une réponse attendue indiquant le niveau de sympathie devant être estimé par le réseau . Ainsi , pour une personne dont les caractéristiques sont « beau et bien habillé » , la réponse attendue pourrait être une valeur en sortie de 1 correspondant à une personne sympathique . Pour une personne « mal habillée et laide » , la réponse attendue serait une valeur de 0 correspondant à une personne non sympathique . Pour chaque exemplaire présenté en entrée le réseau propose , avant apprentissage , une réponse incohérente du point de vue du niveau de sympathie . L' apprentissage consiste alors à déterminer l' erreur entre l' activation des sorties proposée et celle attendue , et de la rétropropager au travers du réseau . Ce qui améliore l' estimation de la réponse que le réseau propose par la suite . De façon simplifiée , lorsque la sortie prédite est supérieure à celle attendue , les poids sont diminués ; lorsqu' elle est inférieure les poids sont augmentés . Cette règle permet l' adaptation des poids de connexion pour ajuster les réponses du réseau de neurones à un stimulus donné en entrée , et permet l' apprentissage d' un ensemble d' associations entrée-sortie ( Egmont-Peterson , Talmon , Hasman & Ambergen , 1998 ; Freeman & Skapura , 1992 ) . Pour chaque entrée présentée , le réseau est alors capable de proposer une réponse adaptée dépendante de toutes les associations apprises ou des expériences passées . Récupération de l' information dans un réseau de neurones L' apprentissage d' un réseau de neurones conduit donc à l' élaboration d' une représentation intégrant tous les exemplaires appris et l' interrogation du réseau permet de considérer les connaissances acquises . Les réseaux peuvent être interrogés sur les exemplaires appris mais aussi sur des exemplaires qu' ils n' ont jamais rencontrés . Lors de la présentation d' un exemplaire rencontré en apprentissage , la propagation de l' activation des unités d' entrée jusqu'aux unités de sortie conduit à l' émission d' une réponse correcte . L' activation est propagée par les poids de connexions qui ont été adaptés si bien qu' une réponse correcte émerge . Par exemple , suite à l' apprentissage du jugement de sympathie en fonction de l' apparence physique , si un exemplaire de type « beau et bien habillé » est présenté en entrée du réseau , alors il répondra par la valeur 1 en sortie ( « c' est une personne sympathique » ) , tout comme il pourra répondre par la valeur 0 ( « ce n' est pas une personne sympathique » ) , à un exemplaire « mal habillé et laid » . Pour un nouvel exemplaire présenté au réseau , la configuration d' activation émergeante induit la réponse du réseau . Elle intègre toutes les situations acquises préalablement et reflète la proximité du nouvel exemplaire avec les anciens . Il y a émergence d' un nouveau Pour un nouvel exemplaire présenté au réseau , la configuration d' activation émergeante induit la réponse du réseau . Elle intègre toutes les situations acquises préalablement et reflète la proximité du nouvel exemplaire avec les anciens . Il y a émergence d' un nouveau pattern d' activation , et ce d' activation , et ce pattern inclut toutes les expériences auxquelles le réseau a été soumis . Pour la présentation d' un exemplaire inconnu « beau et mal habillé » le réseau sera en mesure de proposer une évaluation de son niveau de sympathie en fonction des exemplaires appris . Pour illustrer , il pourrait proposer une valeur de 0.5 indiquant une personne moyennement sympathique si chaque caractéristique possédait une force équivalente à l' élaboration de la représentation d' une personne sympathique . L' un des avantages de l' intégration de toutes les situations dans une seule et même structure de poids est qu' un réseau de neurones répond de façon raisonnable à l' information incomplète , et que tout endommagement du tout n' aboutit pas à des non-réponses . Ainsi , en présentant seulement la caractéristique « beau » le réseau de neurones peut émettre une réponse adaptée . De plus , les réseaux de neurones possèdent un fort pouvoir de généralisation à partir des exemplaires appris du fait de l' utilisation de la représentation distribuée , puisqu' ils peuvent répondre pour des exemplaires inconnus et trouver des similitudes avec ceux appris . inclut toutes les expériences auxquelles le réseau a été soumis . Pour la présentation d' un exemplaire inconnu « beau et mal habillé » le réseau sera en mesure de proposer une évaluation de son niveau de sympathie en fonction des exemplaires appris . Pour illustrer , il pourrait proposer une valeur de 0.5 indiquant une personne moyennement sympathique si chaque caractéristique possédait une force équivalente à l' élaboration de la représentation d' une personne sympathique . L' un des avantages de l' intégration de toutes les situations dans une seule et même structure de poids est qu' un réseau de neurones répond de façon raisonnable à l' information incomplète , et que tout endommagement du tout n' aboutit pas à des non-réponses . Ainsi , en présentant seulement la caractéristique « beau » le réseau de neurones peut émettre une réponse adaptée . De plus , les réseaux de neurones possèdent un fort pouvoir de généralisation à partir des exemplaires appris du fait de l' utilisation de la représentation distribuée , puisqu' ils peuvent répondre pour des exemplaires inconnus et trouver des similitudes avec ceux appris . Pour résumer , les modèles connexionistes utilisant l' approche distribuée considèrent que la totalité des poids de connexions est une seule et même représentation intégrant l' ensemble des connaissances dérivées des expériences d' apprentissage . Accéder à l' une des connaissances c' est nécessairement accéder à toutes , puisque toutes les connaissances sont contenues dans la même configuration de poids de connexions . Nous avons souligné l' intérêt de cette approche impliquant les propriétés de complétion , de généralisation mais aussi vu que les capacités d' apprentissage et de récupération des informations pouvaient être adaptées facilement à un exemple de jugement . Nous voyons ici , l' intérêt d' une telle approche pour la modélisation en psychologie sociale . Mais avant d' aller plus loin sur le développement de cet intérêt , nous proposons un détour par le formalisme des réseaux de neurones écologiques . L' idée sous-jacente à ce formalisme nous semble tout particulièrement intéressante car elle considère non plus le réseau de neurones comme un simple outil mathématique mais comme un substrat d' étude des interactions . Nous pensons qu' au-delà des apports de la modélisation connexioniste classique , l' utilisation du formalisme écologique permet de prendre en compte l' un des fondements des théories de psychologie sociale , à savoir la notion d' interaction . 2 . Les réseaux de neurones écologiques Si les réseaux de neurones classiques possèdent de nombreux avantages , notamment l' absence de dissociation entre les unités et leur traitement , la capacité de généralisation à partir d' exemplaire appris ou la rapidité d' intégration de nouvelles connaissances , nous pouvons avancer une limite dans leur utilisation en psychologie sociale . Comme le soulignent Rumelhart et McClelland ( 1986 ) « ( ... ) nous ne pouvons comprendre la nature des systèmes sociaux à travers l' étude des individus isolément , et nous ne pouvons comprendre le comportement d' un réseau de neurones à partir de l' étude d' un neurone ( ... ) » . Retenons la première partie de cette affirmation , nous ne pouvons comprendre les phénomènes sociaux qu' à partir de la prise en compte des éléments d' interaction entre les individus et leurs relations avec l' environnement . La principale limite des réseaux de neurones classiques apparaît ici : la non interaction dynamique du réseau avec son environnement . En effet , lors de la conception d' un modèle connexioniste , un soin tout particulier doit être apporté aux situations d' apprentissage retenues . A partir de l' apprentissage d' une base d' exemplaires prédéfinie , caractéristiques de situations particulières , le réseau de neurones est capable de généraliser cet apprentissage à des situations nouvelles . Cela implique que le concepteur définisse deux bases d' exemplaires ceux à apprendre et ceux sur lesquels la généralisation portera . Il y donc un effet statique et fixe de cette base de données , ne laissant pas de place à un apprentissage qui serait dirigé par le réseau lui-même . Les recherches menées en vie artificielle proposent de dépasser cette limite en utilisant ce que nous définissons comme le formalisme des réseaux de neurones écologiques ( Parisi , Cecconi & Nolfi , 1990 ) . 2.1 . Principe fondamental des réseaux de neurones écologiques Les réseaux de neurones écologiques sont des réseaux de neurones équivalents à ceux classiquement utilisés , néanmoins ils s' en différencient par la façon dont ils sont utilisés . Ils possèdent donc les mêmes propriétés que les réseaux précédemment exposés , mais le chercheur n' adopte pas la même stratégie d' utilisation pour le stockage et la récupération d' informations . Les réseaux de neurones écologiques sont définis comme des agentsLes réseaux de neurones écologiques sont des réseaux de neurones équivalents à ceux classiquement utilisés , néanmoins ils s' en différencient par la façon dont ils sont utilisés . Ils possèdent donc les mêmes propriétés que les réseaux précédemment exposés , mais le chercheur n' adopte pas la même stratégie d' utilisation pour le stockage et la récupération d' informations . Les réseaux de neurones écologiques sont définis comme des agents [ 2 ] qui apprennent et qui évoluent dans un environnement ( Parisi , Cecconi & Nolfi , 1990 ) . Ces agents peuvent être implémentés par l' une des architectures de réseau de neurones présentées précédemment ; l' unique contrainte est de disposer d' un réseau de neurones distinguant les unités d' entrée de celles de sortie . Ceci est nécessaire pour que l' agent et l' environnement soient en situation d' interaction . Comme présenté sur le schéma 2 , le caractère écologique du réseau de neurones implique un agent placé dans un environnement . Dans cette situation , la relation est dynamique puisque l' agent en percevant une situation particulière de l' environnement propose un comportement , et l' environnement répond à ce comportement en fournissant la nouvelle situation en entrée de l' agent . Nous sommes ici dans une conception dynamique de la relation , où l' agent est acteur de sa perception . C' est en fonction du comportement produit par l' agent que sa relation à l' environnement est changée , si bien que ses perceptions en sont modifiées . qui apprennent et qui évoluent dans un environnement ( Parisi , Cecconi & Nolfi , 1990 ) . Ces agents peuvent être implémentés par l' une des architectures de réseau de neurones présentées précédemment ; l' unique contrainte est de disposer d' un réseau de neurones distinguant les unités d' entrée de celles de sortie . Ceci est nécessaire pour que l' agent et l' environnement soient en situation d' interaction . Comme présenté sur le schéma 2 , le caractère écologique du réseau de neurones implique un agent placé dans un environnement . Dans cette situation , la relation est dynamique puisque l' agent en percevant une situation particulière de l' environnement propose un comportement , et l' environnement répond à ce comportement en fournissant la nouvelle situation en entrée de l' agent . Nous sommes ici dans une conception dynamique de la relation , où l' agent est acteur de sa perception . C' est en fonction du comportement produit par l' agent que sa relation à l' environnement est changée , si bien que ses perceptions en sont modifiées . Schéma 1 : Schéma de l' interaction entre réseau de neurones écologique et l' environnement 2.2 . Architecture et apprentissage des réseaux de neurones écologiques Même si tout format d' implémentation est envisageable , les études actuelles considèrent plus généralement les agents comme des réseaux de neurones de type Perceptron Multi Couche ayant pour règle d' apprentissage l' algorithme de rétropropagation du gradient descendant de l' erreur . L' architecture de base des réseaux écologiques inclut des unités d' entrée recevant des informations sensorielles de l' environnement et des unités de sortie codant les réponses comportementales produites ( Parisi , Cecconi & Nolfi , 1990 ) . Dès lors , les réseaux de neurones écologiques peuvent être considérés comme des agents dynamiques évoluant dans un environnement autonome . Les informations données à l' agent sont déterminées par l' environnement ; les réponses produites par l' agent induisent un changement dans la relation agent-environnement qui se traduit par de nouvelles informations fournies en entrée . A partir du comportement produit par l' agent , la relation agent-environnement change et l' environnement définit les nouvelles entrées . Ces nouvelles entrées sont totalement dépendantes du comportement produit suite à la perception des entrées précédentes . Nous avions souligné que les réseaux de neurones classiques impliquent la définition par le concepteur d' une base d' exemplaires pour l' apprentissage et pour le test ; le formalisme écologique au contraire n' implique pas une telle contrainte . L' agent évolue dans un environnement ( Nolfi Parisi , 1997 ; A partir du comportement produit par l' agent , la relation agent-environnement change et l' environnement définit les nouvelles entrées . Ces nouvelles entrées sont totalement dépendantes du comportement produit suite à la perception des entrées précédentes . Nous avions souligné que les réseaux de neurones classiques impliquent la définition par le concepteur d' une base d' exemplaires pour l' apprentissage et pour le test ; le formalisme écologique au contraire n' implique pas une telle contrainte . L' agent évolue dans un environnement ( Nolfi Parisi , 1997 ; Cecconi & Parisi , 1998 ) qui détermine entièrement les conditions d' apprentissage . L' agent est donc considéré comme actif dans son apprentissage puisque c' est en fonction de son propre comportement et des réponses que lui fournit l' environnement que l' apprentissage prend place . Cecconi & Parisi , 1998 ) qui détermine entièrement les conditions d' apprentissage . L' agent est donc considéré comme actif dans son apprentissage puisque c' est en fonction de son propre comportement et des réponses que lui fournit l' environnement que l' apprentissage prend place . En phase d' apprentissage , l' agent ( le réseau de neurones écologique ) est placé dans l' environnement . L' environnement est implémenté par un algorithme qui en détermine sa structure , sa fonctionnalité et ses propriétés . Par exemple , l' environnement peut modéliser un espace dans lequel l' agent peut se déplacer . L' algorithme de l' environnement pourra définir alors les conséquences du comportement de l' agent en terme de position dans l' espace . L' apprentissage dans cette situation résulte des changements produits par les comportements de l' agent dans sa relation avec l' environnement et de l' adaptation du comportement en fonction de la tâche à accomplir ( Parisi , Cecconi & Nolfi , 1990 ) . 2.3 . Exemples d' utilisation des réseaux de neurones écologiques L' axe de recherche principal des réseaux de neurones écologiques considère leur capacité à prédire les conséquences de leur propre comportement en s' appuyant sur la méthodologie des algorithmes génétiques ( Holland , 1975 , puis Golberg , 1994 ) . L' objectif de cette partie n' étant pas de faire une revue sur les travaux concernant les réseaux de neurones écologiques , mais de proposer ce formalisme comme complément à celui classiquement utilisé , nous n' en présenterons que quelques exemples d' applications . Pour une grande part des études , les auteurs s' intéressent à l' interaction de l' agent avec son environnement physique . Nolfi , Elman et Parisi ( 1994 ) montrent qu' un agent peut apprendre à atteindre une cible dans un environnement en deux dimensions en prédisant les conséquences de son comportement . L' apprentissage de l' agent consiste à acquérir la capacité à prédire , sur la base des informations actuelles , qu' elles seront les prochaines informations reçues en entrée . Pour ce faire , les auteurs simulent un agent à partir d' un réseau de neurones dont l' architecture est simple . Le réseau de neurones implémenté consiste en une couche d' entrée à quatre unités codant les entrées sensorielles et l' action planifiée au temps tPour une grande part des études , les auteurs s' intéressent à l' interaction de l' agent avec son environnement physique . Nolfi , Elman et Parisi ( 1994 ) montrent qu' un agent peut apprendre à atteindre une cible dans un environnement en deux dimensions en prédisant les conséquences de son comportement . L' apprentissage de l' agent consiste à acquérir la capacité à prédire , sur la base des informations actuelles , qu' elles seront les prochaines informations reçues en entrée . Pour ce faire , les auteurs simulent un agent à partir d' un réseau de neurones dont l' architecture est simple . Le réseau de neurones implémenté consiste en une couche d' entrée à quatre unités codant les entrées sensorielles et l' action planifiée au temps t 0 ; 0 ; une couche cachée de sept unités et une couche de sortie de quatre unités codant l' action planifiée au temps t 1 et l' entrée sensorielle prédite au temps t une couche cachée de sept unités et une couche de sortie de quatre unités codant l' action planifiée au temps t 1 et l' entrée sensorielle prédite au temps t 11 . Par duplication , les auteurs créent une population d' agents qu' ils laissent évoluer dans l' environnement . L' apprentissage consiste en une adaptation des poids de connexions par rétropropagation . Pour cela , l' agent reçoit les informations sensorielles en entrée et propose en sortie une action et une prédiction de l' entrée suivante . L' agent exécute cette action et reçoit les nouvelles informations en entrée résultant de l' exécution de l' action . L' erreur rétropropagée est calculée en comparant la sortie correspondant à l' entrée sensorielle prédite et l' entrée sensorielle réelle donnée par l' environnement suite à l' exécution de l' action proposée . L' agent apprend ainsi à prédire correctement les nouvelles entrées au fur et à mesure de l' apprentissage . . Par duplication , les auteurs créent une population d' agents qu' ils laissent évoluer dans l' environnement . L' apprentissage consiste en une adaptation des poids de connexions par rétropropagation . Pour cela , l' agent reçoit les informations sensorielles en entrée et propose en sortie une action et une prédiction de l' entrée suivante . L' agent exécute cette action et reçoit les nouvelles informations en entrée résultant de l' exécution de l' action . L' erreur rétropropagée est calculée en comparant la sortie correspondant à l' entrée sensorielle prédite et l' entrée sensorielle réelle donnée par l' environnement suite à l' exécution de l' action proposée . L' agent apprend ainsi à prédire correctement les nouvelles entrées au fur et à mesure de l' apprentissage . L' apprentissage étant régi par les réponses de l' environnement à un comportement donné , il s' avère que l' agent est capable de maintenir un lien temporel entre les actions qu' il produit ( Nolfi & Parisi , 1994 ) . Ceci est indispensable quand l' apprentissage consiste non seulement à prédire les actions , mais aussi à atteindre une cible . En effet , chacune des nouvelles entrées sensorielles étant déterminée par les changements résultant du cycle précédent ( réponse comportementale antérieure ) , l' agent encode la séquence dans son intégralité , notamment celle lui permettant d' atteindre la cible . Les séquences comportementales possèdent alors une signification temporelle intrinsèque , dans le sens où le comportement de l' agent peut être évalué non plus en terme d' action simple mais en terme de séquence ( voir aussi Parisi , Cecconi & Nolfi , 1990 ) . L' agent peut alors adapter son comportement en apprenant à prédire les conséquences de ses actions puisqu' il est capable de déterminer , en fonction du contexte précédent , que seraient les nouvelles actions à produire . Cela élargit considérablement la connaissance que possède l' agent sur l' environnement car il connaît la réponse de l' environnement à une action donnée ( Parisi , 1997 ) . Les auteurs testent la capacité d' une population d' agents à prédire les conséquences de leurs actions et utilisent pour cela les algorithmes génétiques . Par sélection naturelle , les auteurs montrent que le maintien et la duplication des agents les plus performants permettent de mettre en évidence une amélioration de la résolution de la tâche . Ainsi , les générations d' agents présentent non pas des habiletés différentes mais des capacités de prédiction de plus en plus efficaces ( Cecconi & Parisi , 1998 : Nolfi , Elman & Parisi , 1994 ; Parisi , Cecconi & Nolfi , 1990 ) . D' autres études s' intéressent aux interactions entre agents . Werner et Dyer ( 1992 ) montrent l' efficacité de la transmission de signaux entre agents pour générer des comportements d' évitement d' objets . Si ces études montrent l' intérêt du formalisme écologique à prendre en compte la notion d' interaction entre l' agent et l' environnement , mais aussi entre les agents ( cf. Yao , 1993 pour une revue ) , elles ne sont pas destinées à produire des modèles psychologiques de l' influence de ces interactions . Pour résumer , ce qui nous intéresse dans le formalisme des réseaux de neurones écologiques repose sur l' idée d' une prise en compte possible du dynamisme de la relation entre agent et environnement . L' agent est acteur de sa perception , puisqu' après avoir agit dans l' environnement sa perception de celui -ci en est modifiée . Nous pensons que la prise en considération des interactions est indispensable à l' élaboration d' un modèle connexioniste dont l' objet est de modéliser des phénomènes sociaux . Tout en maintenant les propriétés inhérentes aux réseaux de neurones classiques , le formalisme écologique amène un intérêt supplémentaire , en proposant d' intégrer l' influence des interactions dans la construction que fait l' individu de son environnement social . Pour résumer , ce qui nous intéresse dans le formalisme des réseaux de neurones écologiques repose sur l' idée d' une prise en compte possible du dynamisme de la relation entre agent et environnement . L' agent est acteur de sa perception , puisqu' après avoir agit dans l' environnement sa perception de celui -ci en est modifiée . Nous pensons que la prise en considération des interactions est indispensable à l' élaboration d' un modèle connexioniste dont l' objet est de modéliser des phénomènes sociaux . Tout en maintenant les propriétés inhérentes aux réseaux de neurones classiques , le formalisme écologique amène un intérêt supplémentaire , en proposant d' intégrer l' influence des interactions dans la construction que fait l' individu de son environnement social . Les réseaux de neurones écologiques semblent ouvrir un nouveau champ de recherche pour les modèles connexionistes adaptés en psychologie sociale puisqu' ils permettent l' intégration dynamique des interactions . Le modèle connexioniste que nous proposerons par la suite ( cf. partie expérimentale , chapitre 1 , p . 83 ) trouvera dans ce formalisme un point d' ancrage important . 3 . Apports de la modélisation connexioniste à la psychologie sociale Depuis une dizaine d' années , la psychologie sociale voit se développer l' utilisation des modèles connexionistes comme une nouvelle méthodologie de recherche . Ces modèles simulent la façon dont l' information est traitée , apprise , récupérée et utilisée par les individus . Sans vouloir pour autant être des répliques du fonctionnement du cerveau humain , ils amènent par leurs propriétés inhérentes , une nouvelle façon de concevoir le traitement de l' information au cours des interactions sociales . L' engouement de certains chercheurs à introduire ce nouveau formalisme est incontestable , et nous allons tenter d' en comprendre les raisons . Au cours de ses interactions avec l' environnement physique mais aussi avec son environnement social , l' individu est amené à intégrer des informations sur les objets , les personnes , les groupes , les normes , les attitudes ou les comportements . Toutes ces connaissances lui sont indispensables pour produire lui-même des comportements adaptés aux situations qu' il rencontre . Pour cela , l' individu mémorise certaines informations qu' il réutilise ensuite en fonction des situations auxquelles il est exposé . L' individu acquiert des connaissances qui lui permettent d' agir de façon adaptée en situation sociale . En retour la réponse de l' environnement à ses comportements contribue à l' élaboration et à la modification de ses connaissances . Cette capacité que possède l' individu d' intégrer et d' utiliser ces informations est parfaitement simulable par un réseau de neurones . C' est l' une des propriétés à la base des recherches menées en psychologie sociale , tout particulièrement la capacité des réseaux de neurones à mémoriser des informations par apprentissage , et à récupérer et produire des informations à partir de celles stockées . 3.1 . Intérêts des modèles connexionistes pour les psychologues sociaux La plausibilité neurologique Largement inspirés des propriétés de base des neurones du cerveau humain , les modèles connexionistes postulent qu' un système cognitif est un réseau de neurones capable d' apprendre en codant les informations de façon non symbolique ( Hinton Largement inspirés des propriétés de base des neurones du cerveau humain , les modèles connexionistes postulent qu' un système cognitif est un réseau de neurones capable d' apprendre en codant les informations de façon non symbolique ( Hinton et al. , 1986 ; Hatfield , 1991 ) . Si les modèles connexionistes sont des versions très simplifiées des circuits neurologiques impliqués dans les processus , il s' avère qu' ils exposent des propriétés identiques à celles des individus . L' intégration et l' utilisation des connaissances sont réalisées à partir d' une structure simple incluant des unités , des liens et un flux d' activation . La perception des informations est simulée par des unités d' entrée permettant de coder les informations extérieures , le traitement de ces informations est réalisé à l' intérieur du réseau de neurones et celui -ci émet des réponses sur les unités de sortie en regard des informations perçues . Selon van Overwalle et Labiouse ( 2003 ) , cette propriété d' intégration dans un même système d' une mémoire à long terme ( les poids de connexions ) , d' une mémoire à court terme ( l' activation des unités ) et de l' information extérieure ( activation externe ) est primordiale pour simuler de la façon la plus plausible possible le traitement des informations par l' individu en situation sociale . Même si les modèles connexionistes ne se veulent pas des implémentations du système nerveux humains , ils exhibent une certaine plausibilité neurologique ( Honavar , 1994 ; McClelland , Mc Naughton & O'Reilly , 1995 ) qui séduit les psychologues sociaux ( van Overwalle & Labiouse , 2003 ) . Et ce , malgré le peu de vraisemblance de certaines règles d' apprentissage telle que la rétropropagation de l' erreur. , 1986 ; Hatfield , 1991 ) . Si les modèles connexionistes sont des versions très simplifiées des circuits neurologiques impliqués dans les processus , il s' avère qu' ils exposent des propriétés identiques à celles des individus . L' intégration et l' utilisation des connaissances sont réalisées à partir d' une structure simple incluant des unités , des liens et un flux d' activation . La perception des informations est simulée par des unités d' entrée permettant de coder les informations extérieures , le traitement de ces informations est réalisé à l' intérieur du réseau de neurones et celui -ci émet des réponses sur les unités de sortie en regard des informations perçues . Selon van Overwalle et Labiouse ( 2003 ) , cette propriété d' intégration dans un même système d' une mémoire à long terme ( les poids de connexions ) , d' une mémoire à court terme ( l' activation des unités ) et de l' information extérieure ( activation externe ) est primordiale pour simuler de la façon la plus plausible possible le traitement des informations par l' individu en situation sociale . Même si les modèles connexionistes ne se veulent pas des implémentations du système nerveux humains , ils exhibent une certaine plausibilité neurologique ( Honavar , 1994 ; McClelland , Mc Naughton & O'Reilly , 1995 ) qui séduit les psychologues sociaux ( van Overwalle & Labiouse , 2003 ) . Et ce , malgré le peu de vraisemblance de certaines règles d' apprentissage telle que la rétropropagation de l' erreur . La capacité d' apprentissage Au-delà de la plausibilité neurologique , les psychologues sociaux s' appuient sur les capacités d' apprentissage et d' émergence exhibées par les réseaux de neurones artificiels ( Kashima & Kerekes , 1994 ; Kashima , Woolcock Queller Smith , 1996 ; Smith van Overwalle & Labiouse , 2003 ; van Rooy , van Hormissen , Labiouse & French , 2003 ) . En effet , les réseaux de neurones possèdent la capacité d' apprendre de nouvelles informations et de les intégrer rapidement et efficacement à une structure déjà existante . Cette capacité est indispensable puisque la plupart des phénomènes étudiés en psychologie sociale reposent sur l' intégration des connaissances et leurs utilisations . Comme nous l' avons vu , l' apprentissage d' un réseau de neurones modifie au cours du temps les poids des connexions . La phase d' apprentissage permet l' intégration des événements auxquels est confronté le réseau de neurones . La représentation élaborée suite à cette phase permet de répondre de façon efficace et correcte à la présentation de situations déjà rencontrées et à de nouvelles situations . Cette capacité résulte de l' intégration simultanée d' un ensemble d' informations en un temps très court ( Read & Miller , 1998 ) . En effet , au cours de l' apprentissage , un réseau de neurones est confronté à un ensemble d' exemplaires qu' il intègre dans une seule et même structure de poids de connexions . Dans un réseau de neurones où l' approche distribuée est privilégiée , cette intégration permet de considérer la signification de chaque exemplaire comme influencée et contrainte par la signification des autres . La perception sociale peut alors être considérée comme la solution à des contraintes qui s' influencent mutuellement ( Amy , 1996 ; Read & Miller , 1998 ) . Au-delà de la plausibilité neurologique , les psychologues sociaux s' appuient sur les capacités d' apprentissage et d' émergence exhibées par les réseaux de neurones artificiels ( Kashima & Kerekes , 1994 ; Kashima , Woolcock Queller & Smith , 2002 ; Smith , 1996 ; Smith van Overwalle van Rooy , van Hormissen , Labiouse & French , 2003 ) . En effet , les réseaux de neurones possèdent la capacité d' apprendre de nouvelles informations et de les intégrer rapidement et efficacement à une structure déjà existante . Cette capacité est indispensable puisque la plupart des phénomènes étudiés en psychologie sociale reposent sur l' intégration des connaissances et leurs utilisations . Comme nous l' avons vu , l' apprentissage d' un réseau de neurones modifie au cours du temps les poids des connexions . La phase d' apprentissage permet l' intégration des événements auxquels est confronté le réseau de neurones . La représentation élaborée suite à cette phase permet de répondre de façon efficace et correcte à la présentation de situations déjà rencontrées et à de nouvelles situations . Cette capacité résulte de l' intégration simultanée d' un ensemble d' informations en un temps très court ( Read & Miller , 1998 ) . En effet , au cours de l' apprentissage , un réseau de neurones est confronté à un ensemble d' exemplaires qu' il intègre dans une seule et même structure de poids de connexions . Dans un réseau de neurones où l' approche distribuée est privilégiée , cette intégration permet de considérer la signification de chaque exemplaire comme influencée et contrainte par la signification des autres . La perception sociale peut alors être considérée comme la solution à des contraintes qui s' influencent mutuellement ( Amy , 1996 ; Read & Miller , 1998 ) . Chaque exemplaire appris contraint l' apprentissage des autres et l' apprentissage de l' ensemble résulte en une solution satisfaisante pour répondre à chacun des exemplaires . Cet aspect suppose donc que l' apprentissage prend place à mesure que l' individu est confronté à de nouvelles situations et que les connaissances sont intégrées en mémoire . Cet aspect suppose donc que l' apprentissage prend place à mesure que l' individu est confronté à de nouvelles situations et que les connaissances sont intégrées en mémoire . Dans la perspective d' étudier la formation d' impression , Kashima , Woolcock et Kashima ( 2000 ) se sont appuyés sur la capacité d' apprentissage des réseaux de neurones . Pour cela , ils ont simulé la façon dont un individu exposé à différentes situations sociales va intégrer au cours de l' apprentissage l' ensemble de ces informations . Ils ont ainsi simulé à partir d' un modèle localiste dit Tensor Product Model ( TPM ) la façon dont l' individu encode des situations sociales selon des exemples impliquant l' acteur , le comportement , l' objet et le contexte . Ainsi , TPM peut être interrogé sur les associations faites entre ces éléments suite à l' apprentissage de situations impliquant ceux -ci . A partir du fonctionnement de TPM , ces auteurs suggèrent qu' un seul processus sous-tend la formation et le changement des impressions : le processus d' apprentissage . Ce processus rend compte de la façon dont les événements sont stockés et réactualisés afin de produire des réponses adaptées . Ainsi , TPM permet de mettre en évidence que le changement des stéréotypes est fonction du type des informations rencontrées . Cette explication implique de considérer que la rencontre avec un membre consistant avec l' impression n' altère que très peu la représentation liée à ce groupe . A l' inverse , un membre inconsistant génère la création d' une sous catégorie , puisqu' il implique une distance à la catégorie élevée . C' est à partir de la comparaison de l' état d' activation de la représentation du groupe à celui impliqué par la prise en compte du membre rencontré que s' effectue ou non une altération de la représentation ou la création d' une sous-catégorie . La capacité des réseaux de neurones d' apprentissage présente , néanmoins , une faiblesse conséquente . Ce type de modèle est dans l' incapacité d' intégrer de nouvelles informations lorsque la phase d' apprentissage est terminée , ceci est plus connu sous le nom d' oubli catastrophique ( Mc Closkey & Cohen , 1989 ) . Après la phase d' apprentissage , il est impossible de faire apprendre une nouvelle série d' exemplaires sans que la première ne soit profondément altérée , allant jusqu'à être perdue ( McClelland La capacité des réseaux de neurones d' apprentissage présente , néanmoins , une faiblesse conséquente . Ce type de modèle est dans l' incapacité d' intégrer de nouvelles informations lorsque la phase d' apprentissage est terminée , ceci est plus connu sous le nom d' oubli catastrophique ( Mc Closkey & Cohen , 1989 ) . Après la phase d' apprentissage , il est impossible de faire apprendre une nouvelle série d' exemplaires sans que la première ne soit profondément altérée , allant jusqu'à être perdue ( McClelland et al. , 1995 ; French , 1999 ) . Des solutions apparaissent dans la littérature telle que l' intégration graduelle des nouvelles connaissances à apprendre entre les anciennes ( , 1995 ; French , 1999 ) . Des solutions apparaissent dans la littérature telle que l' intégration graduelle des nouvelles connaissances à apprendre entre les anciennes ( interleaved learning de McClelland de McClelland et al. , 1995 ) ou l' utilisation de pseudo- , 1995 ) ou l' utilisation de pseudo-pattern par un modèle duel ( Ans French , Ans & Rousset , 2001 ) . par un modèle duel ( Ans French , Ans & Rousset , 2001 ) . La propriété d' émergence L' une des caractéristiques principales des modèles connexionistes réside dans leur propriété d' émergence . Elle peut être distinguée en cinq catégories : extraction de prototype , complétion de L' une des caractéristiques principales des modèles connexionistes réside dans leur propriété d' émergence . Elle peut être distinguée en cinq catégories : extraction de prototype , complétion de pattern , généralisation , satisfaction de contraintes et dégradation partielle . Ceci est une implication directe de ce formalisme qui considère un ensemble d' unités élémentaires reliées entre elles par des connexions , où les représentations et leurs traitements forment un tout indissociable dont l' application s' effectue en parallèle. , généralisation , satisfaction de contraintes et dégradation partielle . Ceci est une implication directe de ce formalisme qui considère un ensemble d' unités élémentaires reliées entre elles par des connexions , où les représentations et leurs traitements forment un tout indissociable dont l' application s' effectue en parallèle . Au cours de l' apprentissage , la représentation élaborée tient compte des régularités rencontrées qu' elle intègre sur l' ensemble des unités et des poids . La représentation distribuée tient compte des détails redondants tout en ignorant les différences ( Smith , 1996 ) . La représentation résultante correspond donc aux caractéristiques centrales des informations rencontrées . Cela implique qu' un modèle connexioniste peut extraire un prototype à partir de nombreux exemplaires . Par exemple , Labiouse et French ( 2001 ) utilisent cette propriété pour répliquer la création de stéréotypes . Pour cela , ils soumettent un réseau de neurones de type Au cours de l' apprentissage , la représentation élaborée tient compte des régularités rencontrées qu' elle intègre sur l' ensemble des unités et des poids . La représentation distribuée tient compte des détails redondants tout en ignorant les différences ( Smith , 1996 ) . La représentation résultante correspond donc aux caractéristiques centrales des informations rencontrées . Cela implique qu' un modèle connexioniste peut extraire un prototype à partir de nombreux exemplaires . Par exemple , Labiouse et French ( 2001 ) utilisent cette propriété pour répliquer la création de stéréotypes . Pour cela , ils soumettent un réseau de neurones de type auto-encoder ( association du même ( association du même pattern en entrée et en sortie par le biais d' une couche cachée ) à l' apprentissage d' exemplaires . Ces derniers correspondent à des déclinaisons d' un stéréotype , et l' interrogation du réseau de neurones sur ce stéréotype indique sa capacité à l' extraire des exemplaires appris . Les auteurs ont ainsi montré que le réseau est capable , à partir de la confrontation à des déclinaisons du stéréotype , de répondre efficacement à la présentation d' exemplaire , c' est-à-dire à produire le stéréotype en sortie . De façon analogue , Smith et DeCoster ( 1998a et b ) ont mis en évidence qu' un réseau de neurones récurrent simule la création d' un stéréotype à partir de l' apprentissage d' exemplaires de traits . en entrée et en sortie par le biais d' une couche cachée ) à l' apprentissage d' exemplaires . Ces derniers correspondent à des déclinaisons d' un stéréotype , et l' interrogation du réseau de neurones sur ce stéréotype indique sa capacité à l' extraire des exemplaires appris . Les auteurs ont ainsi montré que le réseau est capable , à partir de la confrontation à des déclinaisons du stéréotype , de répondre efficacement à la présentation d' exemplaire , c' est-à-dire à produire le stéréotype en sortie . De façon analogue , Smith et DeCoster ( 1998a et b ) ont mis en évidence qu' un réseau de neurones récurrent simule la création d' un stéréotype à partir de l' apprentissage d' exemplaires de traits . La complétion de La complétion de pattern et la généralisation rendent de nouveau compte de l' intérêt du formalisme connexioniste . Ainsi , il est possible de présenter en entrée du réseau une information déjà connue mais incomplète . Le fonctionnement d' un réseau indique que l' activation proposée en unités d' entrée se propage au travers des connexions pour activer les unités qui lui sont connectées . Si certaines de ces unités d' entrée ne reçoivent pas d' activation , celle propagée par les unités activées compensent cette absence puisqu' elles activent toutes les autres unités . Pour un et la généralisation rendent de nouveau compte de l' intérêt du formalisme connexioniste . Ainsi , il est possible de présenter en entrée du réseau une information déjà connue mais incomplète . Le fonctionnement d' un réseau indique que l' activation proposée en unités d' entrée se propage au travers des connexions pour activer les unités qui lui sont connectées . Si certaines de ces unités d' entrée ne reçoivent pas d' activation , celle propagée par les unités activées compensent cette absence puisqu' elles activent toutes les autres unités . Pour un pattern d' information incomplet présenté en entrée du réseau , la diffusion de l' activation induite par les unités activées permet au réseau d' émettre une réponse adaptée ( cf. complétion de visages , Abdi , 1994 ) . Il y a bien émergence d' une réponse adaptée en regard de toutes les situations apprises malgré l' absence d' une partie de l' information de départ . d' information incomplet présenté en entrée du réseau , la diffusion de l' activation induite par les unités activées permet au réseau d' émettre une réponse adaptée ( cf. complétion de visages , Abdi , 1994 ) . Il y a bien émergence d' une réponse adaptée en regard de toutes les situations apprises malgré l' absence d' une partie de l' information de départ . Lorsqu' un réseau a appris un certain nombre d' exemplaires , il peut être interrogé sur ces derniers mais aussi sur de nouveaux . Cela renvoie à la capacité de généralisation . Lorsqu' il est interrogé , le réseau de neurones utilise la représentation créée lors de l' apprentissage pour généraliser sa réponse au nouvel exemplaire . Après l' apprentissage , le réseau possède une structure de poids reflétant toutes les expériences vécues . Si l' activation d' entrée n' a jamais été rencontrée en apprentissage , il n' en demeure pas moins que la propagation au travers des poids adaptés induit l' émergence d' une réponse en sortie . En fonction de la proximité de la nouvelle situation par rapport à celles acquises antérieurement , le réseau fournit une réponse adéquate représentant une généralisation des connaissances . Ainsi , à partir de l' apprentissage des traits caractéristiques des membres d' un groupe , un réseau est à même de généraliser ces traits à un nouveau membre du groupe ( Smith & DeCoster , 1998b ) . Dynamique de la démarche connexioniste L' aspect dynamique de la démarche connexioniste se traduit par la possibilité de simuler autant de situations différentes que souhaitées . La validité du modèle connexioniste , proposé pour un phénomène donné , est réalisée à travers la simulation . La simulation correspond à l' utilisation du modèle conçu comme substrat d' étude . Cela revient à générer une population de réseau de neurones dont l' architecture est définie par le modèle , et tester sur cette population un ensemble de contraintes aussi diversifiées que possible . Tout comme dans une expérimentation avec sujets humains , les réseaux sont soumis à diverses conditions expérimentales . Cela autorise l' expérimentation systématique d' un ensemble de contraintes et de situations parfois non envisageables en pratique , et permet de tester différentes conditions sur un même individu . A partir de la réplique du réseau , il est possible de tester l' efficacité de plusieurs apprentissages sur un individu possédant les mêmes caractéristiques de départ . Ce qui en pratique n' est pas réalisable du fait de l' interférence que peuvent produire les apprentissages antérieurs sur les nouveaux . Dès lors , la simulation peut être envisagée comme une nouvelle stratégie de recherche en psychologie sociale . Par ailleurs , la simulation présente l' intérêt de proposer de nouveaux mécanismes théoriques alternatifs à ceux habituellement développés par les modèles symboliques classiques . Elle permet d' envisager une approche unitaire des processus à savoir ne pas distinguer la recherche de l' utilisation de connaissances puisque nous avons vu que le traitement s' effectue en parallèle . Le modèle connexioniste utilisé en simulation permet une approche intégrative des théories existantes , puisqu' une seule et même structure est capable d' exhiber les performances par ailleurs expliquées par des mécanismes indépendants ( Smith & DeCoster , 1998b ) . Ainsi , la simulation connexioniste peut , par exemple , montrer qu' un seul modèle peut rendre compte de phénomènes expliqués jusqu'alors par des mécanismes séparés . Le modèle connexioniste proposé par Queller et Smith ( 2002 ) rend très bien compte de cet intérêt , puisqu' il modélise les phénomènes de « sous-catégorisation » ( Par ailleurs , la simulation présente l' intérêt de proposer de nouveaux mécanismes théoriques alternatifs à ceux habituellement développés par les modèles symboliques classiques . Elle permet d' envisager une approche unitaire des processus à savoir ne pas distinguer la recherche de l' utilisation de connaissances puisque nous avons vu que le traitement s' effectue en parallèle . Le modèle connexioniste utilisé en simulation permet une approche intégrative des théories existantes , puisqu' une seule et même structure est capable d' exhiber les performances par ailleurs expliquées par des mécanismes indépendants ( Smith & DeCoster , 1998b ) . Ainsi , la simulation connexioniste peut , par exemple , montrer qu' un seul modèle peut rendre compte de phénomènes expliqués jusqu'alors par des mécanismes séparés . Le modèle connexioniste proposé par Queller et Smith ( 2002 ) rend très bien compte de cet intérêt , puisqu' il modélise les phénomènes de « sous-catégorisation » ( subtyping ) , de « conversion » ( ) , de « conversion » ( conversion ) et d' intégration graduelle ( ) et d' intégration graduelle ( bookkeepping ) . A partir d' un réseau de neurones récurrent ( auto associateur ) , ces auteurs proposent un ensemble de simulations répliquant les résultats d' une modification modérée et graduelle du stéréotype par l' information nouvelle ( ) . A partir d' un réseau de neurones récurrent ( auto associateur ) , ces auteurs proposent un ensemble de simulations répliquant les résultats d' une modification modérée et graduelle du stéréotype par l' information nouvelle ( bookkepping ) , une altération critique du stéréotype réévalué à partir d' un certain seuil de l' information disconfirmatoire ( ) , une altération critique du stéréotype réévalué à partir d' un certain seuil de l' information disconfirmatoire ( conversion ) et la création de sous-catégories pour les informations inconsistantes considérées comme des exceptions ( ) et la création de sous-catégories pour les informations inconsistantes considérées comme des exceptions ( subtyping ) . Ce modèle propose d' envisager sous un angle unique l' intégration des trois modèles classiques . Ainsi , le modèle connexioniste est par essence même de type ) . Ce modèle propose d' envisager sous un angle unique l' intégration des trois modèles classiques . Ainsi , le modèle connexioniste est par essence même de type bookkepping , puisqu' il intègre de façon incrémentale les situations rencontrées . De plus , il permet de proposer que le , puisqu' il intègre de façon incrémentale les situations rencontrées . De plus , il permet de proposer que le subtyping est une résultante du est une résultante du bookkeping , puisque ce n' est pas l' association entre les groupes et les attributs qui est modifiée mais l' association entre les attributs eux-mêmes qui est altéré par l' intégration d' éléments disconfirmatoires . En effet , l' information modérément disconfirmatoire est intégrée comme élément du , puisque ce n' est pas l' association entre les groupes et les attributs qui est modifiée mais l' association entre les attributs eux-mêmes qui est altéré par l' intégration d' éléments disconfirmatoires . En effet , l' information modérément disconfirmatoire est intégrée comme élément du pattern d' activation et n' implique qu' un changement modéré ; alors que l' information extrême induit un changement important au niveau du d' activation et n' implique qu' un changement modéré ; alors que l' information extrême induit un changement important au niveau du pattern d' activation . d' activation . Smith et DeCoster ( 1998b ) utilisent une modélisation distribuée et montrent de la même façon qu' un seul mécanisme peut rendre compte et reproduire les résultats des différentes explications traditionnellement utilisées dans la perception des personnes . Ces auteurs sont particulièrement intéressés par l' apprentissage des stéréotypes et leur application . L' intérêt d' un tel modèle est de proposer une seule structure explicative des trois processus traditionnellement exposés . Le premier implique un processus d' abstraction qui résume les informations spécifiques pour produire des schémas génériques ou des prototypes utilisés pour faire des inférences . Le deuxième processus contribue au stockage et la récupération d' exemplaires . Le dernier permet d' identifier le niveau d' accessibilité des informations des différentes représentations stockées . Ces processus se manifestent par : i ) la capacité de l' individu à apprendre les caractéristiques spécifiques d' une personne connue , et les appliquer par inférence à de nouveaux exemplaires ; ii ) la capacité à apprendre des traits spécifiques sur un groupe à partir de la rencontre de certains membres et leur généralisation aux autres membres ; iii ) la capacité à apprendre plusieurs structures de connaissances et les combiner pour inférer des traits à un nouvel exemplaire ; iiii ) l' importance de la récence et de la fréquence d' exposition dans les inférences de traits . Ainsi , à partir d' un réseau de neurones récurrent utilisant une règle d' apprentissage , Smith et DeCoster ( 1998b ) répliquent de façon isomorphe ces effets . Pour cela , ils proposent un modèle de type auto-associateur où toutes les unités sont systématiquement reliées à toutes les autres . Chaque unité reçoit une information en entrée et produit une réponse en sortie . Simultanément , l' activation de chacune des unités se propage aux autres de telle sorte qu' elles s' influencent mutuellement . La configuration d' activation finale dépend à la fois de l' information externe et de l' état interne du réseau ( le poids des connexions entre unités provenant de l' apprentissage du réseau ) . Suite à la phase d' apprentissage consistant à créer dans le réseau une mémoire d' expériences vécues , la présentation de nouveaux stimuli permet de tester comme pour un sujet la réponse du réseau en fonction de l' information d' entrée . Les résultats des simulations utilisant ce modèle reproduisent plusieurs effets . Par exemple , l' effet de fréquence d' exemplaires rencontrés sur les inférences , c' est-à-dire que plus le nombre d' exemplaires présentant des similarités augmente , plus ils sont utilisés pour faire des inférences sur d' autres . L' effet d' apprentissage de stéréotypes sur un groupe à partir de l' exposition à des membres de ce groupe , c' est-à-dire la création d' un prototype à partir d' exemplaires . Ce modèle contribue donc à comprendre la façon dont les individus intègrent et utilisent les informations auxquelles ils sont soumis lors de la perception des personnes . De plus , au-delà de la simple réplication de résultats existants ( nécessaire à la validation du modèle connexioniste proposé comme implémentation ) , nous pensons que la simulation permet de prédire de nouveaux résultats . Ainsi , en utilisant des situations tests non encore étudiées dans la littérature ou en proposant une approche différente des processus impliqués dans un phénomène , les performances obtenues ( quantitatives et qualitatives ) peuvent être confrontées aux données expérimentales humaines . Le rôle de la simulation n' est donc pas de remplacer l' expérimentation mais bien de faciliter la proposition d' hypothèses alternatives . La modélisation connexioniste est donc bien un nouvel outil de recherche pour la psychologie sociale . Elle ne remplace pas les modèles classiques , mais elle propose un autre point de vue sur ces modèles , c' est une alternative efficace dans l' élaboration de nouvelles hypothèses de recherche . 3.2 . Exemples d' axes d' utilisation du formalisme connexioniste émergeant en psychologie sociale . Deux axes de recherche se sont développés autour de l' introduction du connexionisme en psychologie sociale , en s' orientant soit sur l' évolution des modèles proposés , soit sur l' utilisation de modèles existants . Si le champ de la formation d' impression a fait l' objet de nombreuses publications , d' autres modèles connexionistes ont implémenté les attributions causales ou la dissonance cognitive ( Jordens Shultz & Lepper , 1996 , van Overwalle & Jordens , 2002 ) . Ces modèles proposent de la même façon , en se confrontant mutuellement , d' améliorer la compréhension et l' explication des phénomènes étudiés . La démarche envisagée ici consiste à « rebondir » sur les apports de chaque modèle . En effet , nous verrons qu' à partir d' un premier modèle connexioniste , d' autres se sont développés en intégrant les aspects positifs mais aussi en palliant les limites de leurs prédécesseurs . Par exemple , les modèles connexionistes de la formation d' impression , mettent en évidence la possibilité de remplacer plusieurs processus par un seul modèle explicatif , en présentant une évolution de conception incontestable . Les premiers modèles de satisfaction de contraintes parallèles tels que développés par Kunda et Thagard ( 1996 ) , ont donné lieu à de nombreuses critiques notamment en terme de conception statique et d' incapacité à apprendre de nouvelles situations . Kunda et Thagard ( 1996 ) ont proposé l' un des premiers modèles connexionistes de la formation d' impression dit IMP ( IMPression formation ) . Ce modèle est créé selon l' approche localiste de satisfaction de contraintes parallèles . Il décrit la façon dont un individu observateur utilise ses connaissances sur un groupe social pour se former une impression sur une personne . IMP est un réseau de neurones dont les unités codent des connaissances ( stéréotypes , traits ou comportements ) , et les poids entre unités traduisent des liens excitateurs ou inhibiteurs entre ces connaissances . Ces liens sont déterminés sur la base de données typiquement obtenue en expérimentation . IMP réplique des résultats tels que la coloration de la compréhension d' un comportement par les stéréotypes , en indiquant que cela provient du fait que l' individu observé active directement certains stéréotypes activant eux-mêmes certains traits qui en retour activent certaines interprétations du comportement . Observer quelqu' un qui pousse autrui est interprété comme un comportement agressif lorsqu' il est émis par un individu noir plutôt qu' un individu blanc du fait des connexions existantes entre les comportements , les traits et le stéréotype . IMP explique de façon intégrative comment différentes sources d' informations sur une personne peuvent s' influencer et s' intégrer mutuellement pour former une impression cohérente . Cette influence n' étant pas définie à partir de processus dissociés du traitement de certaines informations . La limite principale de ce modèle concerne son incapacité à apprendre de nouvelles informations puisqu' il ne dispose d' aucune règle d' apprentissage . Dès lors , d' autres options de modélisation ont été envisagées permettant l' intégration notamment de l' apprentissage de nouvelles situations . Si IMP était conçu de façon localiste et statique , Queller et Smith ( 2002 ) et Smith et DeCoster ( 1998a et b ) proposent d' envisager l' utilisation d' un modèle récurrent possédant une règle d' apprentissage . Ils décrivent ainsi , la façon dont l' individu utilise ses connaissances antérieures sur les individus et sur les groupes pour faire des inférences sur d' autres caractéristiques inconnues . Comme nous l' avons déjà expliqué , les résultats des simulations reproduisent les effets de fréquence d' exemplaires rencontrés sur les inférences , les effets d' apprentissage de stéréotypes de groupe à partir de l' exposition à des membres de ce groupe , des effets de fréquence et de récence sur l' accessibilité . Le modèle connexioniste proposé rend compte d' un seul mécanisme générateur de ces effets et permet d' intégrer la notion d' apprentissage . Malgré l' évitement de questions relatives au moment où le stockage des exemplaires ou encore liées à la façon d' utiliser les stéréotypes ou les exemplaires connus , il n' empêche que certaines limites demeurent . En effet , le modèle proposé est peu influencé par une fréquence de rencontres avec un stimulus dont les caractéristiques ont un poids faible , alors que les individus intègrent fortement certains indices peu courants . En parallèle , le développement proposé par Kashima Dès lors , d' autres options de modélisation ont été envisagées permettant l' intégration notamment de l' apprentissage de nouvelles situations . Si IMP était conçu de façon localiste et statique , Queller et Smith ( 2002 ) et Smith et DeCoster ( 1998a et b ) proposent d' envisager l' utilisation d' un modèle récurrent possédant une règle d' apprentissage . Ils décrivent ainsi , la façon dont l' individu utilise ses connaissances antérieures sur les individus et sur les groupes pour faire des inférences sur d' autres caractéristiques inconnues . Comme nous l' avons déjà expliqué , les résultats des simulations reproduisent les effets de fréquence d' exemplaires rencontrés sur les inférences , les effets d' apprentissage de stéréotypes de groupe à partir de l' exposition à des membres de ce groupe , des effets de fréquence et de récence sur l' accessibilité . Le modèle connexioniste proposé rend compte d' un seul mécanisme générateur de ces effets et permet d' intégrer la notion d' apprentissage . Malgré l' évitement de questions relatives au moment où le stockage des exemplaires ou encore liées à la façon d' utiliser les stéréotypes ou les exemplaires connus , il n' empêche que certaines limites demeurent . En effet , le modèle proposé est peu influencé par une fréquence de rencontres avec un stimulus dont les caractéristiques ont un poids faible , alors que les individus intègrent fortement certains indices peu courants . En parallèle , le développement proposé par Kashima et al. ( 1994 ) et Kashima , Woolcock et Kashima ( 2000 ) permet de contribuer à la prise en compte de l' évolution des stéréotypes et leur application dans des paradigmes de classification et de jugement . ( 1994 ) et Kashima , Woolcock et Kashima ( 2000 ) permet de contribuer à la prise en compte de l' évolution des stéréotypes et leur application dans des paradigmes de classification et de jugement . Par ailleurs , van Overwalle et Labiouse ( 2003 ) et van Rooy Par ailleurs , van Overwalle et Labiouse ( 2003 ) et van Rooy et al. ( 2003 ) utilisent un auto-associateur linéaire récurrent pour expliquer davantage de phénomènes de la formation d' impression . Ils proposent un réseau auto-associateur linéaire récurrent à faible taux de paramètres variables . Cela revient à définir une architecture générale dont les paramètres ( taux d' apprentissage , fonction d' activation , règle d' apprentissage , etc. ) demeurent équivalents dans toutes les simulations . Les auteurs s' appuient sur une approche localiste , en proposant que chacun des concepts utilisés soit représenté par une unité particulière . Cela leur permet d' améliorer les propositions d' explications faites par les modèles antérieurs . Ainsi , ce modèle offre une nouvelle perspective de compréhension des processus impliqués dans la perception sociale . Il décrit comment l' apprentissage de structures de connaissances prend place à travers le développement d' associations entre concepts sociaux . C' est à partir de son aspect dynamique et adaptatif induit par l' utilisation de la règle d' apprentissage du delta que ce modèle présente un pouvoir computationnel plus important que ses prédécesseurs . Si ce modèle réplique de façon isomorphe les résultats de la littérature , il permet aussi de prédire à un niveau de détail plus précis les résultats qu' obtiendraient des sujets en expérimentation . De plus , il comble certaines limites du TPM telle que l' obligation d' ajouter des mécanismes externes pour modéliser le changement de stéréotype lorsqu' une information inconsistante nécessite d' individualiser un individu . ( 2003 ) utilisent un auto-associateur linéaire récurrent pour expliquer davantage de phénomènes de la formation d' impression . Ils proposent un réseau auto-associateur linéaire récurrent à faible taux de paramètres variables . Cela revient à définir une architecture générale dont les paramètres ( taux d' apprentissage , fonction d' activation , règle d' apprentissage , etc. ) demeurent équivalents dans toutes les simulations . Les auteurs s' appuient sur une approche localiste , en proposant que chacun des concepts utilisés soit représenté par une unité particulière . Cela leur permet d' améliorer les propositions d' explications faites par les modèles antérieurs . Ainsi , ce modèle offre une nouvelle perspective de compréhension des processus impliqués dans la perception sociale . Il décrit comment l' apprentissage de structures de connaissances prend place à travers le développement d' associations entre concepts sociaux . C' est à partir de son aspect dynamique et adaptatif induit par l' utilisation de la règle d' apprentissage du delta que ce modèle présente un pouvoir computationnel plus important que ses prédécesseurs . Si ce modèle réplique de façon isomorphe les résultats de la littérature , il permet aussi de prédire à un niveau de détail plus précis les résultats qu' obtiendraient des sujets en expérimentation . De plus , il comble certaines limites du TPM telle que l' obligation d' ajouter des mécanismes externes pour modéliser le changement de stéréotype lorsqu' une information inconsistante nécessite d' individualiser un individu . Le modèle proposé par van Overwalle et Labiouse ( 2003 ) n' est pas présenté en détail , cependant , il nous semble intéressant de noter , qu' après les évolutions et les développements proposés au travers des modèles précédents , ce modèle rend compte d' un certain aboutissement . Ils utilisent le modèle présenté précédemment afin de comprendre comment l' information est encodée , structurée et activée afin d' être réactivée dans l' émission de jugements . Les résultats obtenus en simulation répliquent de façon isomorphe ceux de la littérature existante , et prédisent favorablement d' autres résultats . L' aspect prédictif proposé ici , permet d' envisager une autre façon de concevoir la recherche ; en ce sens qu' il montre la capacité de la modélisation connexioniste à proposer des hypothèses complémentaires testables en expérimentation . Il se pourrait cependant , comme le soulignent les auteurs , que l' adéquation entre données de simulations et données d' expérimentations provienne essentiellement de choix de paramètres particuliers au cours des simulations . L' intérêt d' une telle démarche réside bien dans cette capacité de la modélisation connexioniste de simplifier et réunifier les théories existantes . Au-delà de cet aspect explicatif , l' évolution qui apparaît dans la conception de ces modèles révèle un autre point d' intérêt des modèles connexionistes : l' aspect dynamique de la réflexion . Si les auteurs ne s' accordent pas sur un modèle particulier pour simuler la formation d' impression , la confrontation et l' évaluation des modèles de chacun induit des développements considérables de la recherche connexioniste autour de ce thème et amènent de nouvelle conception théorique . De même , les recherches menées autour de l' attribution causale ont amené un développement des modélisations pour aboutir principalement à un recentrage des études par le biais du modèle proposé par van Overwalle et van Rooy ( 2001 ) . C' est à partir des confrontations et de l' évaluation des prédécesseurs que ce recentrage émerge . Utilisant une approche des modèles connexionistes quelque peu différente , Read et Marcus-Newhall ( 1993 ) proposent , à partir des résultats du modèle ( ECHO ) développé par Thagard ( 1989 ) sur les explications causales , d' en tester la capacité prédictive . Nous trouvons ici une démarche différente de celle exposée précédemment qui cherchait une amélioration du modèle par utilisation d' architecture différente . Read et Marcus-Newhall ( 1993 ) proposent de tester les principes résultants de l' étude de Thagard ( 1989 ) auprès de sujets humains . Thagard ( 1989 ) propose que le choix d' une explication causale , au détriment d' une autre , est dirigé par quatre principes : la préférence pour des explications expliquant le plus d' événements , la préférence pour les explications les plus simples , l' utilisation d' explications qui sont elles-mêmes explicables et enfin un choix compétitif entre explications . Après avoir confronté les résultats proposés par le modèle et ceux obtenus par les sujets , Read et Marcus-Newhall ( 1993 ) indiquent que la simulation de chacun des principes indépendamment révèle leur rôle dans l' évaluation des explications . Si les explications proposées par Thagard étaient directement issues des simulations , il s' avère que le choix d' appliquer les quatre principes identifiés en même temps et d' implémenter une situation complexe de travail en groupe , amène le problème de validité psychologique . Read et Marcus-Newhall ( 1993 ) testent donc cette validité psychologique par une indépendance du test des principes et une confrontation aux données d' expérimentation . Le retour que proposent les auteurs sur le modèle ECHO indique que les hypothèses proposées par ECHO sont valides et trouvent une confirmation expérimentale . De la même façon que la modélisation de la formation d' impression trouvait une évolution au cours des développements de modèles , d' autres auteurs ont proposé des améliorations de l' implémentation des explications causales . Van Overwalle ( 1998 ) , dans une critique des résultats obtenus par Read et Marcus-Newhall ( 1993 ) , propose de dépasser les limites d' ECHO concernant le manque de prise en compte des problèmes de covariation d' information . A partir d' un réseau de type De la même façon que la modélisation de la formation d' impression trouvait une évolution au cours des développements de modèles , d' autres auteurs ont proposé des améliorations de l' implémentation des explications causales . Van Overwalle ( 1998 ) , dans une critique des résultats obtenus par Read et Marcus-Newhall ( 1993 ) , propose de dépasser les limites d' ECHO concernant le manque de prise en compte des problèmes de covariation d' information . A partir d' un réseau de type feedforward avec une règle d' apprentissage delta , il propose une perspective alternative des principes de cohérence dans l' explication causale qui tient compte de la confrontation à de nouvelles expériences . La réponse de Read et Montoya ( 1999 ) au modèle avec une règle d' apprentissage delta , il propose une perspective alternative des principes de cohérence dans l' explication causale qui tient compte de la confrontation à de nouvelles expériences . La réponse de Read et Montoya ( 1999 ) au modèle feedforward proposé par van Overwalle ( 1998 ) implique l' utilisation d' un réseau auto-associateur . Ce développement à partir des critiques d' ECHO et du modèle de van Overwalle ( 1998 ) permet de considérer des problèmes tels que l' asymétrie ou la compétition entre explications . Si ce modèle se développe à partir des critiques de ceux antérieurement conçus , van Overwalle et van Rooy ( 2001 ) proposent de modéliser spécifiquement les principes de covariation et de compétition de Kelley ( 1971 ) . Ils montrent ainsi que ces principes et celui de la taille des exemplaires peuvent être simulés et expliqués par un modèle connexioniste . Ils montrent non seulement comment l' individu ajuste au pas à pas ses estimations causales ( règle delta ) , mais aussi comment l' individu émet des jugements adéquats pour des situations dans lesquelles il ne dispose pas d' informations nouvelles . proposé par van Overwalle ( 1998 ) implique l' utilisation d' un réseau auto-associateur . Ce développement à partir des critiques d' ECHO et du modèle de van Overwalle ( 1998 ) permet de considérer des problèmes tels que l' asymétrie ou la compétition entre explications . Si ce modèle se développe à partir des critiques de ceux antérieurement conçus , van Overwalle et van Rooy ( 2001 ) proposent de modéliser spécifiquement les principes de covariation et de compétition de Kelley ( 1971 ) . Ils montrent ainsi que ces principes et celui de la taille des exemplaires peuvent être simulés et expliqués par un modèle connexioniste . Ils montrent non seulement comment l' individu ajuste au pas à pas ses estimations causales ( règle delta ) , mais aussi comment l' individu émet des jugements adéquats pour des situations dans lesquelles il ne dispose pas d' informations nouvelles . Conclusion du chapitre 1 Si le développement de modèles connexionistes émerge en psychologie sociale comme nouvelle stratégie de recherche , il s' avère que leur intérêt est en pratique incontestable . Au-delà d' une simple réplication de théorie existante , ces modèles proposent un regard alternatif sur les phénomènes étudiés . Néanmoins , comme nous l' avons souligné , ces modèles déjà développés utilisent le formalisme classique des réseaux de neurones dont les contraintes d' utilisation ne permettent pas de rendre compte des interactions auxquelles les individus sont soumis . Le formalisme classique nous semble , certes adéquate , mais nous pensons que la possibilité de prendre en compte les interactions entre les individus de façon plus dynamique permet d' aller plus loin . Le formalisme des réseaux de neurones écologiques pallie ce déficit , en proposant d' utiliser le réseau de neurones non plus comme une entité statique mais comme un agent actif . Cet agent évolue , apprend dans son environnement en intégrant les conséquences de son comportement . Ce principe permet de prendre en compte non plus les processus impliqués pour l' individu dans des situations prédéfinies , mais de considérer qu' il est acteur et qu' il entretient avec son environnement une relation qui détermine ses apprentissages . Les situations sociales où l' individu est en interaction avec ses pairs sont nombreuses , néanmoins , il nous semble qu' une situation où l' individu bénéficie de la présence d' autrui parce que cet autrui lui permet d' apprendre , propose un cadre de test du formalisme écologique intéressant . Ce type de situation réfère au phénomène d' apprentissage social et nous allons développer dans le second chapitre les différents aspects de cette théorie développée par Bandura ( 1986 ) . Chapitre 2 : L' apprentissage social Le choix de la théorie de l' apprentissage social ( Bandura , 1977 ) comme champ d' application des réseaux de neurones écologiques s' est imposé tout naturellement . D' une part , parce que c' est une théorie robuste déjà longuement éprouvée par une multitude de recherches . D' autre part , c' est une théorie aboutie pour laquelle les recherches actuelles amènent des compléments d' explication sans pour autant la remettre en cause . En outre , l' obligation d' impliquer deux ou plusieurs individus dans le phénomène d' apprentissage social amène naturellement à considérer un modèle connexioniste qui est capable d' entrer en relation avec son environnement social pour acquérir de nouvelles connaissances . Cela étant l' idée fondatrice du formalisme écologique , il nous semble que créer un modèle connexioniste écologique nous permettra de rendre compte de l' influence de l' interaction entre les individus . La théorie de l' apprentissage social suppose que l' individu bénéficie de la présence d' autrui , parce que cet autrui lui évite de se confronter à toutes les situations pour s' adapter . Ainsi , l' individu peut apprendre sans faire l' expérience directe des conséquences de ses comportements sur l' environnement . A partir de l' observation des comportements émis par autrui , l' individu est en mesure de les apprendre , de les intégrer de la même façon que s' il les avait lui-même vécus . Ce type d' apprentissage repose sur un ensemble de processus impliqués dans la mémorisation et dans la production éventuelle de ces comportements . Après avoir présenté les origines de la théorie de l' apprentissage social et ses fondements , nous développerons plus précisément l' une de ses composantes : l' apprentissage par observation développée par Bandura ( 1986 ) . Dans la perspective de développer un modèle connexioniste écologique de l' apprentissage par observation , nous focaliserons essentiellement notre présentation théorique sur les aspects de mémorisation et de production des comportements . La mémorisation des comportements observés relève spécifiquement des propriétés d' apprentissage et d' émergence de connaissances , et la production relève principalement de la mise en action d' un modèle dans une situation sociale . Afin d' introduire les notions nécessaires à la suite du document , l' apprentissage d' habiletés motrices fera l' objet d' un exposé détaillé . 1 . Apprentissage social L' apprentissage peut être défini comme la résultante de l' intégration au système cognitif , de façon relativement permanente , de nouvelles informations et de nouvelles stratégies d' utilisation de ces informations . Il peut être individuel ou résulter d' une interaction . L' apprentissage individuel consiste , pour l' individu , à acquérir de nouvelles structures de connaissances , de nouveaux comportements par un apprentissage de type essai-erreur . Néanmoins , une grande part des acquisitions est réalisée au travers des interactions de l' individu avec autrui , et ce type d' apprentissage réfère à l' apprentissage social . 1.1 . Origine de la théorie de l' apprentissage social Bandura publie ces premiers travaux sur l' apprentissage social au début des années soixante en suivant le chemin déjà ouvert par d' autres chercheurs sur la base de perspectives différentes . Parmi ces auteurs , Rotter ( 1954 ) s' appuie sur l' application clinique de la théorie de l' apprentissage social . Selon lui l' environnement social permettrait à l' enfant d' acquérir graduellement de nouveaux buts ( besoins psychologiques ) , habiletés , et de nouvelles attentes dépendantes des expériences ( renforcements obtenus suite aux comportements ) . L' apprentissage consiste en une généralisation des attentes de renforcement . Sears ( 1958 ) se focalise quant à lui sur les processus de socialisation et s' intéresse plus particulièrement à la façon dont les enfants internalisent les valeurs , les attitudes , et les comportements prédominants dans leur culture ( cité dans Grussec , 1992 Bandura publie ces premiers travaux sur l' apprentissage social au début des années soixante en suivant le chemin déjà ouvert par d' autres chercheurs sur la base de perspectives différentes . Parmi ces auteurs , Rotter ( 1954 ) s' appuie sur l' application clinique de la théorie de l' apprentissage social . Selon lui l' environnement social permettrait à l' enfant d' acquérir graduellement de nouveaux buts ( besoins psychologiques ) , habiletés , et de nouvelles attentes dépendantes des expériences ( renforcements obtenus suite aux comportements ) . L' apprentissage consiste en une généralisation des attentes de renforcement . Sears ( 1958 ) se focalise quant à lui sur les processus de socialisation et s' intéresse plus particulièrement à la façon dont les enfants internalisent les valeurs , les attitudes , et les comportements prédominants dans leur culture ( cité dans Grussec , 1992 [ 3 ] ) . Miller et Dollard ( 1941 ) ont proposé une théorie relativement complète de l' apprentissage social et de l' imitation fondée sur le renforcement . Le renforcement y est défini comme un moyen de réduire le ) . Miller et Dollard ( 1941 ) ont proposé une théorie relativement complète de l' apprentissage social et de l' imitation fondée sur le renforcement . Le renforcement y est défini comme un moyen de réduire le drive ( « l' activation » ) et l' imitation prend place dès lors que les réponses de l' individu ont été suffisamment renforcées pour qu' il maintienne le lien entre comportement émis et renforcement reçu . Cependant , ces auteurs ne prennent pas en considération l' acquisition de nouveaux comportements et la possibilité d' émettre des comportements observés , et ce , en l' absence du modèle . Afin de remédier à ce déficit théorique , Bandura ( 1986 ) propose de redéfinir la théorie de l' apprentissage social en intégrant spécifiquement les processus cognitifs impliqués dans ce type d' apprentissage . Il cherche notamment à comprendre comment les adultes et les enfants intègrent cognitivement leurs expériences sociales et dans quelle mesure ces opérations cognitives influencent leur comportement et leur développement . L' auteur se distingue ainsi des théories classiques de l' apprentissage social en intégrant le concept de déterminisme triadique réciproque dans l' explication du comportement humain . Ce déterminisme est défini comme l' interaction constante entre les facteurs cognitifs , comportementaux et environnementaux . De plus , Bandura considère l' apprentissage par observation comme une forme d' apprentissage social qui jusqu'alors n' avait été que peu prise en compte . C' est en 1986 qu' il rebaptise sa théorie de l' apprentissage social en « Théorie Sociale Cognitive » ( ( « l' activation » ) et l' imitation prend place dès lors que les réponses de l' individu ont été suffisamment renforcées pour qu' il maintienne le lien entre comportement émis et renforcement reçu . Cependant , ces auteurs ne prennent pas en considération l' acquisition de nouveaux comportements et la possibilité d' émettre des comportements observés , et ce , en l' absence du modèle . Afin de remédier à ce déficit théorique , Bandura ( 1986 ) propose de redéfinir la théorie de l' apprentissage social en intégrant spécifiquement les processus cognitifs impliqués dans ce type d' apprentissage . Il cherche notamment à comprendre comment les adultes et les enfants intègrent cognitivement leurs expériences sociales et dans quelle mesure ces opérations cognitives influencent leur comportement et leur développement . L' auteur se distingue ainsi des théories classiques de l' apprentissage social en intégrant le concept de déterminisme triadique réciproque dans l' explication du comportement humain . Ce déterminisme est défini comme l' interaction constante entre les facteurs cognitifs , comportementaux et environnementaux . De plus , Bandura considère l' apprentissage par observation comme une forme d' apprentissage social qui jusqu'alors n' avait été que peu prise en compte . C' est en 1986 qu' il rebaptise sa théorie de l' apprentissage social en « Théorie Sociale Cognitive » ( Social Cognitive Theory ) marquant ainsi son empreinte personnelle de l' évolution théorique qu' il défend depuis le début de ses publications sur le sujet . ) marquant ainsi son empreinte personnelle de l' évolution théorique qu' il défend depuis le début de ses publications sur le sujet . 1.2 . D' une conception béhavioriste à une conception néo-béhavioriste de la théorie de l' apprentissage social Les théories de l' apprentissage social trouvent leur origine dans une conception béhavioriste , d' une part en définissant la production d' un comportement comme une réponse à une stimulation particulière , d' autre part , en stipulant que l' apprentissage des comportements est fondé sur la régularité des renforcements à laquelle l' individu est confronté dans son environnement et au cours de son existence . En revanche , la théorie sociale cognitive envisage qu' au-delà d' une association stimilus-réponse , les facteurs individuels tiennent une place particulièrement importante dans le développement des comportements . En outre , selon Bandura ( 1986 ) , l' apprentissage n' est pas une conséquence unique du renforcement des comportements produits par l' individu mais peut apparaître sans que l' individu ne soit directement soumis aux influences environnementales . Pour cela , la théorie sociale cognitive définit le développement des comportements humains comme résultant de l' interaction dynamique entre les facteurs personnels , le comportement et l' environnement . Les facteurs personnels réfèrent aux pensées , affects , croyances , intentions , attentes et aux capacités physiques et sensorielles de l' individu . Le comportement correspond à toutes les actions de l' individu dirigées vers l' environnement extérieur . L' environnement considère à la fois les aspects physiques de celui -ci mais aussi les personnes . Ces trois facteurs s' influencent mutuellement de la manière suivante : Facteurs personnels et comportement Les liens entre les facteurs personnels et le comportement reflètent l' interaction réciproque entre les pensées , les affects et les actions . Les croyances , les expectations et les intentions de l' individu induisent une direction au comportement qu' il émet . De plus , les structures physiques et sensorielles contraignent les capacités d' actions de l' individu sur l' environnement . L' expérience des comportements détermine ou modifie , en retour , les structures cognitives . Facteurs personnels et environnement Les facteurs personnels sont influencés par l' environnement social , en ce sens que ce dernier propose des réponses que l' individu doit intégrer à son système de pensée . Par ses réponses , l' environnement véhicule de l' information et active des réactions émotionnelles chez l' individu . En retour , l' individu propose des réactions adaptées en fonction de ses caractéristiques personnelles . Comportement et environnement Selon Bandura ( 1986 , 1989 ) l' individu est le produit et le producteur de son environnement . Le comportement d' un individu détermine les aspects de l' environnement auquel il est exposé , et son comportement est modifié par l' environnement . De la même façon , le comportement d' un individu peut affecter la façon dont il expérimente l' environnement . Le déterminisme réciproque entre facteurs personnels , comportement et environnement nécessite que l' individu soit en mesure d' identifier , de stocker et d' utiliser les informations qu' il extrait de son environnement et de son propre comportement . Dans cette perspective , Bandura ( 1986 , 1989 ) indique que l' individu possède cinq capacités de base que sont la symbolisation , la vicariance , l' anticipation , l' auto régulation et l' auto réflexion , nécessaires à l' apprentissage social ( cf. Grussec , 1992 ; Ferrari , 1996 ; Cervonne , Jiwani & Wood , 1991 ) . A partir de ces capacités l' individu est en mesure d' intégrer les expériences d' autrui de la même façon que si lui-même les avait vécues ( vicariance ) en les stockant en mémoire sous forme de symboles ( symbolisation ) . En observant les conséquences du comportement d' un modèle considéré comme similaire à soi , l' individu peut formuler des croyances , des attentes quant à l' issue de ses propres actions ( anticipation ) . Il peut ainsi déterminer des buts à atteindre , utiliser ses connaissances comme standard d' exécution ( auto régulation ) . Enfin , l' évaluation des conséquences obtenues ( auto réflexion ) lui permet d' adapter , de réguler ses connaissances . 2 . Originalité de l' apprentissage social L' un des principes fondamentaux de la théorie sociale cognitive , auquel Bandura a apporté un éclairage incontestable , est la capacité de l' individu à intégrer des expériences vécues par autrui dans son système de pensée , et ce de la même façon que s' il les avait lui-même vécues ( l' apprentissage vicariantL'un des principes fondamentaux de la théorie sociale cognitive , auquel Bandura a apporté un éclairage incontestable , est la capacité de l' individu à intégrer des expériences vécues par autrui dans son système de pensée , et ce de la même façon que s' il les avait lui-même vécues ( l' apprentissage vicariant [ 4 ] ) . C' est un comportement d' apprentissage qui est substitué à un autre ; c' est-à-dire que le renforcement n' est pas directement applicable au comportement de l' apprenant mais à des comportements qu' il peut observer . Cette capacité d' apprentissage vicariant permet à l' individu d' acquérir des connaissances , des compétences , des valeurs , des habiletés motrices en l' absence d' une expérience directe avec l' environnement ( social ou physique ) . Jusqu'alors les théories traditionnelles mettaient l' accent sur l' apprentissage en tant qu' effet des actions directes de l' individu sur son environnement . Ce type d' apprentissage suppose que l' individu adapte son comportement en fonction des erreurs qu' il produit , ce qui induit une lenteur des acquisitions . Si seule cette forme d' apprentissage existait pour l' individu alors , la culture , le langage , et les normes ne pourraient être si rapidement transmis . Pour contrecarrer cette lenteur , l' individu développe une capacité d' apprentissage par observation qui permet l' acquisition d' informations , de compétences ou d' habiletés sur la base des informations convoyées par des influences modelantes ( des modèles ) . Comme le souligne Bandura « l' apprentissage serait excessivement laborieux et risqué si les individus devaient se baser uniquement sur les effets de leurs actions de façon à être informés sur ce qu' il faut faire . Heureusement , la plupart des comportements humains sont appris par observation au moyen du modelage . A partir de l' observation d' autrui , nous nous faisons une idée sur la façon dont les nouveaux comportements sont produits . Plus tard , cette information sert de guide pour l' action . Les individus sont capables d' apprendre ce qu' il faut faire à partir d' exemples vus , au moins de façon approximative , avant de produire le comportement . Cela permet d' éviter beaucoup d' épreuves inutiles » . C' est donc aussi en observant les conséquences des comportements émis par un autrui , considéré comme similaire à soi , que l' individu est capable de formuler des attentes sur les résultats de ses propres actions . C' est pour toutes ces raisons que la théorie de l' apprentissage social développée par Bandura ( 1986 ) a pu être qualifiée de néo-béhavioriste . ) . C' est un comportement d' apprentissage qui est substitué à un autre ; c' est-à-dire que le renforcement n' est pas directement applicable au comportement de l' apprenant mais à des comportements qu' il peut observer . Cette capacité d' apprentissage vicariant permet à l' individu d' acquérir des connaissances , des compétences , des valeurs , des habiletés motrices en l' absence d' une expérience directe avec l' environnement ( social ou physique ) . Jusqu'alors les théories traditionnelles mettaient l' accent sur l' apprentissage en tant qu' effet des actions directes de l' individu sur son environnement . Ce type d' apprentissage suppose que l' individu adapte son comportement en fonction des erreurs qu' il produit , ce qui induit une lenteur des acquisitions . Si seule cette forme d' apprentissage existait pour l' individu alors , la culture , le langage , et les normes ne pourraient être si rapidement transmis . Pour contrecarrer cette lenteur , l' individu développe une capacité d' apprentissage par observation qui permet l' acquisition d' informations , de compétences ou d' habiletés sur la base des informations convoyées par des influences modelantes ( des modèles ) . Comme le souligne Bandura « l' apprentissage serait excessivement laborieux et risqué si les individus devaient se baser uniquement sur les effets de leurs actions de façon à être informés sur ce qu' il faut faire . Heureusement , la plupart des comportements humains sont appris par observation au moyen du modelage . A partir de l' observation d' autrui , nous nous faisons une idée sur la façon dont les nouveaux comportements sont produits . Plus tard , cette information sert de guide pour l' action . Les individus sont capables d' apprendre ce qu' il faut faire à partir d' exemples vus , au moins de façon approximative , avant de produire le comportement . Cela permet d' éviter beaucoup d' épreuves inutiles » . C' est donc aussi en observant les conséquences des comportements émis par un autrui , considéré comme similaire à soi , que l' individu est capable de formuler des attentes sur les résultats de ses propres actions . C' est pour toutes ces raisons que la théorie de l' apprentissage social développée par Bandura ( 1986 ) a pu être qualifiée de néo-béhavioriste . Ce type d' apprentissage apparaît très tôt dans le développement de l' enfant . Meltzoff ( 1988 ) montre que des enfants de quatorze mois sont capables d' utiliser l' observation comme source d' apprentissage des gestes sur les objets . En conséquence , l' individu développe une conception de l' environnement social non seulement à partir de sa propre expérience , mais aussi au travers des expériences vicariantes ( ce qu' il voit , ce qu' il entend ) . Bandura ( 1989 ) propose que ces expériences vicariantes ( les influences modelantes ) ont plusieurs effets psychologiques . Elles servent d' instructeurs ( elles donnent des modèles à suivre ) , elles inhibent ou désinhibent certains comportements ( elles jouent sur la motivation à accomplir ou non un acte ) , elles induisent de la facilitation sociale et provoquent de l' activation émotionnelle . Tout cela permet à l' individu d' acquérir des valeurs , des attitudes et des dispositions émotionnelles à l' égard des objets et des personnes . Les déterminants et les mécanismes des effets du modelage ont été particulièrement étudiés et Bandura ( 1986 ) propose de les rassembler sous le vocable d' apprentissage par observationLes déterminants et les mécanismes des effets du modelage ont été particulièrement étudiés et Bandura ( 1986 ) propose de les rassembler sous le vocable d' apprentissage par observation [ 5 ] . Les mécanismes de cet apprentissage posent toutefois une question fondamentale : d' après le principe de l' apprentissage par renforcement , seuls les comportements émis peuvent être renforcés , dès lors comment un comportement qui n' a pas été émis , donc qui n' a pas été directement renforcé , peut -il être appris ? C' est pour répondre à ce problème que Bandura développe une théorie de l' apprentissage par observation faisant intervenir représentations et renforcements symboliques de ces représentations . Il détermine ainsi comment un individu placé en situation d' interaction avec autrui acquiert de nouveaux comportements . Qu' il résulte en l' acquisition de connaissances , de . Les mécanismes de cet apprentissage posent toutefois une question fondamentale : d' après le principe de l' apprentissage par renforcement , seuls les comportements émis peuvent être renforcés , dès lors comment un comportement qui n' a pas été émis , donc qui n' a pas été directement renforcé , peut -il être appris ? C' est pour répondre à ce problème que Bandura développe une théorie de l' apprentissage par observation faisant intervenir représentations et renforcements symboliques de ces représentations . Il détermine ainsi comment un individu placé en situation d' interaction avec autrui acquiert de nouveaux comportements . Qu' il résulte en l' acquisition de connaissances , de patterns comportementaux nouveaux , de standards de jugement , de compétences cognitives , de valeurs , de normes , et la liste pourrait être longue encore , il n' en demeure pas moins que le déroulement de l' apprentissage par observation est toujours identique . L' apprentissage résulte de l' interaction de l' individu avec ses pairs . Nous développerons , dans la partie qui suit , les mécanismes sous-jacents à l' apprentissage par observation en identifiant comment l' individu mémorise et ré-utilise les informations produites par autrui afin d' en bénéficier sans en faire directement l' expérience ( Bandura , 1986 ; Goldstone , 1998 ; Newell , 1991 ) . comportementaux nouveaux , de standards de jugement , de compétences cognitives , de valeurs , de normes , et la liste pourrait être longue encore , il n' en demeure pas moins que le déroulement de l' apprentissage par observation est toujours identique . L' apprentissage résulte de l' interaction de l' individu avec ses pairs . Nous développerons , dans la partie qui suit , les mécanismes sous-jacents à l' apprentissage par observation en identifiant comment l' individu mémorise et ré-utilise les informations produites par autrui afin d' en bénéficier sans en faire directement l' expérience ( Bandura , 1986 ; Goldstone , 1998 ; Newell , 1991 ) . 2.1 . Définition et conditions nécessaires à l' apprentissage par observation Le concept d' apprentissage par observation renvoie à la notion de vicariance , en ce sens que l' individu suite à l' observation d' un comportement émis par autrui et renforcé chez cet autrui , est capable d' intégrer ce comportement ainsi que le renforcement associé à son système de pensée . L' individu peut alors produire ce même comportement pour lequel il sait qu' il obtiendra le renforcement désiré . Les travaux de Robert ( 1970 ) sur l' apprentissage vicariant nous renseignent quant aux conditions nécessaires pour que celui -ci prenne place . La définition que cet auteur a proposée de l' apprentissage vicariant montre l' importance de l' observation dans ce type d' apprentissage . Ainsi , il estime que l' apprentissage vicariant fait suite à l' observation d' événements et résulte en la modification des réponses ou des comportements de l' individu , comme si lui-même avait été directement impliqué dans la séquence d' événement . Les trois conditions qu' il énonce pour cet apprentissage concernent l' environnement , le comportement , et l' observateur . Nous retrouvons bien l' interaction réciproque définie par Bandura ( 1986 ) dans la théorie sociale cognitive . Ces conditions peuvent être mises en évidence dans une situation simple d' apprentissage par observation , où un premier individu ( dit modèle ) émet un comportement et un second individu ( dit observateur ) observe ce comportement afin de le reproduire ultérieurement . Dans cette situation , la condition concernant l' environnement , implique que le modèle et l' observateur soient soumis aux mêmes conditions de stimulations . Le modèle est directement sous l' influence de ces stimulations alors que l' observateur ne fait que les observer ( Robert , 1970 ; Zajonc , 1969 ) . L' observateur ne doit émettre aucun comportement , il ne fait qu' observer la réponse produite par le modèle face aux stimulations ( Bandura & Jeffery , 1973 ) . Enfin , il faut que l' observateur soit en mesure de produire un comportement adapté face aux mêmes stimulations ceci en l' absence du modèle et de façon relativement permanente dans le temps . Selon Bandura et Walters ( 1963 ) « un Les travaux de Robert ( 1970 ) sur l' apprentissage vicariant nous renseignent quant aux conditions nécessaires pour que celui -ci prenne place . La définition que cet auteur a proposée de l' apprentissage vicariant montre l' importance de l' observation dans ce type d' apprentissage . Ainsi , il estime que l' apprentissage vicariant fait suite à l' observation d' événements et résulte en la modification des réponses ou des comportements de l' individu , comme si lui-même avait été directement impliqué dans la séquence d' événement . Les trois conditions qu' il énonce pour cet apprentissage concernent l' environnement , le comportement , et l' observateur . Nous retrouvons bien l' interaction réciproque définie par Bandura ( 1986 ) dans la théorie sociale cognitive . Ces conditions peuvent être mises en évidence dans une situation simple d' apprentissage par observation , où un premier individu ( dit modèle ) émet un comportement et un second individu ( dit observateur ) observe ce comportement afin de le reproduire ultérieurement . Dans cette situation , la condition concernant l' environnement , implique que le modèle et l' observateur soient soumis aux mêmes conditions de stimulations . Le modèle est directement sous l' influence de ces stimulations alors que l' observateur ne fait que les observer ( Robert , 1970 ; Zajonc , 1969 ) . L' observateur ne doit émettre aucun comportement , il ne fait qu' observer la réponse produite par le modèle face aux stimulations ( Bandura & Jeffery , 1973 ) . Enfin , il faut que l' observateur soit en mesure de produire un comportement adapté face aux mêmes stimulations ceci en l' absence du modèle et de façon relativement permanente dans le temps . Selon Bandura et Walters ( 1963 ) « un pattern comportemental est typiquement appris par segment ou dans son intégralité ( .. ) suite aux démonstrations réalisées par un modèle ou en suivant les instructions verbales du comportement désiré , et l' apprenant reproduit généralement plus ou moins l' intégralité du comportemental est typiquement appris par segment ou dans son intégralité ( .. ) suite aux démonstrations réalisées par un modèle ou en suivant les instructions verbales du comportement désiré , et l' apprenant reproduit généralement plus ou moins l' intégralité du pattern de réponses » . Les contraintes de l' apprentissage par observation sont donc particulièrement exigeantes , et ce n' est que dans ce cas qu' il conviendrait de parler d' apprentissage par observation , ce qui nous le verrons n' est pas toujours vrai dans la littérature . de réponses » . Les contraintes de l' apprentissage par observation sont donc particulièrement exigeantes , et ce n' est que dans ce cas qu' il conviendrait de parler d' apprentissage par observation , ce qui nous le verrons n' est pas toujours vrai dans la littérature . 2.2 . Comment se déroule l' apprentissage par observation ? Nous pouvons nous appuyer sur les conditions d' émergence de l' apprentissage par observation pour en développer les processus sous-jacent . A minima , deux individus sont en interaction dans le même environnement . Dans un premier temps , l' individu modèle émet un comportement pendant que l' individu observateur l' observe . Dans un second temps , l' individu observateur est amené à reproduire le comportement observé ( car il est motivé pour obtenir le même résultat ) en l' absence du modèle et ce de façon différée . Nous voyons se profiler d' ores et déjà les phases identifiées par Bandura ( 1986 ) comme sous-tendant l' apprentissage par observation . Cet apprentissage est caractérisé par deux phases impliquant différents processus permettant à l' individu de sélectionner les informations utiles dans son environnement ( social et/ou physique ) , de les mémoriser , et utiliser cette nouvelle structure de connaissances pour émettre de nouveaux comportements lorsqu' il est motivé pour atteindre un but particulier . La première phase est définie comme phase d' acquisitionNous voyons se profiler d' ores et déjà les phases identifiées par Bandura ( 1986 ) comme sous-tendant l' apprentissage par observation . Cet apprentissage est caractérisé par deux phases impliquant différents processus permettant à l' individu de sélectionner les informations utiles dans son environnement ( social et/ou physique ) , de les mémoriser , et utiliser cette nouvelle structure de connaissances pour émettre de nouveaux comportements lorsqu' il est motivé pour atteindre un but particulier . La première phase est définie comme phase d' acquisition [ 6 ] , la seconde comme phase de production . Elles impliquent , comme illustré sur le schéma 2 ( cf. page suivante ) , pour la première les processus d' attention et de rétention , pour la seconde la production et la motivation. , la seconde comme phase de production . Elles impliquent , comme illustré sur le schéma 2 ( cf. page suivante ) , pour la première les processus d' attention et de rétention , pour la seconde la production et la motivation . Schéma 2 : Illustration des phases de l' apprentissage par observation et des processus impliqués pour chacune selon Bandura ( 1986 ) Comme indiqué sur le schéma 2 , au cours de l' observation du modèle ou phase d' acquisition , les processus d' attention et de mémorisation sont sollicités pour sélectionner les informations pertinentes du comportement du modèle et les stocker en mémoire . Ce stockage est réalisé sous forme de représentation symbolique après transformation des comportements observés en images ou symboles verbaux . Ces processus d' attention et de mémorisation sont donc impliqués dans le contrôle de l' acquisition des réponses . Pendant la phase de production , la réactivation de la représentation élaborée pendant l' observation permet la production effective du comportement . Elle permet l' initiation du comportement et le contrôle de celui -ci par comparaison entre comportement effectif et représentation réactivée . Le guidage par la représentation implique un ajustement du comportement à celui mémorisé à mesure qu' il est produit . Le processus motivationnel intervient pour inciter l' individu à reproduire un comportement observé afin d' atteindre un but particulier . Ce but est fixé comme le résultat devant être obtenu suite à l' émission du comportement que l' individu a observé . Les processus de production et de motivation sont donc impliqués dans le contrôle de la performance . 2.2.1 . Les processus attentionnels et motivationnels sous-jacents à l' apprentissage par observation Pour que l' apprentissage par observation soit efficace , il est nécessaire que l' individu focalise son attention sur certains des éléments de la situation . L' attention est définie comme l' ensemble des mécanismes qui déterminent les informations pertinentes de l' environnement et leurs significations . Dans le cadre de l' apprentissage par observation , l' orientation de la focalisation attentionnelle est induite par deux types d' informations : les caractéristiques de l' observateur et celles du modèle . Les caractéristiques personnelles de l' observateur ( e.g. capacité cognitive , niveau d' activation , capacité sensorielle ) ont fait l' objet de peu d' études quant à leur influence directe ( cf . Akamatsu Ohnogi , 1986 ) . L' étude des caractéristiques situationnelles ( e.g. valence affective , pertinence , valeur fonctionnelle , caractéristique du modèle ) a été principalement envisagée sous l' angle des caractéristiques du modèle . Par exemple , celles qui relèvent de la compétence , du pouvoir , du statut , du genre ou de la sympathie ( Fisher & Harris , 1976 ) . Thomas , Due et Wigger ( 1987 ) ont montré que la compétence et le sexe du modèle sont des facteurs importants pour l' imitation chez l' enfant . Pour une tâche de lancement de balle sur une cible , les enfants étaient plus enclins à imiter la stratégie d' un modèle compétent , et l' influence du sexe du modèle n' apparaissait qu' au travers de son interaction avec la compétence de l' émetteur : les enfants imitaient plus les modèles compétents de sexe opposé que les modèles incompétents de même sexe . Plus spécifiquement , Bandura , Ross et Ross ( 1961 ) ont montré l' influence du sexe du modèle dans l' imitation des comportements agressifs . Ils ont proposé aux enfants d' observer des comportements agressifs ( physiques ou verbaux ) émis par des adultes masculins ou féminins . Les résultats indiquaient que les comportements physiques agressifs étaient plus enclins à être imités lorsqu' ils étaient émis par un modèle homme que par un modèle femme . Néanmoins , les comportements verbaux amenaient une similitude d' imitation chez les sujets confrontés à un modèle de même sexe . Les résultats de ces études corroborent pour partie la théorie de l' identification indiquant que les enfants imitent préférentiellement des modèles de même sexe qu' eux ( comportements agressifs verbaux ) , et abondent pour une autre partie ( comportements agressifs physique et lancement de balle ) dans le sens de l' hypothèse d' imitation du même sexe avancée par Perry et Perry ( 1979 ) . Selon ces auteurs , les enfants codent les comportements en fonction de leur connotation sexuelle ( masculin ou féminin ) et ils imitent les comportements appropriés pour leur propre genre . D' arripe-Longueville , Gernigon , Huet , Capodi et Winnykamen ( 2002 ) , ont utilisé la natation pour réaliser une étude avec des sujets novices associés à des tuteurs de niveaux de compétences variables ( évalués par des juges indépendants ) . Ils ont ainsi observé que la performance pour les garçons était meilleure lorsqu' ils étaient soumis à l' observation d' un modèle masculin expert plutôt qu' à un modèle de niveau intermédiaire ou novice . Pour les filles , l' observation d' un modèle féminin expert ou intermédiaire induisait une performance équivalente , et celle -ci était supérieure à celle obtenue suite à l' observation d' un modèle novice . Néanmoins , la comparaison des performances obtenues pour des binômes de sexe différents n' étant pas présentée , il nous semble de nouveau difficile de déterminer si la performance était influencée par le niveau de compétence ou par le sexe du modèle . Quelles auraient donc été les performances des filles associées à des tuteurs masculin de niveaux différents , et inversement ? Bien que la compétence du modèle ait été particulièrement étudiée en fonction du niveau d' expertise , les résultats sont contradictoires . Ils indiquent , pour certains , une efficacité équivalente de l' observation d' un modèle expert ou novice ( Pollock Weir & Leavitt , 1990 ) , pour d' autres une meilleure efficacité de l' observation d' un modèle novice ( Lee & White , 1990 ) ou encore une meilleure efficacité d' un modèle expert ( Capodi D' arripe-Longueville Bien que la compétence du modèle ait été particulièrement étudiée en fonction du niveau d' expertise , les résultats sont contradictoires . Ils indiquent , pour certains , une efficacité équivalente de l' observation d' un modèle expert ou novice ( Pollock Weir & Leavitt , 1990 ) , pour d' autres une meilleure efficacité de l' observation d' un modèle novice ( Lee & White , 1990 ) ou encore une meilleure efficacité d' un modèle expert ( Capodi D' arripe-Longueville et al. , 2002 ) . Selon Ferrari ( 1996 ) , cela proviendrait essentiellement de la nature de la tâche . Ainsi , reproduire une séquence de mouvement de bras ou une tâche de poursuite de cible n' implique pas de porter attention aux mêmes informations : pour la première l' ajustement de la reproduction est fondé sur des informations internes ( proprioception ) , pour la seconde sur des informations externes . Greenfeld et Kuznicki ( 1975 ) ont tenté de lever l' ambiguïté entre compétence du modèle et difficulté de la tâche . Pour cela , ils ont manipulé la difficulté de la tâche et ont ensuite proposé aux sujets d' évaluer le niveau de compétence estimé du modèle . Ils ont proposé à deux sujets de choisir l' un après l' autre un cheval gagnant dans une course ( tâche simple ) ou de classer trois chevaux dans leur ordre attendu d' arrivée ( tâche complexe ) . Ils ont ainsi relevé que l' apprentissage par observation était plus efficace pour une tâche simple que complexe , cela se traduisant par la supériorité de l' acquisition de réponse d' imitation entre les sujets pour la tâche simple . Cependant , en demandant au deuxième sujet d' évaluer le niveau de compétence du premier sujet effectuant le choix , Greenfeld et Kuznicki ( 1975 ) ont mis en évidence un effet du niveau de compétence supposé . Plus le sujet était évalué comme compétent plus la réponse imitative avait de chance d' émerger même si la tâche était complexe . L' influence de la compétence estimée du modèle intervient dans l' apprentissage par observation et apparaît donc difficilement dissociable de la difficulté de la tâche. , 2002 ) . Selon Ferrari ( 1996 ) , cela proviendrait essentiellement de la nature de la tâche . Ainsi , reproduire une séquence de mouvement de bras ou une tâche de poursuite de cible n' implique pas de porter attention aux mêmes informations : pour la première l' ajustement de la reproduction est fondé sur des informations internes ( proprioception ) , pour la seconde sur des informations externes . Greenfeld et Kuznicki ( 1975 ) ont tenté de lever l' ambiguïté entre compétence du modèle et difficulté de la tâche . Pour cela , ils ont manipulé la difficulté de la tâche et ont ensuite proposé aux sujets d' évaluer le niveau de compétence estimé du modèle . Ils ont proposé à deux sujets de choisir l' un après l' autre un cheval gagnant dans une course ( tâche simple ) ou de classer trois chevaux dans leur ordre attendu d' arrivée ( tâche complexe ) . Ils ont ainsi relevé que l' apprentissage par observation était plus efficace pour une tâche simple que complexe , cela se traduisant par la supériorité de l' acquisition de réponse d' imitation entre les sujets pour la tâche simple . Cependant , en demandant au deuxième sujet d' évaluer le niveau de compétence du premier sujet effectuant le choix , Greenfeld et Kuznicki ( 1975 ) ont mis en évidence un effet du niveau de compétence supposé . Plus le sujet était évalué comme compétent plus la réponse imitative avait de chance d' émerger même si la tâche était complexe . L' influence de la compétence estimée du modèle intervient dans l' apprentissage par observation et apparaît donc difficilement dissociable de la difficulté de la tâche . Concernant le statut du modèle , McCullagh ( 1986 ) a montré un effet de ce dernier sur l' attention portée par les enfants au modèle . Cependant , elle n' a relevé aucun effet du statut sur la performance émise par les sujets . Au contraire , Brewer et Wann ( 1998 ) ont montré que des adultes étaient plus efficaces dans la réalisation d' un puzzle , aussi bien au niveau de la qualité de la performance que de la rapidité de l' exécution , lorsqu' ils avaient été soumis à un modèle dont le statut était défini comme élevé en comparaison aux sujets soumis à un modèle dont le statut n' était pas défini . Il semble donc que les caractéristiques du modèle peuvent intervenir sur la qualité de l' attention portée par les sujets . Cependant , les résultats contradictoires relevés dans la littérature indiquent vraisemblablement la difficulté d' opérationnaliser leurs influences sur la reproduction des comportements . Il est vrai qu' identifier ce qui relève du statut et ce qui relève de la compétence , par exemple , est délicat , puisque les sujets semblent accorder plus de compétence à un modèle de haut statut qu' ils n' en accordent à un modèle de bas statut ( même si en réalité le statut et la compétence corrèlent de façon inverse ) . Est -ce alors un problème d' attention ou de validité de la démonstration accordée par le sujet ? Cette question pourrait faire l' objet d' un exposé en soi qui ne correspond pas à notre objectif . Nous retiendrons donc que le processus d' attention est sollicité au cours de l' observation et que cette sollicitation dépend des situations . La focalisation de l' attention permet l' extraction des indices saillants de la situation , c' est-à-dire toutes les informations nécessaires à la production du comportement . Bien que peu d' études se soient intéressées spécifiquement au processus motivationnel , celui -ci est souvent utilisé pour expliquer l' attention portée par les sujets au comportement du modèle ( Brewer D' arripe-Longueville Bien que peu d' études se soient intéressées spécifiquement au processus motivationnel , celui -ci est souvent utilisé pour expliquer l' attention portée par les sujets au comportement du modèle ( Brewer D' arripe-Longueville et al. , 2002 ) . Toutefois , il est incontestable que tous les comportements observés ne sont pas appris , et tous ceux appris par les individus ne sont pas utilisés : cela dépend de la motivation individuelle à atteindre un but particulier . Selon Bandura ( 1986 ) , la motivation conduit l' individu à sélectionner parmi les comportements observés ceux qu' il va intégrer , et elle le conduit à reproduire certains comportements adaptés aux situations . Ce processus intervient donc dans la génération des comportements que l' individu souhaite produire afin d' obtenir une récompense ou atteindre un objectif particulier . De la même façon , si le sujet ne souhaite pas être puni , il inhibera le comportement qu' il s' apprête à produire. , 2002 ) . Toutefois , il est incontestable que tous les comportements observés ne sont pas appris , et tous ceux appris par les individus ne sont pas utilisés : cela dépend de la motivation individuelle à atteindre un but particulier . Selon Bandura ( 1986 ) , la motivation conduit l' individu à sélectionner parmi les comportements observés ceux qu' il va intégrer , et elle le conduit à reproduire certains comportements adaptés aux situations . Ce processus intervient donc dans la génération des comportements que l' individu souhaite produire afin d' obtenir une récompense ou atteindre un objectif particulier . De la même façon , si le sujet ne souhaite pas être puni , il inhibera le comportement qu' il s' apprête à produire . Nous terminerons sur les processus attentionnels et motivationnels , en notant que , dans les études expérimentales , les sujets n' ont pas d' autre choix que de porter attention à ce qui leur est présenté et d' être a minima motivés , puisque l' objectif de leur participation est de réaliser cette tâche . Nous terminerons sur les processus attentionnels et motivationnels , en notant que , dans les études expérimentales , les sujets n' ont pas d' autre choix que de porter attention à ce qui leur est présenté et d' être a minima motivés , puisque l' objectif de leur participation est de réaliser cette tâche . Il est demandé explicitement ou non aux sujets de porter attention au comportement du modèle , donc de se motiver . Il est généralement admis , même si aucune mesure n' en est prise , que les seuils d' attention et de motivation sont suffisants pour que les sujets soient en situation propice à un apprentissage par observation . . Il est généralement admis , même si aucune mesure n' en est prise , que les seuils d' attention et de motivation sont suffisants pour que les sujets soient en situation propice à un apprentissage par observation . 2.2.2 . Les processus de rétention et de production sous-jacents à l' apprentissage par observation La présentation de ces processus de façon distincte est particulièrement difficile car l' influence du processus de rétention se manifeste tout particulièrement au travers du processus de production , et inversement . Le processus de rétention permet à l' individu de stocker en mémoire une représentation du comportement observé . Le processus de production conduit , à partir de la ré-activation de cette représentation , à la production effective du comportement que l' individu ajuste en fonction des modèles mémorisées . Le processus de rétention va permettre la mémorisation des indices pertinents pour la réalisation d' une tâche , sous forme de représentation symbolique : un schéma , un script ou une simple image mentale ( Adams , 1971 , 1987 ; Carroll & Bandura , 1987 ; Schmidt , 1975 ) . Cette mémorisation est sous-tendue par la capacité de symbolisation que possède l' individu . Cette capacité à utiliser les symboles est , selon Bandura ( 1989 ) , « un outil puissant [ que possède l' individu ] pour comprendre et gérer son environnement » , et le symbole est la base même des activités cognitives . La formation de symboles , sous forme d' images ou de mots , permet à l' individu de donner du sens et de la continuité à ses expériences . De plus , cette capacité à former des symboles rend possible le stockage d' informations en mémoire et leur utilisation . En manipulant les symboles issus de ses propres expériences ou des expériences vicariantes , l' individu est en mesure de comprendre les liens causaux entre comportements et conséquences et peut ainsi développer ses connaissances . Cette capacité est indispensable à la mémorisation et à la reproduction des comportements observés chez autrui . va permettre la mémorisation des indices pertinents pour la réalisation d' une tâche , sous forme de représentation symbolique : un schéma , un script ou une simple image mentale ( Adams , 1971 , 1987 ; Carroll Schmidt , 1975 ) . Cette mémorisation est sous-tendue par la capacité de symbolisation que possède l' individu . Cette capacité à utiliser les symboles est , selon Bandura ( 1989 ) , « un outil puissant [ que possède l' individu ] pour comprendre et gérer son environnement » , et le symbole est la base même des activités cognitives . La formation de symboles , sous forme d' images ou de mots , permet à l' individu de donner du sens et de la continuité à ses expériences . De plus , cette capacité à former des symboles rend possible le stockage d' informations en mémoire et leur utilisation . En manipulant les symboles issus de ses propres expériences ou des expériences vicariantes , l' individu est en mesure de comprendre les liens causaux entre comportements et conséquences et peut ainsi développer ses connaissances . Cette capacité est indispensable à la mémorisation et à la reproduction des comportements observés chez autrui . Selon Bandura , le processus de rétention , donc la mémorisation d' un comportement observé , implique une transformation des réponses comportementales observées en code symbolique . Ce codage est indispensable , et peut prendre la forme d' images , de mots descriptifs , de constructions linguistiques , mais dans tous les cas il représente de façon isomorphe les événements observés . Les études développementales tendent à soutenir que cette capacité apparaît très tôt dans le développement . Ainsi , Meltzoff ( 1988 ) a montré que suite à l' observation d' action simple sur des objets ( pousser , déplacer etc .. ) , des enfants de quatorze mois étaient capables de reproduire ces actions une semaine plus tard . Cela indique , que dès le plus jeune âge , les enfants sont capables de mémoriser de l' information et de l' utiliser ultérieurement . De la même façon , Abravanel et Fergusson ( 1998 ) ont mis en évidence un développement de la capacité à reproduire une séquence d' actions sérielles chez des jeunes enfants de 12 à 24 mois ( construire un pont ou une pyramide avec plusieurs éléments dans un ordre particulier ) . Selon certains auteurs , la capacité des jeunes enfants à reproduire des actions simples ou complexes indique , que la capacité de symbolisation apparaît tôt dans le développement et qu' elle est indispensable à l' apprentissage par observation ( Abravanel Horner , 2001 ; Meltzoff , 1988 ) . L' importance du codage symbolique des séquences observées chez l' adulte a été démontré dans le cadre de nombreuses recherches ( Bandura Carroll & Bandura , 1982 , 1985 , 1987 , 1990 ; Williams , 1987 ) . Berger , Carli , Hammersla , Kashmer et Sanchez ( 1979 ) ont montré que pour une tâche d' association de gestes de l' alphabet manuel , ce codage facilitait l' acquisition des séquences proposées par le modèle pour des observateurs familiers . En associant une lettre à chaque geste manuel observé , les sujets familiers étaient plus efficaces dans la reproduction de l' association de deux gestes de l' alphabet manuel . De plus , proposer aux sujets de coder sous forme verbale la séquence observée facilitait , quelles que soient leurs connaissances préalables , l' acquisition des gestes ( Gerst , 1971 ) . Les résultats obtenus par Bandura et Jeffery ( 1973 ) soutiennent l' hypothèse d' une facilitation de l' apprentissage par observation par le codage symbolique . Ces derniers ont montré qu' orienter les sujets sur un codage sous forme de lettres ou de chiffres améliorait de façon significative la reproduction immédiate et différée de la séquence observée en comparaison à ceux n' ayant pas eu d' instruction pour apprendre . L' aspect crucial du processus de rétention réside donc dans la capacité des individus à générer un code symbolique adéquat pour la mémorisation du comportement observé . Pour présenter plus précisément le Pour présenter plus précisément le processus de production tel que défini par Bandura ( 1986 ) , il convient d' identifier ce à quoi il correspond . Selon Bandura , ce processus permet la transformation de la représentation symbolique en son action effective . Si le processus de rétention explicité précédemment impliquait la transformation des comportements observés en code symbolique , le processus de production , à l' inverse , concerne la transformation du code en comportements effectifs . Comme nous avons déjà pu le constater dans les études précédentes , l' individu doit posséder des capacités physiques et cognitives suffisantes pour produire le comportement à imiter . Ensuite , il doit être capable d' organiser ses actions en fonction de ce qu' il a mémorisé tel que défini par Bandura ( 1986 ) , il convient d' identifier ce à quoi il correspond . Selon Bandura , ce processus permet la transformation de la représentation symbolique en son action effective . Si le processus de rétention explicité précédemment impliquait la transformation des comportements observés en code symbolique , le processus de production , à l' inverse , concerne la transformation du code en comportements effectifs . Comme nous avons déjà pu le constater dans les études précédentes , l' individu doit posséder des capacités physiques et cognitives suffisantes pour produire le comportement à imiter . Ensuite , il doit être capable d' organiser ses actions en fonction de ce qu' il a mémorisé et de les corriger si nécessaire . C' est à partir de cette production que la performance est évaluée en regard du comportement observé . L' individu reproduit le comportement observé en ré-activant la représentation qu' il en a construit et en contrôlant son propre comportement à partir de cette représentation . Ainsi , la représentation sert de guide à la production en proposant un standard de comparaison . Le comportement est en constante comparaison avec la représentation , et l' objectif de l' individu est d' obtenir une correspondance la plus parfaite possible entre cette représentation et son comportement . L' important ici est de noter que la même trace mnésique est utilisée pour stocker , produire et évaluer le comportement . La plupart des études sur le processus de production se sont intéressées au mécanisme de détection et de correction des erreurs ainsi qu' aux facteurs permettant d' en affecter l' efficacité . En comparaison , peu d' études ont envisagé spécifiquement la transformation de la représentation en comportement effectif au cours de l' apprentissage par observation ( Carroll & Bandura , 1987 ) . Ce point sera développé dans le cadre particulier de l' acquisition des habiletés motrices ( cf. paragraphe 2.3.2 . , p . 69 ) . de les corriger si nécessaire . C' est à partir de cette production que la performance est évaluée en regard du comportement observé . L' individu reproduit le comportement observé en ré-activant la représentation qu' il en a construit et en contrôlant son propre comportement à partir de cette représentation . Ainsi , la représentation sert de guide à la production en proposant un standard de comparaison . Le comportement est en constante comparaison avec la représentation , et l' objectif de l' individu est d' obtenir une correspondance la plus parfaite possible entre cette représentation et son comportement . L' important ici est de noter que la même trace mnésique est utilisée pour stocker , produire et évaluer le comportement . La plupart des études sur le processus de production se sont intéressées au mécanisme de détection et de correction des erreurs ainsi qu' aux facteurs permettant d' en affecter l' efficacité . En comparaison , peu d' études ont envisagé spécifiquement la transformation de la représentation en comportement effectif au cours de l' apprentissage par observation ( Carroll & Bandura , 1987 ) . Ce point sera développé dans le cadre particulier de l' acquisition des habiletés motrices ( cf. paragraphe 2.3.2 . , p . 69 ) . Parmi les facteurs influençant la détection et la correction des erreurs , le guidage visuel semble l' un des plus important . Qu' il soit fourni par la concomitance de la production du comportement par le modèle ou par la possibilité de s' auto observer , le guidage visuel propose une référence de comparaison incontestée ( Carroll Weeks & Hall , 1998 ) . Différentes études ont montré que donner à l' individu la possibilité de se voir en action lui permettait d' améliorer significativement sa performance ( Carroll & Bandura , 1982 , 1985 , 1987 ; Erbaugh , 1985 pour une illustration chez les enfants ) . Pour mettre en évidence l' influence de la concomitance de production du comportement entre le sujet observateur et le modèle , Carroll et Bandura ( 1987 ) ont comparé deux procédures d' apprentissage d' un mouvement de bras . La première procédure impliquait une phase d' observation suivie d' une phase de production réalisée en même temps que le modèle émettait le comportement . La seconde proposait une phase d' observation puis une phase de production sans concomitance de production par le modèle . Les résultats indiquaient que le bénéfice obtenu par la production simultanée n' intervenait pas lors des premiers essais de production mais seulement après une quantité suffisante d' observations . Cela indique que la comparaison entre le comportement reproduit et celui réalisé en même temps par le modèle n' est efficace que si les sujets ont déjà une représentation adéquate du comportement observé . De plus , le guidage visuel n' était utilisable à bon escient qu' à partir du moment où les sujets avaient construit une représentation fiable du comportement observé . Dans une autre étude , Carroll et Bandura ( 1982 ) ont étudié l' influence du guidage visuel en proposant à leurs participants d' observer une séquence de mouvement de bras puis de la reproduire . Pour le groupe de sujets autorisés à visionner leurs performances après chaque essai de production , la correspondance entre mouvement produit et mouvement observé était supérieure à celle obtenue pour des sujets n' ayant pas eu cette possibilité . Cependant , les résultats indiquaient que le guidage visuel n' était pas efficace lorsqu' il était donné pendant les premiers essais de production , mais qu' il facilitait pourtant l' apprentissage des essais ultérieurs . Cela proviendrait du fait que le sujet serait en mesure de détecter au cours du visionnage de sa performance des éléments incohérents et serait capable de les corriger aux essais suivants . Toutefois , cela ne prendrait place qu' à partir du moment où l' individu serait en mesure de produire avec un minimum d' efficacité la séquence motrice puisqu' il serait alors capable d' en identifier les incohérences . Il semble qu' observer un modèle agir en même temps que soi permette de comparer sa propre exécution à celle du modèle et ainsi évaluer la qualité de la production pour l' améliorer . De plus , se voir exécuter un comportement permettrait d' en détecter les incohérences par rapport à celui mémorisé , mais cette vision de soi ne serait efficace que si elle intervient en fin d' apprentissage ( donc si elle se fonde sur une représentation déjà cohérente du comportement mémorisé ) . Pour résumer cette partie , l' apprentissage par observation intervient dès lors qu' un individu bénéficie du comportement émis par autrui sans en faire l' expérience directe . Cela lui permet d' intégrer de nouvelles valeurs , normes et comportements , ou encore d' inhiber ceux qui ne sont pas adéquats . Les quatre processus sous-jacents à cet apprentissage , permettent à l' individu d' utiliser l' observation d' un comportement pour en extraire et mémoriser les informations . Une fois que la structure cognitive élaborée est suffisamment cohérente , il l' utilise pour produire des comportements équivalents pour atteindre des buts précis ou obtenir des récompenses obtenues par autrui dans les mêmes circonstances . 2.3 . Apprentissage par observation des habiletés motrices Nombre d' études sur l' apprentissage par observation ont pris pour application l' acquisition d' habiletés motrices . Ce type d' acquisition offre un panel d' observables important et les expérimentations peuvent être facilement mises en place . Afin de mieux cerner les processus spécifiques de rétention et de production que nous modéliserons ultérieurement , nous exposerons différents aspects de leur étude dans le cadre de l' acquisition des habiletés motrices . Le principe de ces études repose sur une méthodologie simple , consistant à faire observer aux sujets une séquence comportementale , puis leur proposer de reproduire ce même comportement . En exposant le principe des études , nous percevons clairement que faire observer une séquence induit la focalisation attentionnelle , et que demander aux participants de reproduire la séquence n' implique aucune autre motivation que celle de répondre à la demande expérimentale . Ce sont certes deux processus qui interviennent en situation sociale , cependant , ils ne feront pas l' objet de la présentation suivante qui se concentre sur des tâches réalisées en laboratoire . Avant d' entrer dans le détail des processus de rétention et de production , il convient de clarifier certains points , notamment en terme de langage et d' objet d' étude . Qu' est ce qu' une séquence comportementale ? Nous considérerons qu' une séquence comportementale correspond à une suite d' actions élémentaires dont la chronologie est spécifique à la séquence . Une séquence comportementale fait donc appel aux notions d' organisation spatiale et temporelle des actions ( Rizolatti , 2001 ) . Apprentissage par observation d' habileté motrice et apprentissage moteur . L' apprentissage moteur est un vaste champ d' étude dont les résultats ont été peu mis en relation avec l' apprentissage par observation de comportement moteur . Les théories les plus influentes de ce domaine sont la théorie de la boucle fermée ( Adams , 1971 , 1987 ) et la théorie du schéma moteur ( Schmidt , 1975 ) . Elles s' intéressent à l' apprentissage et au contrôle des réponses motrices . Brièvement , la théorie de la boucle fermée postule que l' apprenant mémorise deux types de traces : la trace mnésique et la trace perceptuelle . La trace mnésique est à l' origine des réponses motrices , c' est elle qui génère l' amorce de réponse . La trace perceptuelle sert de référence pour la correction des réponses par comparaison au L' apprentissage moteur est un vaste champ d' étude dont les résultats ont été peu mis en relation avec l' apprentissage par observation de comportement moteur . Les théories les plus influentes de ce domaine sont la théorie de la boucle fermée ( Adams , 1971 , 1987 ) et la théorie du schéma moteur ( Schmidt , 1975 ) . Elles s' intéressent à l' apprentissage et au contrôle des réponses motrices . Brièvement , la théorie de la boucle fermée postule que l' apprenant mémorise deux types de traces : la trace mnésique et la trace perceptuelle . La trace mnésique est à l' origine des réponses motrices , c' est elle qui génère l' amorce de réponse . La trace perceptuelle sert de référence pour la correction des réponses par comparaison au feedback reçu au cours de l' exécution motrice . L' ajustement du comportement essai après essai , se fonde sur la connaissance du résultat de l' action et sur l' erreur évaluée entre la trace perceptuelle et le reçu au cours de l' exécution motrice . L' ajustement du comportement essai après essai , se fonde sur la connaissance du résultat de l' action et sur l' erreur évaluée entre la trace perceptuelle et le feedback obtenu . Contrairement à Bandura ( 1986 ) indiquant que la même représentation sert à produire et à ajuster le comportement , Adams ( 1987 ) propose l' existence de deux traces mnésiques distinctes , la première génératrice de la réponse motrice la seconde évaluant l' exactitude de la réponse . obtenu . Contrairement à Bandura ( 1986 ) indiquant que la même représentation sert à produire et à ajuster le comportement , Adams ( 1987 ) propose l' existence de deux traces mnésiques distinctes , la première génératrice de la réponse motrice la seconde évaluant l' exactitude de la réponse . Dans la théorie du schéma moteur , Schmidt ( 1975 ) introduit la notion de programme moteur généralisé . Contrairement à Adams , il considère qu' un seul et même programme général contrôle toutes les séquences comportementales possédant les mêmes caractéristiques . Un même schéma général pourra donc être à l' origine de différents comportements moteurs et c' est à partir du paramétrage spécifique du schéma général ( groupe musculaire impliqué , temps de contraction , etc. ) que la réponse est adaptée aux contraintes spécifiques de la tâche . En outre , ce même auteur propose que l' individu paramètre ses réponses et les contrôle à partir des schémas de rappel et de reconnaissance . Ces schémas se développent progressivement par la mise en relation des informations concernant , les conditions initiales , l' objectif visé , les paramètres spécifiés préalablement dans des conditions similaires , les conséquences sensorielles antérieurement obtenues et le résultat de la réponse . Lorsque l' individu produit une réponse motrice , il commence par sélectionner le but désiré et évalue la relation entre cet objectif fixé et les conséquences sensorielles obtenues ( schéma de reconnaissance ) . Ensuite , il évalue la relation entre le but obtenu et les paramètres spécifiques de la réponse ( schéma de rappel ) ce qui lui permet , au fur et à mesure , des essais de générer la réponse la plus appropriée pour atteindre le but désiré . Ces schémas sont construits et développés à partir de la pratique et des Dans la théorie du schéma moteur , Schmidt ( 1975 ) introduit la notion de programme moteur généralisé . Contrairement à Adams , il considère qu' un seul et même programme général contrôle toutes les séquences comportementales possédant les mêmes caractéristiques . Un même schéma général pourra donc être à l' origine de différents comportements moteurs et c' est à partir du paramétrage spécifique du schéma général ( groupe musculaire impliqué , temps de contraction , etc. ) que la réponse est adaptée aux contraintes spécifiques de la tâche . En outre , ce même auteur propose que l' individu paramètre ses réponses et les contrôle à partir des schémas de rappel et de reconnaissance . Ces schémas se développent progressivement par la mise en relation des informations concernant , les conditions initiales , l' objectif visé , les paramètres spécifiés préalablement dans des conditions similaires , les conséquences sensorielles antérieurement obtenues et le résultat de la réponse . Lorsque l' individu produit une réponse motrice , il commence par sélectionner le but désiré et évalue la relation entre cet objectif fixé et les conséquences sensorielles obtenues ( schéma de reconnaissance ) . Ensuite , il évalue la relation entre le but obtenu et les paramètres spécifiques de la réponse ( schéma de rappel ) ce qui lui permet , au fur et à mesure , des essais de générer la réponse la plus appropriée pour atteindre le but désiré . Ces schémas sont construits et développés à partir de la pratique et des feedback reçus . Cela conduit l' individu à émettre des comportements d' autant plus adaptés qu' il aura pratiqué et adapté les réponses motrices et leurs conséquences sensorielles ( Shea , Lai , Wright , Immink & Black , 2001 ) . reçus . Cela conduit l' individu à émettre des comportements d' autant plus adaptés qu' il aura pratiqué et adapté les réponses motrices et leurs conséquences sensorielles ( Shea , Lai , Wright , Immink & Black , 2001 ) . Ces théories se distinguent des postulats de base de la théorie de l' apprentissage social , et en conséquence de l' apprentissage par observation , puisqu' elles supposent des mécanismes de production et de correction différenciés . Selon Blandin ( 2002 ) , le rapprochement de ces théories est possible si l' on considère que deux mécanismes distincts sont appris au cours de l' observation . Nombre d' études s' intéressent spécifiquement à cela , en regardant si les facteurs connus pour influencer l' apprentissage par pratique physique influence de la même façon l' apprentissage par observation ( pour revue cf. Blandin , 2002 ) . Il n' est pas rare de voir se mêler ces théories au cours des études sur l' acquisition d' habiletés motrices , du fait qu' elles se complètent mutuellement et nous nous efforcerons de ne pas passer de l' une à l' autre sans en faire mention . Types d' habiletés motrices apprises par observation Les habiletés motrices apprises par observation ont été étudiées à partir de tâches différentes , par exemple : les séquences motrices simples : Brass , Bekkering et Prinz , 2001 ; Gleissner et Meltzoff , 2000 ; Sturmer , Ascherslleben , et Prinz , 2000 ; Weeks et Hall , 1998 , les séquences motrices complexes : Capodi et Chatillon , 1995 ; Carroll et Bandura , 1982 à 1990 ; Vogt , 1995 , les tâches d' anticipation-coïncidence : Blandin , Proteau et Alain , 1993 ; Blandin , Lhuisset et Proteau , 1999 , les tâches d' équilibre : Shea , Wright , Wulf , et Whitacre , 2000 . Même si la tâche utilisée diverge , les processus sous-tendant l' apprentissage par observation sont identiques à ceux définis par Bandura ( 1986 ) , et les mêmes questions demeurent à l' origine des études . Nous présenterons quelques éléments de réponses aux questions sur le codage symbolique des séquences observées et les sources influençant l' évaluation du comportement produit pour son ajustement en évoquant chaque point pour l' acquisition d' habiletés motrices par observation . 2.3.1 . De la séquence comportementale observée à sa représentation La transformation d' un acte moteur perçu en sa représentation symbolique est un problème récurrent de l' étude des habiletés motrices . Selon Bandura ( 1986 ) , cette capacité est indispensable à l' apprentissage par observation et certains auteurs ont tenté d' en déterminer l' apparition au cours du développement . Notamment , Gleissner et Meltzoff ( 2000 ) ont mis en évidence la capacité de l' enfant en bas âge à imiter des gestes ( par exemple , déplacer la main vers l' oreille opposée ) . Selon ces auteurs , les enfants coderaient les actions observées sous forme de relations entre organes impliqués dans le mouvement ; c' est-à-dire en termes d' arrangement spatial . Plus spécifiquement , ce seraient les buts à atteindre qui seraient encodés symboliquement en mémoire et de là en découleraient les activités motrices nécessaires ( Bekkering , Wohlschlager & Gattis , 2000 ; Meltzoff & Moore , 1989 ) . La transformation d' un acte moteur perçu en sa représentation symbolique est un problème récurrent de l' étude des habiletés motrices . Selon Bandura ( 1986 ) , cette capacité est indispensable à l' apprentissage par observation et certains auteurs ont tenté d' en déterminer l' apparition au cours du développement . Notamment , Gleissner et Meltzoff ( 2000 ) ont mis en évidence la capacité de l' enfant en bas âge à imiter des gestes ( par exemple , déplacer la main vers l' oreille opposée ) . Selon ces auteurs , les enfants coderaient les actions observées sous forme de relations entre organes impliqués dans le mouvement ; c' est-à-dire en termes d' arrangement spatial . Plus spécifiquement , ce seraient les buts à atteindre qui seraient encodés symboliquement en mémoire et de là en découleraient les activités motrices nécessaires ( Bekkering , Wohlschlager & Gattis , 2000 ; Meltzoff & Moore , 1989 ) . Bekkering et al. ( 2000 ) et Gleissner et Meltzoff ( 2000 ) ont ainsi montré que le comportement moteur n' était pas simplement répliqué mais qu' il était tout d' abord décomposé en éléments constitutifs puis reconstruit . Ce processus de décomposition-reconstruction est guidé par une interprétation du programme moteur en termes de buts hiérarchisés ( voir aussi Weiss , Suckow & Rakestraw , 1999 ) . Ceci a été mis en évidence dans les expériences impliquant des séquences motrices ipsilatérales et controlatérales ( mouvement de la main droite vers la partie gauche du corps et inversement ) . La majorité des erreurs relevées concernait les mouvements controlatéraux , c' est-à-dire que les enfants touchaient par exemple la bonne oreille mais pas avec la bonne main . Cela implique bien une hiérarchisation des buts d' actions sous forme symbolique où le but premier correspond à l' objet physique devant être atteint ( l' oreille ) puis l' agent de l' action ( la main ) . Cette hypothèse trouve d' ailleurs un soutien par la réduction du nombre de buts à atteindre ( les objets d' actions ) qui implique une diminution des erreurs . L' imitation est donc dirigée en premier lieu par l' objet d' action , en second lieu par l' agent et enfin par le mouvement . Si la capacité de symbolisation doit être vue ici comme la capacité à générer des buts hiérarchiques chez l' enfant , ces études ne nous renseignent que peu sur le codage symbolique de l' action élémentaire . Nous allons voir à partir d' études réalisées chez l' adulte comment ce codage est supposé être mis en place . ( 2000 ) et Gleissner et Meltzoff ( 2000 ) ont ainsi montré que le comportement moteur n' était pas simplement répliqué mais qu' il était tout d' abord décomposé en éléments constitutifs puis reconstruit . Ce processus de décomposition-reconstruction est guidé par une interprétation du programme moteur en termes de buts hiérarchisés ( voir aussi Weiss , Suckow & Rakestraw , 1999 ) . Ceci a été mis en évidence dans les expériences impliquant des séquences motrices ipsilatérales et controlatérales ( mouvement de la main droite vers la partie gauche du corps et inversement ) . La majorité des erreurs relevées concernait les mouvements controlatéraux , c' est-à-dire que les enfants touchaient par exemple la bonne oreille mais pas avec la bonne main . Cela implique bien une hiérarchisation des buts d' actions sous forme symbolique où le but premier correspond à l' objet physique devant être atteint ( l' oreille ) puis l' agent de l' action ( la main ) . Cette hypothèse trouve d' ailleurs un soutien par la réduction du nombre de buts à atteindre ( les objets d' actions ) qui implique une diminution des erreurs . L' imitation est donc dirigée en premier lieu par l' objet d' action , en second lieu par l' agent et enfin par le mouvement . Si la capacité de symbolisation doit être vue ici comme la capacité à générer des buts hiérarchiques chez l' enfant , ces études ne nous renseignent que peu sur le codage symbolique de l' action élémentaire . Nous allons voir à partir d' études réalisées chez l' adulte comment ce codage est supposé être mis en place . Comment l' action élémentaire est -elle codée ? Les résultats relevés dans la littérature soutiennent que le codage symbolique favorise la rétention d' un nouveau comportement et que la représentation élaborée lors de l' observation sert de guide à l' action . Par exemple , Bandura et Jeffery ( 1973 ) ont montré que le codage sous forme de lettres ou de chiffres facilite l' apprentissage d' un mouvement de bras . Dans cette étude , les sujets étaient invités à observer un mouvement de bras représentant une suite d' actions et à utiliser un codage sous forme de lettres ou de chiffres pour le mémoriser . Le groupe contrôle réalisait le même apprentissage sans instruction sur le type de codage à utiliser . Au cours de la phase d' observation , les sujets associaient à chaque action élémentaire une lettre ou un chiffre et mémorisaient cet ensemble . Lorsqu' ils reproduisaient le mouvement , les auteurs considéraient qu' ils activaient en mémoire la représentation symbolique du mouvement codé sous forme de séquence de lettres ou de chiffres pour guider leurs propres actions . Les résultats indiquaient que les individus qui codaient les actions élémentaires composant le mouvement sous forme de séquence de lettres ou de chiffres mémorisaient plus facilement les composants du mouvement que sans médiatisation par un tel codage . De plus , ils ont montré que la mémorisation du mouvement était facilitée lorsque la séquence de lettres représentait un mot . Par ailleurs , Corriss et Kose ( 1998 ) ont montré que la médiatisation du codage par imagerie mentale avait une influence bénéfique sur l' apprentissage par observation . Les sujets autorisés à imaginer une configuration de cubes observée présentaient des performances supérieures en terme de reconstitution d' assemblage de cubes en comparaison à ceux n' étant pas autorisés à le faire . La médiatisation de l' apprentissage par une phase d' imagination stabiliserait la représentation construite au cours de l' observation en permettant aux sujets de transformer la configuration observée en une image plus élaborée . Il semble que le comportement observé est donc transformé en une représentation symbolique ( soit directement soit par imagination préalable ) , et son maintien est réalisé par répétition symbolique . Cependant , selon Berger Les résultats relevés dans la littérature soutiennent que le codage symbolique favorise la rétention d' un nouveau comportement et que la représentation élaborée lors de l' observation sert de guide à l' action . Par exemple , Bandura et Jeffery ( 1973 ) ont montré que le codage sous forme de lettres ou de chiffres facilite l' apprentissage d' un mouvement de bras . Dans cette étude , les sujets étaient invités à observer un mouvement de bras représentant une suite d' actions et à utiliser un codage sous forme de lettres ou de chiffres pour le mémoriser . Le groupe contrôle réalisait le même apprentissage sans instruction sur le type de codage à utiliser . Au cours de la phase d' observation , les sujets associaient à chaque action élémentaire une lettre ou un chiffre et mémorisaient cet ensemble . Lorsqu' ils reproduisaient le mouvement , les auteurs considéraient qu' ils activaient en mémoire la représentation symbolique du mouvement codé sous forme de séquence de lettres ou de chiffres pour guider leurs propres actions . Les résultats indiquaient que les individus qui codaient les actions élémentaires composant le mouvement sous forme de séquence de lettres ou de chiffres mémorisaient plus facilement les composants du mouvement que sans médiatisation par un tel codage . De plus , ils ont montré que la mémorisation du mouvement était facilitée lorsque la séquence de lettres représentait un mot . Par ailleurs , Corriss et Kose ( 1998 ) ont montré que la médiatisation du codage par imagerie mentale avait une influence bénéfique sur l' apprentissage par observation . Les sujets autorisés à imaginer une configuration de cubes observée présentaient des performances supérieures en terme de reconstitution d' assemblage de cubes en comparaison à ceux n' étant pas autorisés à le faire . La médiatisation de l' apprentissage par une phase d' imagination stabiliserait la représentation construite au cours de l' observation en permettant aux sujets de transformer la configuration observée en une image plus élaborée . Il semble que le comportement observé est donc transformé en une représentation symbolique ( soit directement soit par imagination préalable ) , et son maintien est réalisé par répétition symbolique . Cependant , selon Berger et al. ( 1979 ) , l' individu ne peut coder symboliquement que des séquences pour lesquelles il dispose de connaissances préalables . Ces auteurs ont montré que des sujets non familiers de l' alphabet manuel ne pouvaient pas coder symboliquement ( sous forme de lettres , expérience 1 ou de mots expérience 2 ) des gestes représentant des associations de lettres . Ces auteurs ont proposé que la médiatisation de l' apprentissage était alors préférentiellement réalisée par mimétisme . En autorisant les sujets à reproduire les gestes observés en même temps que le modèle les réalisait , ces auteurs ont montré que les sujets non familiers de l' alphabet manuel obtenaient des performances équivalentes à celles des sujets familiers ( voir aussi Williams , 1987 ) . Il semble que le codage symbolique ne peut intervenir que si l' individu possède des ressources élémentaires adaptables à l' activité observée ou qu' il se crée ces ressources en médiatisant l' apprentissage par une phase de mimétisme , de pratique mentale ( Romero & Silvestri , 1990 ) ou encore d' imagination . Mais sommes -nous toujours dans le cadre d' un apprentissage par observation tel que défini par Bandura ? Si nous nous limitons strictement aux conditions d' émergence de l' apprentissage par observation , l' individu observateur ne doit pas être en mouvement lorsqu' il observe le modèle . Une phase d' imagination ou de pratique mentale ne semble pas aller à l' encontre de ce présupposé . Cependant , l' idée d' une médiatisation de l' apprentissage par une phase de mimétisme ne relève plus du cadre de l' apprentissage par observation puisque le mimétisme implique une pratique de l' observateur en même temps que le modèle . Selon Berger ( 1979 ) , l' individu ne peut coder symboliquement que des séquences pour lesquelles il dispose de connaissances préalables . Ces auteurs ont montré que des sujets non familiers de l' alphabet manuel ne pouvaient pas coder symboliquement ( sous forme de lettres , expérience 1 ou de mots expérience 2 ) des gestes représentant des associations de lettres . Ces auteurs ont proposé que la médiatisation de l' apprentissage était alors préférentiellement réalisée par mimétisme . En autorisant les sujets à reproduire les gestes observés en même temps que le modèle les réalisait , ces auteurs ont montré que les sujets non familiers de l' alphabet manuel obtenaient des performances équivalentes à celles des sujets familiers ( voir aussi Williams , 1987 ) . Il semble que le codage symbolique ne peut intervenir que si l' individu possède des ressources élémentaires adaptables à l' activité observée ou qu' il se crée ces ressources en médiatisant l' apprentissage par une phase de mimétisme , de pratique mentale ( Romero & Silvestri , 1990 ) ou encore d' imagination . Mais sommes -nous toujours dans le cadre d' un apprentissage par observation tel que défini par Bandura ? Si nous nous limitons strictement aux conditions d' émergence de l' apprentissage par observation , l' individu observateur ne doit pas être en mouvement lorsqu' il observe le modèle . Une phase d' imagination ou de pratique mentale ne semble pas aller à l' encontre de ce présupposé . Cependant , l' idée d' une médiatisation de l' apprentissage par une phase de mimétisme ne relève plus du cadre de l' apprentissage par observation puisque le mimétisme implique une pratique de l' observateur en même temps que le modèle . Selon Berger et al. ( 1979 ) , le mimétisme remplace le codage symbolique en permettant au sujet de créer une structure cognitive adéquate de l' activité observée sans connaissance préalable sur celle -ci . Si ces auteurs n' avancent aucune hypothèse sur le format de cette structure cognitive adaptée , il n' en demeure pas moins que les autres études , répondant aux contraintes d' émergence de l' apprentissage par observation , indiquent un effet facilitateur du codage symbolique . Cependant , il nous semble intéressant de nous pencher un peu plus sur les symboles associés aux actions . ( 1979 ) , le mimétisme remplace le codage symbolique en permettant au sujet de créer une structure cognitive adéquate de l' activité observée sans connaissance préalable sur celle -ci . Si ces auteurs n' avancent aucune hypothèse sur le format de cette structure cognitive adaptée , il n' en demeure pas moins que les autres études , répondant aux contraintes d' émergence de l' apprentissage par observation , indiquent un effet facilitateur du codage symbolique . Cependant , il nous semble intéressant de nous pencher un peu plus sur les symboles associés aux actions . Si nous regardons de plus près les expériences précédentes , il apparaît que le codage symbolique supposé correspond plutôt à « un moyen mnémotechnique » de mémoriser la séquence observée . Les auteurs proposent aux sujets d' associer un symbole ( lettre , mot , chiffre , image ) à une action , dès lors ce qui est mémorisé ne correspond pas directement aux actions mais à l' association du symbole avec l' action . L' individu possédant dans son répertoire comportemental l' ensemble des actions élémentaires nécessaires à la génération des gestes , il lui faut alors mémoriser l' association code-action et la structure temporelle du code . Cela semble coûteux du point de vue de la charge cognitive , puisqu' il faut d' abord apprendre l' association du code puis la séquence codée . Cependant , les résultats indiquent que c' est un moyen efficace de retenir les caractéristiques temporelles de la séquence ( l' ordre des actions suit l' ordre des symboles retenus ) . Par exemple , un sujet peut mémoriser une séquence de mouvements proposant un positionnement du bras tendu le long du corps , perpendiculairement à l' axe pied-tête , et tendu au-dessus de la tête en associant une lettre A , B et C pour chaque position du bras . Ensuite , il peut reproduire n' importe quelle séquence incluant ces symboles . Ainsi , il peut reproduire les positions de bras correspondant à la séquence A-B-C-C-B-A proposé par un modèle . Même si ce codage est efficace il ne semble pas vraiment prendre en compte le codage symbolique de l' action en elle-même . Cette ambiguïté peut être partiellement levée par l' un des tests utilisés dans une série d' études réalisées par Carroll et Bandura ( 1982 , 1985 , 1987 , 1990 ) . Les sujets observaient plusieurs fois une séquence comportementale comportant neuf déplacements de bras . Chaque position particulière du bras était considérée comme un geste . Il leur était ensuite demandé de reproduire la séquence observée . Avant la reproduction , les auteurs proposaient aux sujets un test de reconnaissance de photos présentant les gestes observés . Les sujets devaient indiquer quelles étaient les photos présentant des gestes vus et les classer selon l' ordre chronologique de la séquence observée . Selon ces auteurs , si les sujets reconnaissent et rangent correctement les photos , alors cela signifie qu' ils disposent d' une représentation symbolique intégrant les caractéristiques spatiales et temporelles de la séquence comportementale observée . Leur objectif par ce test n' était pas de confirmer la construction d' une représentation symbolique : cela est un fait avéré pour eux , si bien que les résultats n' ont pas été interprétés en ce sens . Ce test était utilisé pour comparer la performance obtenue en production et la qualité de la représentation élaborée . Nous pouvons cependant retenir , qu' à partir du moment où les gestes ont été reconnus au cours de ce test de reconnaissance , alors c' est qu' ils ont été codés symboliquement en mémoire . D' après ce que nous venons d' exposer , les individus sont capables d' apprendre de nouvelles configurations de gestes élémentaires en médiatisant la mémorisation par un codage symbolique . Dans une série d' études , Carroll et Bandura ( 1982 , 1985 , 1987 et 1990 ) mettent en évidence la capacité des individus à reproduire des gestes dont ils ne sont pas familiers . Carroll et Bandura Dans une série d' études , Carroll et Bandura ( 1982 , 1985 , 1987 et 1990 ) mettent en évidence la capacité des individus à reproduire des gestes dont ils ne sont pas familiers . Carroll et Bandura ( 1982 ) ont montré que la capacité des individus à détecter des erreurs , entre la représentation cognitive [ 7 ] construite à mesure de l' observation et les actions produites par le modèle , pouvait supplanter le mimétisme et améliorer la qualité de la représentation . De plus , ils ont relevé que la performance dépendait de la qualité de la représentation construite en phase d' observation et que l' apprentissage par observation nécessitait dans un premier temps l' organisation cognitive de la représentation . Néanmoins , pour que cette organisation cognitive soit efficace il n' était pas nécessaire que l' individu évalue son propre comportement soit en se voyant lui-même , soit en observant autrui réaliser le même comportement en même temps . Carroll et Bandura ont proposé aux sujets de visionner leur performance ( guidage visuel ) en reproduction suite à l' observation de plusieurs blocs de démonstrations . Ils ont ainsi relevé que les sujets n' ayant pas la possibilité de s' auto évaluer lors de la première reproduction ne présentaient pas de différence de performance par rapport à ceux soumis au guidage visuel . De plus , l' influence de l' auto évaluation lors du guidage visuel ne se manifestait que dans le cadre de séquences complexes ou lorsque le guidage visuel était présenté tardivement dans l' apprentissage . Ils ont ainsi montré qu' en l' absence de guidage visuel sur leur propre performance en début d' apprentissage , les sujets développaient , au cours des essais suivants , une représentation cognitive correcte de la séquence observée avec la répétition de l' observation ( résultats répliqués en 1985 , 1990 ) . En évaluant la corrélation entre la performance obtenue au test de reconnaissance et la performance en reproduction , Carroll et Bandura ( 1985 ) ont confirmé que plus la représentation cognitive était correcte plus la performance était élevée . construite à mesure de l' observation et les actions produites par le modèle , pouvait supplanter le mimétisme et améliorer la qualité de la représentation . De plus , ils ont relevé que la performance dépendait de la qualité de la représentation construite en phase d' observation et que l' apprentissage par observation nécessitait dans un premier temps l' organisation cognitive de la représentation . Néanmoins , pour que cette organisation cognitive soit efficace il n' était pas nécessaire que l' individu évalue son propre comportement soit en se voyant lui-même , soit en observant autrui réaliser le même comportement en même temps . Carroll et Bandura ont proposé aux sujets de visionner leur performance ( guidage visuel ) en reproduction suite à l' observation de plusieurs blocs de démonstrations . Ils ont ainsi relevé que les sujets n' ayant pas la possibilité de s' auto évaluer lors de la première reproduction ne présentaient pas de différence de performance par rapport à ceux soumis au guidage visuel . De plus , l' influence de l' auto évaluation lors du guidage visuel ne se manifestait que dans le cadre de séquences complexes ou lorsque le guidage visuel était présenté tardivement dans l' apprentissage . Ils ont ainsi montré qu' en l' absence de guidage visuel sur leur propre performance en début d' apprentissage , les sujets développaient , au cours des essais suivants , une représentation cognitive correcte de la séquence observée avec la répétition de l' observation ( résultats répliqués en 1985 , 1990 ) . En évaluant la corrélation entre la performance obtenue au test de reconnaissance et la performance en reproduction , Carroll et Bandura ( 1985 ) ont confirmé que plus la représentation cognitive était correcte plus la performance était élevée . Lorsque l' individu est soumis à l' observation d' une démonstration d' une séquence d' actions , il génère une représentation cognitive de façon évolutive . Au cours des premières observations , la représentation symbolique élaborée est imparfaite . Elle intègre les caractéristiques les plus saillantes des actions du modèle en code symbolique . Selon Decker ( 1982 ) , ce codage résulte de l' organisation et de la réduction de la séquence observée en symboles verbaux . L' organisation cognitive traduit l' utilisation de symboles préexistants dans le répertoire de l' observateur pour former un nouveau codage des séquences observées . A mesure des observations successives , la représentation cognitive s' organise , se structure , et l' individu vérifie qu' elle reflète correctement les démonstrations ultérieures , si ce n' est pas le cas il ajuste les aspects problématiques ( Carroll & Bandura , 1990 ) . Cela peut être amélioré par la répétition symbolique consistant à s' imaginer être en train de produire la séquence observée ( Bandura , 1977 ) . Si les partisans de l' apprentissage moteur supposent deux mécanismes distincts de mémorisation et de planification de l' action , les résultats précédents soutiennent l' idée qu' une seule et même trace est à l' origine des deux aspects , puisque c' est avec l' amélioration de la qualité de la représentation que la qualité de reproduction augmente . Les études physiologiques et les avancées en imagerie cérébrale apportent quelques éléments complémentaires corroborant l' idée d' une seule trace en mémoire . Les premiers travaux réalisés chez le singe ont mis en évidence l' existence de groupes neuronaux ( dans le cortex pré-moteur ) s' activant de façon équivalente lorsque le singe produit une action ou qu' il observe cette action réalisée par autrui ( Gallese , Fagida , Fogassi & Rizzolatti , 1996 , et 2002 ) . Ces neurones , dits « miroirs » , constitueraient une base physiologique de l' existence d' une représentation commune pour l' exécution des actions et leurs reconnaissances chez autrui . Chez l' être humain , des travaux équivalents ont montré l' existence de ces mêmes structures : certaines zones du cortex s' activent de la même façon lorsque l' individu réalise une simulation mentale d' une séquence comportementale et lorsqu' il l' observe chez autrui ( Rizzolatti , Fogassi & Gallese , 2001 ) . De plus , selon Iacobini et Woods ( 1999 ) , il existerait un processus de correspondance directe entre les actions perçues et leur représentation cognitive ( cf. Grèzes & Decety , 2001 pour une revue ) . Ainsi , lorsque l' individu observe une séquence motrice afin de la reproduire ultérieurement , ce sont les mêmes zones corticales qui sont activées que celles impliquées dans la planification et la génération de ses propres actions . Il y aurait donc un codage commun de ses propres actions et de celles des autres puisque les mêmes zones corticales interviennent . Cependant , selon l' objectif de l' observation ( comprendre ou imiter ) différentes zones corticales peuvent intervenir . Nous avons vu que lors de l' observation d' un comportement dans un but d' imitation les mêmes zones corticales sont activées pendant l' observation et la production de ce comportement . Au contraire , lorsque l' individu observe afin de comprendre les actions d' autrui ce ne sont pas les mêmes zones corticales qui sont impliquées . En effet , seules les structures d' encodage et de mémorisation sont activées lors de l' observation dans un but de compréhension ( Decety , Grezes , Costes , Perani , Jeannerod , Procyk , Grassi & Fazio , 1997 ) . Nous pouvons donc relever que la consigne donnée aux sujets lors de l' observation joue un rôle important dans l' apprentissage par observation . Bien que d' autres zones corticales soient activées au cours de l' observation , elles peuvent être envisagées comme participant au décodage et à l' intégration des informations visuelles et motrices . Ces informations seront ensuite transmises aux régions exécutives pour générer le comportement ( Decety , Chaminade , Grèzes & Meltzoff , 2002 ) . En ce sens , le fait d' observer pour imiter une séquence motrice engendrerait la transformation des actions perçues en une représentation cognitive unique ( représentation interne motrice de l' action , Iacobini & Woods , 1999 ) pour la mémorisation et la planification motrice . Cette approche neurologique de l' intégration et la planification des actions motrices , tend à soutenir l' hypothèse de Bandura ( 1986 ) quant à l' existence d' une seule représentation intégrant le codage des actions perçues , leur planification et leur programmation . Si ces études permettent d' envisager une seule représentation responsable de la mémorisation et de la programmation des séquences motrices , il n' en demeure pas moins qu' elles renseignent peu sur la façon dont elle est utilisée au cours de la pratique physique . 2.3.2 . De la représentation à la séquence comportementale ajustée La phase de production , permet à l' individu d' exécuter les comportements mémorisés et de les adapter . Cette adaptation résulte de l' utilisation de différentes formes de guidages : le guidage par la représentation , par la pratique physique et par guidage visuel . Guidage par la représentation Le guidage de la production par la représentation , ce processus a fait l' objet d' études permettant d' en évaluer les conséquences . Selon Bandura ( 1986 ) , un processus de Le guidage de la production par la représentation , ce processus a fait l' objet d' études permettant d' en évaluer les conséquences . Selon Bandura ( 1986 ) , un processus de conception-matching [ 8 ] gouverne la transformation de la représentation en action . Ce processus permet la production effective du comportement mais implique aussi l' ajustement du comportement à la représentation : le comportement produit est constamment comparé à la représentation mémorisée et l' individu cherche à maximiser la similarité entre ses actions et celles mémorisées . En ce sens , la représentation sert de guide d' ajustement de la réponse motrice . Il est convenu de dire que la qualité de la représentation construite influe sur la performance , dans le sens d' une amélioration de la production lorsque la représentation symbolique est développée en adéquation avec la séquence observée . Ainsi , Carroll et Bandura ( 1985 ) ont gouverne la transformation de la représentation en action . Ce processus permet la production effective du comportement mais implique aussi l' ajustement du comportement à la représentation : le comportement produit est constamment comparé à la représentation mémorisée et l' individu cherche à maximiser la similarité entre ses actions et celles mémorisées . En ce sens , la représentation sert de guide d' ajustement de la réponse motrice . Il est convenu de dire que la qualité de la représentation construite influe sur la performance , dans le sens d' une amélioration de la production lorsque la représentation symbolique est développée en adéquation avec la séquence observée . Ainsi , Carroll et Bandura ( 1985 ) ont montré que la performance est corrélée avec la qualité de la représentation cognitive que l' individu a construite au cours de l' observation ( qualité dépendant de l' opportunité offerte au sujet d' observer la séquence comportementale ) . Néanmoins , peu d' études s' intéressent strictement à l' influence de la quantité d' observations sur la qualité de la représentation . Carroll et Bandura ( 1990 ) ont montré que plus le nombre d' essais d' observations augmentait plus la performance était bonne . Dans leur étude , les sujets observaient un mouvement de bras soit deux fois , soit huit fois et devaient ensuite le reproduire . Les sujets observant deux fois la démonstration obtenaient des performances en reproduction du geste plus faibles que ceux autorisés à l' observer huit fois . De plus , après huit observations les sujets étaient plus à même de reconnaître les gestes observés en test de reconnaissance . Selon ces auteurs , l' individu développe une représentation cognitive d' autant plus adéquate que le nombre d' observations est important , si bien que la performance en est améliorée . Capodi et Chatillon ( 1995 ) ont complété ce résultat par une étude auprès d' enfants de huit et onze ans . Ils ont montré que le nombre d' observations nécessaires à l' acquisition d' un mouvement de danse différaient pour les deux groupes : il fallait moins d' observations pour les enfants plus âgés . Cela implique qu' au cours du développement la capacité à générer une représentation correcte en cours d' observation se met en place . Selon ces auteurs , la qualité de la représentation est plus élevée pour les enfants de onze ans , toutefois la forme de la séquence produite est équivalente pour les deux groupes . De la même façon , Feltz ( 1982 ) a mis en évidence que le nombre d' observations n' induisait pas de différence de performance mais une différence de qualité de la reproduction chez les enfants pour une tâche de stabilomètre ( maintien d' une planche en position horizontale avec la pression des pieds ) . Bien que l' influence de la qualité de la représentation soit souvent évaluée par un indice de réussite à la tâche , elle peut aussi apparaître dans la qualité de l' exécution des mouvements . D' après ces études , la reproduction de la séquence motrice est guidée par la représentation et de la qualité de la représentation dépend la qualité de reproduction . Le processus de D' après ces études , la reproduction de la séquence motrice est guidée par la représentation et de la qualité de la représentation dépend la qualité de reproduction . Le processus de conception-matching proposé par Bandura explique ce phénomène . Pour produire la séquence comportementale , l' individu active la représentation et compare au fur et à mesure son comportement à cette dernière . A partir de cette comparaison il ajuste ses actions afin d' obtenir une similarité maximale entre représentation et comportement . Cela se traduit par la qualité de la séquence produite mais pas forcément par la réussite . Si l' observation conduit à l' élaboration d' une représentation dont la qualité dépend du nombre de fois où la démonstration a été vue , d' autres facteurs tels que le guidage visuel et par pratique physique conduisent aussi à l' amélioration de la performance . proposé par Bandura explique ce phénomène . Pour produire la séquence comportementale , l' individu active la représentation et compare au fur et à mesure son comportement à cette dernière . A partir de cette comparaison il ajuste ses actions afin d' obtenir une similarité maximale entre représentation et comportement . Cela se traduit par la qualité de la séquence produite mais pas forcément par la réussite . Si l' observation conduit à l' élaboration d' une représentation dont la qualité dépend du nombre de fois où la démonstration a été vue , d' autres facteurs tels que le guidage visuel et par pratique physique conduisent aussi à l' amélioration de la performance . Guidage visuel et guidage par pratique physique Nombre d' auteurs ont montré que proposer en cours d' apprentissage un guidage visuel permet une amélioration de la performance . Par guidage visuel , nous entendons la possibilité donnée à l' individu de se voir en action . Ce guidage visuel ne correspond en aucun cas à la connaissance du résultat consistant à fournir à l' observateur une information sur l' erreur produite de façon externe ( Adams , 1986 ) . Dans le cas du guidage visuel , il s' agit pour l' individu de détecter par lui-même des différences entre son comportement , qu' il visionne et ce dont il se souvient ( Carroll & Bandura , 1982 ) . Cette auto évaluation permet à l' individu de voir ( sur écran ) sa propre production et d' en identifier les erreurs , mais cela nécessite que la représentation élaborée soit déjà relativement adéquate ( Carroll & Bandura , 1982 ) . Carroll et Bandura ( 1982 , 1985 ) ont ainsi relevé que l' influence de l' auto évaluation lors du guidage visuel ne se manifestait que si le guidage visuel était présenté tardivement dans l' apprentissage . En effet , en l' absence de guidage visuel sur leur propre performance en début d' apprentissage , les individus ayant développé une représentation cognitive correcte de la séquence observée ne présentaient pas de différence de performance par rapport à ceux soumis au guidage visuel . Néanmoins , l' adjonction du guidage visuel en fin d' apprentissage améliore la performance . Ainsi , avec l' adaptation progressive de la représentation cognitive du comportement observé , l' observateur est à même de reproduire de façon performante ce qu' il a observé et de modifier par la reproduction la structure de sa représentation cognitive . Erbaugh ( 1985 ) a étendu l' influence du guidage visuel chez les enfants , en proposant une tâche de stabilomètre . Les résultats indiquaient que les enfants ne bénéficiaient pas du guidage visuel si celui -ci intervenait suite aux premiers essais d' apprentissage par observation . Cependant , les enfants étaient à même d' utiliser l' auto observation comme source d' amélioration de la performance lorsque le guidage visuel était proposé plus tardivement dans l' apprentissage . La pratique physique semble elle aussi intervenir de façon significative dans la détection et la correction des erreurs . Afin d' en déterminer l' influence , les études relatives à ce point s' attachent à déterminer si l' inclusion d' essai de pratique altère ou améliore l' apprentissage ( Pollock & Lee , 1992 ; Shea , Wright , Wulf et Whitacre ( 2000 ) ont utilisé une tâche de jeu vidéo , consistant à maintenir un curseur sur une ligne en pressant les touches du clavier . Les sujets réalisaient la tâche soit seul , soit en pratiquant plusieurs essais , soit en pratiquant la tâche après avoir observé un autre sujet la réaliser . Les résultats indiquaient qu' en alternant la pratique physique à l' observation , l' opportunité de calibrer son comportement était donnée au sujet de la même façon que s' il n' avait fait que pratiquer la tâche . De même , Weeks et Anderson ( 2000 ) ont montré que la démonstration d' une séquence motrice ( service au volley-ball ) proposée en début d' apprentissage , intercalée avec la pratique , permettait une amélioration des performances par rapport à ceux observant toutes les démonstrations puis pratiquant . Cela soutiendrait l' hypothèse que la combinaison de l' observation et de la pratique permettrait au sujet de détecter par essai-erreur les anomalies , et de corriger , aux essais suivants , la non-correspondance des gestes avec la représentation à laquelle ils sont comparés ( voir aussi Weeks & Hall , 1998 , pour une tâche de geste manuel ) . Par ailleurs , Deakin et Proteau ( 1998 ) ont mis en évidence , pour une tâche de complétion de puzzle , qu' une phase de pratique était indispensable pour que les sujets soient en mesure d' utiliser correctement la représentation mémorisée . Selon ces auteurs , la représentation cognitive construite au cours de l' observation est « dormante » . Elle est rendue fonctionnelle , c' est-à-dire utilisable efficacement , si l' individu est amené à pratiquer le comportement correspondant suffisamment de fois . Cependant , nous noterons que dans leur étude , les phases de production sont intercalées avec les phases d' observation . Il semble difficile dès lors d' attribuer l' efficacité de la représentation en terme fonctionnel à une question unique de pratique . Comment déterminer si la performance est influencée par la pratique ou si elle est influencée par l' observation puisque les deux ne sont pas évaluées de façon dissociée ? Un premier élément de complément est apporté par l' étude de Carroll et Bandura ( 1990 ) qui proposaient que plus l' individu voyait la démonstration plus la représentation construite était adéquate , et que de là dépendait la performance . Néanmoins , il semble que des études complémentaires sont indispensables pour déterminer si la fonctionnalité de la représentation dépend d' une quantité d' observations ou d' une quantité de pratiques . Nous proposerons une illustration du test de cette hypothèse dans la suite du document . En tout état de cause , il est généralement admis que la pratique physique résulte en un développement des informations afférentes dans le contrôle du mouvement si bien que leur prise en compte améliore l' exécution ( Soucy & Proteau , 2001 ) . Cependant , nombre d' études ( Guadagnoli & Khol , 2001 ; Blandin Blandin , Lhuisset Blandin , Proteau McCullagh & Little , 1990 ) envisagent le mécanisme de détection et de correction en relation avec les notions de connaissance du résultat défini par Adams ( 1975 ) . Ainsi , la construction d' une représentation symbolique facilite l' acquisition d' un nouveau comportement par observation . Cependant , la représentation cognitive de la tâche construite au cours de l' observation demeure « dormante » ou non fonctionnelle en l' absence de pratique ( Deakin & Proteau , 2000 ) . La phase de production permet de rendre cette représentation fonctionnelle en l' activant en mémoire de travail et en la comparant aux comportements produits . L' évaluation de la similitude entre ce qui est produit et la trace mnésique rappelée permet l' ajustement des actions si nécessaire . Lorsque les actions produites diffèrent de celles mémorisées , l' individu corrige son comportement ( Schmidt , 1975 ) , et ce , d' autant plus qu' il ne lui permet pas d' atteindre le but recherché ( Adams , 1971 ; Bandura , 1986 ; Goldstone , 1998 ) . De plus , la pratique physique permet à l' individu d' accéder à d' autres informations ( telles que proprioceptives ) qu' il intègre à la représentation . Par cette intégration , l' individu améliore sa performance . Conclusion du chapitre 2 L' apprentissage par observation met en jeu des processus cognitifs permettant l' élaboration d' une représentation symbolique des comportements observés , et son utilisation en tant que guide à l' action ultérieure . Si les auteurs s' accordent sur l' importance de la fiabilité de la représentation construite , peu d' éléments nous semblent soutenir que la transformation des actions perçues en symbole soit le seul moyen de parvenir à un apprentissage efficient . N' y aurait -il pas un autre moyen de coder les informations motrices ? Nous proposerons dans la deuxième partie de ce document d' envisager que l' apprentissage par observation peut intervenir sans représentation symbolique . Par ailleurs , nombre d' études indiquent que différentes formes de guidage permettent à l' individu d' améliorer l' exécution de ses actions , notamment le guidage par la représentation et la pratique physique . Peu d' études , cependant , nous permettent de dissocier les effets facilitateurs de la phase d' acquisition de ceux liés à la phase de production . Il nous semble particulièrement intéressant d' aller plus loin sur ce point en testant de façon systématique , les effets de chaque phase . PROBLEMATIQUE La psychologie sociale voit depuis une dizaine d' années un développement important des recherches sur le formalisme connexioniste . Ce formalisme traduit le traitement en parallèle de l' information , dans une structure artificielle d' unités et de connexions . Par référence à l' inspiration neurologique dont ils sont issus , les modèles connexionistes , ou en réseaux de neurones artificiels , consistent en un ensemble d' unités élémentaires possédant un niveau d' activation ( représentant l' information en cours de traitement ) . Ces unités sont interconnectées et la propagation de leurs activations induit l' accomplissement des tâches cognitives . Suite à une phase d' apprentissage résultant en la construction d' une représentation adaptée à la résolution de la tâche , les informations présentées en entrée du réseau de neurones propagent leur activation le long des poids de connexions pour produire une réponse en sortie . Cette réponse est adaptée , en ce sens qu' elle correspond effectivement à une réponse correcte ( McClelland & Rhumelhart , 1986 ) . Nous avons identifié que l' intérêt des chercheurs en psychologie sociale porte en particulier sur les propriétés inhérentes au traitement parallèle des informations et à leurs stockages sous forme de Nous avons identifié que l' intérêt des chercheurs en psychologie sociale porte en particulier sur les propriétés inhérentes au traitement parallèle des informations et à leurs stockages sous forme de patterns d' activation . Que ce soit l' émergence , la capacité d' apprentissage ou encore la plausibilité neurologique , ces propriétés permettent d' envisager l' intégration d' une série d' exemplaires ( des connaissances , des situations etc. ) sous forme de représentations distribuées ou localistes , accessibles et utilisables à partir de la présentation de stimuli connus ou non , complets ou non ( Smith , 1996 ; Kashima van Overwalle & Labiouse , 2003 ) . Nous focaliserons notre attention sur la représentation distribuée qui doit être vue comme une entité dont la construction et l' utilisation sont dynamiques ( van Gelder , 1991 ) . Elle est construite suite à la présentation d' exemplaires qui vont être superposés les uns aux autres dans la même entité . Cette superposition implique qu' il n' est alors plus possible d' accéder à l' une de ces situations sans accéder à toutes celles stockées . Au-delà de ces propriétés , la modélisation connexioniste peut être envisagée comme une nouvelle méthode de recherche . En d' autres termes , les modèles connexionistes peuvent fournir un substrat d' études et proposer des hypothèses alternatives à celles des théories classiques . A partir de la structure et du fonctionnement du modèle connexioniste , il est possible de considérer des mécanismes intégratifs expliquant les phénomènes étudiés . De plus , ces modèles peuvent être utilisés , à partir de la simulation , pour prédire les comportements humains et ils permettent la réflexion dynamique autour des processus qu' ils implémentent . Ce sont toutes ces propriétés qui finalement intéressent les chercheurs en psychologie sociale et nous intéressent nous même . d' activation . Que ce soit l' émergence , la capacité d' apprentissage ou encore la plausibilité neurologique , ces propriétés permettent d' envisager l' intégration d' une série d' exemplaires ( des connaissances , des situations etc. ) sous forme de représentations distribuées ou localistes , accessibles et utilisables à partir de la présentation de stimuli connus ou non , complets ou non ( Smith , 1996 ; Kashima van Overwalle & Labiouse , 2003 ) . Nous focaliserons notre attention sur la représentation distribuée qui doit être vue comme une entité dont la construction et l' utilisation sont dynamiques ( van Gelder , 1991 ) . Elle est construite suite à la présentation d' exemplaires qui vont être superposés les uns aux autres dans la même entité . Cette superposition implique qu' il n' est alors plus possible d' accéder à l' une de ces situations sans accéder à toutes celles stockées . Au-delà de ces propriétés , la modélisation connexioniste peut être envisagée comme une nouvelle méthode de recherche . En d' autres termes , les modèles connexionistes peuvent fournir un substrat d' études et proposer des hypothèses alternatives à celles des théories classiques . A partir de la structure et du fonctionnement du modèle connexioniste , il est possible de considérer des mécanismes intégratifs expliquant les phénomènes étudiés . De plus , ces modèles peuvent être utilisés , à partir de la simulation , pour prédire les comportements humains et ils permettent la réflexion dynamique autour des processus qu' ils implémentent . Ce sont toutes ces propriétés qui finalement intéressent les chercheurs en psychologie sociale et nous intéressent nous même . Malgré ces nombreux avantages , l' approche classique de la modélisation connexioniste ne peut rendre compte des aspects interactifs des relations sociales . Selon nous , il est pourtant nécessaire d' envisager la modélisation connexioniste sous un angle intégrant la notion d' interaction , et c' est objectif que nous nous sommes fixé pour la conception de notre modèle . Les travaux développés par Cecconi , Parisi et Nolfi ( 1990 ) en vie artificielle sur le formalisme des réseaux de neurones écologiques proposent une base de réflexion sur l' intégration des interactions dans les modèles connexionistes . Tout en maintenant les mêmes propriétés que celles des modèles connexionistes classiques , ils offrent la possibilité de prendre en compte non seulement les processus impliqués pour l' individu dans des situations prédéfinies , mais de considérer qu' il est acteur de ses perceptions , de ses comportements et qu' il entretient avec son environnement une relation qui détermine ses apprentissages . Ce formalisme permet de simuler des agents évoluant dynamiquement dans un environnement physique ou / et social autonome ( Parisi , 1997 ) . Dans cette perspective , ce n' est pas le chercheur qui génère les conditions d' apprentissage et de simulation , elles résultent en fait de l' interaction de l' agent avec l' environnement . Le comportement émis par l' agent induit des changements dans sa relation avec l' extérieur et ce sont ces changements qui vont conduire l' agent à intégrer les informations dans son système de connaissances ( Cecconi Malgré ces nombreux avantages , l' approche classique de la modélisation connexioniste ne peut rendre compte des aspects interactifs des relations sociales . Selon nous , il est pourtant nécessaire d' envisager la modélisation connexioniste sous un angle intégrant la notion d' interaction , et c' est objectif que nous nous sommes fixé pour la conception de notre modèle . Les travaux développés par Cecconi , Parisi et Nolfi ( 1990 ) en vie artificielle sur le formalisme des réseaux de neurones écologiques proposent une base de réflexion sur l' intégration des interactions dans les modèles connexionistes . Tout en maintenant les mêmes propriétés que celles des modèles connexionistes classiques , ils offrent la possibilité de prendre en compte non seulement les processus impliqués pour l' individu dans des situations prédéfinies , mais de considérer qu' il est acteur de ses perceptions , de ses comportements et qu' il entretient avec son environnement une relation qui détermine ses apprentissages . Ce formalisme permet de simuler des agents évoluant dynamiquement dans un environnement physique ou / et social autonome ( Parisi , 1997 ) . Dans cette perspective , ce n' est pas le chercheur qui génère les conditions d' apprentissage et de simulation , elles résultent en fait de l' interaction de l' agent avec l' environnement . Le comportement émis par l' agent induit des changements dans sa relation avec l' extérieur et ce sont ces changements qui vont conduire l' agent à intégrer les informations dans son système de connaissances ( Cecconi et al. , 1990 ; Nolfi , Elman & Parisi , 1994 ) . L' agent est donc acteur de son apprentissage , en ce sens qu' il a la capacité d' action sur son environnement et que de ses actions résultent ses perceptions et ses apprentissages . Les situations sociales où l' individu est en interaction avec ses pairs sont nombreuses , néanmoins , il nous semble qu' une situation où l' individu bénéficie de la présence d' autrui parce que cet autrui lui permet d' apprendre , propose un cadre d' étude du formalisme écologique intéressant. , 1990 ; Nolfi , Elman & Parisi , 1994 ) . L' agent est donc acteur de son apprentissage , en ce sens qu' il a la capacité d' action sur son environnement et que de ses actions résultent ses perceptions et ses apprentissages . Les situations sociales où l' individu est en interaction avec ses pairs sont nombreuses , néanmoins , il nous semble qu' une situation où l' individu bénéficie de la présence d' autrui parce que cet autrui lui permet d' apprendre , propose un cadre d' étude du formalisme écologique intéressant . Ce type de situation rend compte du phénomène d' apprentissage social , et Bandura en a développé plus particulièrement l' une des composantes : l' apprentissage par observation ( Bandura , 1986 ) . A partir de l' observation des comportements émis par autrui , l' individu est en mesure de les apprendre et de les reproduire dans des situations analogues ou de les adapter à de nouvelles situations . Ceci réfère sans conteste aux propriétés des modèles connexionistes , puisque de la même façon ils apprennent , activent et ré-activent des connaissances mémorisées pour répondre à des stimuli connus ou non . L' apport du connexionisme réside ici dans l' utilisation d' une représentation distribuée et non symbolique des comportements appris . Selon Bandura ( 1977 ) , l' apprentissage par observation met en jeu des processus cognitifs répartis en une phase d' acquisition permettant l' élaboration d' une représentation symbolique des comportements observés , et en une phase de production impliquant son utilisation comme guide à l' action ultérieure . Si les auteurs s' accordent sur l' importance de la fiabilité de la représentation construite , peu d' éléments nous semblent soutenir que la transformation des actions perçues en symbole soit le seul moyen de parvenir à un apprentissage efficient . Nous proposerons dans la deuxième partie de ce document de tester l' hypothèse d' un apprentissage par observation sans élaboration d' une représentation symbolique . Nous supposons que la médiatisation de l' apprentissage par observation par une représentation distribuée du comportement observé conduit l' individu à acquérir de façon équivalente un nouveau comportement . En effet , tous les comportements ne peuvent être codés symboliquement , dès lors l' individu doit disposer d' une autre forme de codage pour construire une représentation adéquate et ré-utilisable du comportement observé . Par ailleurs , l' apprentissage par observation ne peut émerger que si l' individu bénéficie du contact avec autrui pour acquérir de nouvelles connaissances . L' obligation d' impliquer plusieurs individus dans ce phénomène amène naturellement à considérer qu' un modèle connexioniste écologique nous permettra de rendre compte de l' influence de l' interaction entre les individus . L' intérêt d' utiliser ce formalisme réside bien dans la possibilité de ne pas contraindre l' apprentissage par des exemplaires prédéfinis mais de laisser l' agent évoluer dans l' environnement pour qu' il en récolte les informations nécessaires à son apprentissage . Dans un premier chapitre , nous présenterons le modèle connexioniste , fondé sur le formalisme écologique , que nous avons conçu afin de rendre compte de l' émergence de l' apprentissage par observation par la construction d' une représentation distribuée . Sans remettre en cause les phases de l' apprentissage par observation définies par Bandura ( 1986 ) , nous proposons de créer un modèle écologique dont le fonctionnement suit le déroulement de ces phases et d' en tester la fiabilité . Après avoir exposé les caractéristiques de base que nous avons retenues pour concevoir le modèle et son architecture , nous expliciterons en détail son fonctionnement pour modéliser l' apprentissage par observation . Ce modèle peut être adapté à diverses tâches telle que l' acquisition de normes ( Bollon , Pansu , Paignon & Mermillod , 2003 ) , de valeurs , de comportements ou d' habiletés motrices ( Paignon , Desrichard & Bollon , sous presse ) . Ce dernier point nous intéressant en particulier , nous développerons l' architecture spécifique adaptée à l' implémentation de ce type de tâche . Nous testerons dans une première simulation , si l' architecture conçue répond aux exigences de phases identifiées par la théorie de Bandura ( 1986 ) , à savoir d' acquisition ( observation ) et une phase de production ( pratique ) . Les résultats de la littérature montrent que dans le cas d' acquisition de comportement complexe , la phase d' acquisition n' est à elle seule pas suffisante pour reproduire le comportement observé , puisque les sujets exhibent des performances faibles lors de premiers essais de pratique ( Carroll Deakin & Proteau , 2000 ) . Une phase de pratique , guidée par la représentation du comportement observé , s' avère déterminante de la capacité à reproduire un comportement observé . Ces résultats confirment que toutes les phases définies par Bandura ( 1977 ) sont nécessaires à l' apprentissage social et le fonctionnement de notre modèle devra en tenir compte . Nous vérifierons l' adéquation du fonctionnement et des composantes architecturales de notre modèle avec la théorie de l' apprentissage par observation , notamment nous vérifierons que l' implémentation du processus de Nous testerons dans une première simulation , si l' architecture conçue répond aux exigences de phases identifiées par la théorie de Bandura ( 1986 ) , à savoir d' acquisition ( observation ) et une phase de production ( pratique ) . Les résultats de la littérature montrent que dans le cas d' acquisition de comportement complexe , la phase d' acquisition n' est à elle seule pas suffisante pour reproduire le comportement observé , puisque les sujets exhibent des performances faibles lors de premiers essais de pratique ( Carroll Deakin & Proteau , 2000 ) . Une phase de pratique , guidée par la représentation du comportement observé , s' avère déterminante de la capacité à reproduire un comportement observé . Ces résultats confirment que toutes les phases définies par Bandura ( 1977 ) sont nécessaires à l' apprentissage social et le fonctionnement de notre modèle devra en tenir compte . Nous vérifierons l' adéquation du fonctionnement et des composantes architecturales de notre modèle avec la théorie de l' apprentissage par observation , notamment nous vérifierons que l' implémentation du processus de conception-matching par une boucle d' auto-régulation du comportement émis par la représentation distribuée est efficace ( simulation 1 ) . Pour cela , nous testerons notre modèle dans une situation classique d' apprentissage où un premier agent démonstrateur proposera une démonstration d' un déplacement et où un second agent ( implémenté par notre modèle ) apprendra par observation à reproduire ce même comportement . par une boucle d' auto-régulation du comportement émis par la représentation distribuée est efficace ( simulation 1 ) . Pour cela , nous testerons notre modèle dans une situation classique d' apprentissage où un premier agent démonstrateur proposera une démonstration d' un déplacement et où un second agent ( implémenté par notre modèle ) apprendra par observation à reproduire ce même comportement . Les différentes études , présentées dans le chapitre sur l' apprentissage par observation , nous ont permis d' identifier que selon le type de tâche utilisé les individus présentaient des performances différentes . De plus , nous avons relevé que le niveau de compétence de l' individu modèle influait sur l' apprentissage soit de façon positive suite à l' observation d' un expert soit suite à l' observation d' un novice . De ce fait , il est incontestable que les sujets humains exposent des compétences en reproduction différentes selon le type d' observation à laquelle ils ont été soumis . Sans entrer , à ce stade de validation du modèle , dans des considérations sur le niveau de compétence ou d' expertise , nous devons nous assurer que notre modèle exhibe de la même façon des comportements différents pour des conditions de démonstrations différentes ( simulation 2 ) . En effet , si ce n' était pas le cas , notre modèle pourrait être considéré comme un simple outil mathématique de résolution de la tâche puisque l' absence de performances différentes indiquerait qu' il existe une solution stable unique à la tâche . Par ailleurs , nous pensons que la validation d' un modèle connexioniste nécessite de vérifier sa capacité à répliquer certains résultats classiques . Pour cela , nous nous appuierons sur les résultats obtenus par Bandura et Jeffery ( 1973 ) sur la dégradation de performance entre représentation construite et comportement produit pour conduire une troisième simulation . Selon ces auteurs , l' individu rappelle mieux le comportement observé qu' il n' est en mesure de le reproduire . Notre modèle s' il est fiable devra présenter un Par ailleurs , nous pensons que la validation d' un modèle connexioniste nécessite de vérifier sa capacité à répliquer certains résultats classiques . Pour cela , nous nous appuierons sur les résultats obtenus par Bandura et Jeffery ( 1973 ) sur la dégradation de performance entre représentation construite et comportement produit pour conduire une troisième simulation . Selon ces auteurs , l' individu rappelle mieux le comportement observé qu' il n' est en mesure de le reproduire . Notre modèle s' il est fiable devra présenter un pattern de résultats équivalents puisqu' il ne remet pas en cause le principe de l' apprentissage par observation . Néanmoins , nous supposons qu' au-delà de la simple réplication , du fait de son fonctionnement , notre modèle apportera une explication de cette dégradation ( simulation 3 ) . De plus , nous avons indiqué que l' utilisation du formalisme écologique maintenait les mêmes propriétés que celles exhibées par les modèles connexionistes classiques , néanmoins , il convient d' en proposer une vérification . Ainsi , nous vérifierons que l' utilisation du formalisme écologique maintient les propriétés de généralisation et de transfert des connaissances et ce au regard des résultats obtenus sur des tâches de transfert avec des sujets humains ( simulation 4 ) . de résultats équivalents puisqu' il ne remet pas en cause le principe de l' apprentissage par observation . Néanmoins , nous supposons qu' au-delà de la simple réplication , du fait de son fonctionnement , notre modèle apportera une explication de cette dégradation ( simulation 3 ) . De plus , nous avons indiqué que l' utilisation du formalisme écologique maintenait les mêmes propriétés que celles exhibées par les modèles connexionistes classiques , néanmoins , il convient d' en proposer une vérification . Ainsi , nous vérifierons que l' utilisation du formalisme écologique maintient les propriétés de généralisation et de transfert des connaissances et ce au regard des résultats obtenus sur des tâches de transfert avec des sujets humains ( simulation 4 ) . Si notre modèle connexioniste satisfait les critères de fiabilité précédents , il n' en demeure pas moins que l' un des intérêts de ce formalisme est de prédire de nouveaux résultats . Nous proposons dans un deuxième chapitre de mettre à l' épreuve la prédictivité de notre modèle , en confrontant les prédictions proposées avec les données recueillies auprès de sujets humains pour une tâche équivalente . La tâche des sujets va consister à observer une séquence d' actions permettant de déplacer fictivement un pion dans un espace en deux dimensions , puis à la reproduire . Il convient dans un premier temps de la tester et la valider , c' est-à-dire vérifier que l' observation améliore la performance par rapport à un apprentissage par pratique physique uniquement et déterminer les conditions minimales pour que cet apprentissage par observation émerge ( pré-test ) . Nous proposons ensuite trois études considérant des aspects particuliers de l' apprentissage par observation , à savoir l' influence des phases d' acquisition et de production sur la pratique et l' influence du type de démonstration observée . Chaque étude se compose d' une simulation et d' une expérience . Nous présenterons dans la partie simulation les prédictions du modèle connexioniste pour des conditions particulières d' apprentissage . La partie expérience sera consacrée à la confrontation systématique des prédictions obtenues en simulation aux données recueillies chez les sujets humains pour les mêmes conditions expérimentales . La première étude , inspirée des travaux de Deakin et Proteau ( 2002 ) , a pour objectif de déterminer l' influence du programme d' acquisition ( variation du nombre d' observations et de pratiques ) et de deux séquences d' actions ( deux démonstrations de déplacement du pion ) sur la performance en reproduction . Nous supposons que notre modèle connexioniste écologique produira un ensemble de prédictions que les performances humaines tendrons à suivre . Plus particulièrement , d' après le fonctionnement de notre modèle nous pouvons avancer que l' augmentation du nombre d' observations induira la construction d' une représentation de meilleure qualité résultant en une amélioration de la performance . Par ailleurs , si la démonstration observée intègre un nombre important d' informations différentes , alors la performance devrait être plus faible que si elle intègre peu d' informations . Ainsi , les sujets humains devraient apprendre de façon différenciée des comportements en fonction de la démonstration à laquelle ils ont été soumis . Nous appuierons notre démarche sur la capacité du modèle à émettre des comportements différenciés en fonction de la démonstration observée , pour proposer une étude comparative équivalente chez les sujets humains opérationnalisant différents niveaux d' illustrations d' une même tâche . Nombre d' études indiquent que différentes formes de guidage permettent à l' individu d' améliorer l' exécution de ses actions , notamment le guidage par la représentation et la pratique physique . Peu d' études , cependant , nous permettent de dissocier les effets facilitateurs de la phase d' acquisition de ceux liés à la phase de production . Il nous semble particulièrement intéressant de développer ce point en testant de façon systématique les effets de chaque phase . Selon Deakin et Proteau ( 2002 ) , la pratique physique de la séquence comportementale est indispensable pour rendre la représentation fonctionnelle du fait , qu' en pratiquant , l' individu développe son habileté . Si ces auteurs proposent que la pratique physique de la tâche améliore la performance parce qu' elle rend la représentation fonctionnelle , Carroll et Bandura ( 1990 ) notaient que la performance était médiatisée en premier lieu par la construction d' une représentation symbolique correcte du comportement observé . Cependant , les protocoles d' apprentissage utilisés dans ces expériences intercalent les essais de pratique avec les essais d' observation , si bien qu' il s' avère difficile de déterminer effectivement la part d' influence de l' observation en elle-même de celle de la pratique . A partir des résultats obtenus dans la première étude , nous en conduirons une deuxième , afin d' examiner plus précisément l' évolution de l' apprentissage en fonction des conditions d' observation , ceci en neutralisant certaines des limites relevées dans la première étude . Nous supposons que les données humaines suivront le même Nombre d' études indiquent que différentes formes de guidage permettent à l' individu d' améliorer l' exécution de ses actions , notamment le guidage par la représentation et la pratique physique . Peu d' études , cependant , nous permettent de dissocier les effets facilitateurs de la phase d' acquisition de ceux liés à la phase de production . Il nous semble particulièrement intéressant de développer ce point en testant de façon systématique les effets de chaque phase . Selon Deakin et Proteau ( 2002 ) , la pratique physique de la séquence comportementale est indispensable pour rendre la représentation fonctionnelle du fait , qu' en pratiquant , l' individu développe son habileté . Si ces auteurs proposent que la pratique physique de la tâche améliore la performance parce qu' elle rend la représentation fonctionnelle , Carroll et Bandura ( 1990 ) notaient que la performance était médiatisée en premier lieu par la construction d' une représentation symbolique correcte du comportement observé . Cependant , les protocoles d' apprentissage utilisés dans ces expériences intercalent les essais de pratique avec les essais d' observation , si bien qu' il s' avère difficile de déterminer effectivement la part d' influence de l' observation en elle-même de celle de la pratique . A partir des résultats obtenus dans la première étude , nous en conduirons une deuxième , afin d' examiner plus précisément l' évolution de l' apprentissage en fonction des conditions d' observation , ceci en neutralisant certaines des limites relevées dans la première étude . Nous supposons que les données humaines suivront le même pattern de données que celui prédit par le modèle connexioniste . De façon plus spécifique , nous testerons auprès des sujets humains , l' hypothèse alternative d' une amélioration de la performance rendue effective par l' observation ou la pratique . Ceci nous permettra d' aller plus loin sur la détermination des facteurs rendant la représentation cognitive fonctionnelle , en identifiant si l' observation ou la pratique sont à la base de l' émergence de la fonctionnalité de la représentation . de données que celui prédit par le modèle connexioniste . De façon plus spécifique , nous testerons auprès des sujets humains , l' hypothèse alternative d' une amélioration de la performance rendue effective par l' observation ou la pratique . Ceci nous permettra d' aller plus loin sur la détermination des facteurs rendant la représentation cognitive fonctionnelle , en identifiant si l' observation ou la pratique sont à la base de l' émergence de la fonctionnalité de la représentation . Nombre d' études s' intéressent à l' influence du niveau de compétence de l' individu servant de modèle lors de l' apprentissage par observation , néanmoins nous avons pu relever des résultats contradictoires selon la nature de la tâche utilisée , et selon les caractéristiques des individus modèles ( Greenfeld & Kuznicki , 1975 ; Thomas , Due & Wigger , 1987 ) . Nous proposons de rendre compte de cette forme d' effet en utilisant deux niveaux de représentativité de la démonstration . Nous pensons , en effet , que cette forme d' opérationnalisation du niveau de compétence est propice à dissocier cet effet de ceux liés aux caractéristiques personnelles de l' individu modèle . Par exemple , nous avons indiqué qu' il était difficile dans certaines études de dissocier le niveau de compétence du statut du modèle . Nous proposons donc dans une dernière étude de rendre compte de l' effet de la représentativité de la séquence observée sur la performance , en maintenant constant les caractéristiques du modèle , mais en proposant deux niveaux de réalisation de la tâche . La troisième étude nous permettra donc de déterminer l' influence spécifique de la séquence observée sur la performance en reproduction . PARTIE EXPERIMENTALE Chapitre 1 : OLEANNet , une modélisation connexioniste de l' apprentissage par observation Les modèles connexionistes proposent , au-delà d' une simple réplication de théories existante , un regard alternatif sur les phénomènes étudiés . Néanmoins , comme nous l' avons souligné , les modèles déjà développés en psychologie sociale utilisent le formalisme classique des réseaux de neurones dont les contraintes d' utilisation ne permettent pas de simuler des interactions auxquelles les individus sont soumis . Nous proposons d' utiliser le formalisme des réseaux de neurones écologiques pour pallier ce déficit , en utilisant le réseau de neurones non plus comme une entité statique mais comme un agent actif . Le réseau de neurones écologique n' est plus vu comme un outil mathématique répondant aux contraintes d' apprentissage , mais comme un agent acteur de ses apprentissages . Parmi les situations sociales proposant une interaction active entre individus , l' apprentissage par observation propose un cadre d' étude intéressant . Si cette théorie est robuste , il n' en demeure pas moins que certaines questions persistent . Notamment , est -ce que ce type d' apprentissage ne peut intervenir que s' il est médiatisé par la construction et par l' utilisation d' une représentation symbolique ? Nous pensons que cette médiatisation n' est pas indispensable et qu' un modèle connexioniste peut rendre compte de l' utilisation d' une représentation distribuée comme support de l' apprentissage . En outre , si l' importance de la pratique physique dans l' évolution de la performance est corroborée par nombre d' études , ces dernières ne permettent pas d' identifiées si l' amélioration de la performance résulte d' un effet de la pratique ou d' un effet de l' observation . Le modèle que nous créons devrait contribuer à dissocier ces effets et devrait permettre d' aller plus loin en proposant des prédictions quant aux performances que des sujets humains pourraient exhiber . Nous exposons dans la partie qui suit l' architecture que nous avons conçue pour modéliser l' apprentissage par observation sous forme de modèle connexioniste ( OLEANNetNous exposons dans la partie qui suit l' architecture que nous avons conçue pour modéliser l' apprentissage par observation sous forme de modèle connexioniste ( OLEANNet [ 9 ] ) . Il implémente les phases d' acquisition et de production proposées par la théorie de l' apprentissage par observation développée ( cf. Bandura , 1986 ) . L' apprentissage par observation prend place dès lors qu' un individu est en mesure de reproduire un comportement qu' il a observé chez autrui . Cela implique que le modèle connexioniste que nous concevons soit en mesure de percevoir de l' information provenant de l' environnement extérieur et qu' il soit capable de produire des comportements . Pour cela , nous utilisons le formalisme présenté pour les réseaux de neurones écologiques . Dans cette perspective , nous développerons dans un premier temps les critères de définition de l' architecture retenue pour modéliser l' apprentissage par observation . Ensuite , nous présenterons l' architecture adaptée à l' acquisition des habiletés motrices et expliquerons le fonctionnement d' OLEANNet . Ce dernier sera ensuite testé dans le cadre de 4 simulations . Les simulations 1 et 2 ont pour objectif de vérifier la fiabilité de l' architecture d' OLEANNet à simuler l' apprentissage par observation . Les simulations 3 et 4 visent quant à elles à tester la capacité de ce modèle à reproduire des résultats expérimentaux existants , et à proposer des explications complémentaires à celles généralement retenues dans la littérature . ) . Il implémente les phases d' acquisition et de production proposées par la théorie de l' apprentissage par observation développée ( cf . Bandura , 1986 ) . L' apprentissage par observation prend place dès lors qu' un individu est en mesure de reproduire un comportement qu' il a observé chez autrui . Cela implique que le modèle connexioniste que nous concevons soit en mesure de percevoir de l' information provenant de l' environnement extérieur et qu' il soit capable de produire des comportements . Pour cela , nous utilisons le formalisme présenté pour les réseaux de neurones écologiques . Dans cette perspective , nous développerons dans un premier temps les critères de définition de l' architecture retenue pour modéliser l' apprentissage par observation . Ensuite , nous présenterons l' architecture adaptée à l' acquisition des habiletés motrices et expliquerons le fonctionnement d' OLEANNet . Ce dernier sera ensuite testé dans le cadre de 4 simulations . Les simulations 1 et 2 ont pour objectif de vérifier la fiabilité de l' architecture d' OLEANNet à simuler l' apprentissage par observation . Les simulations 3 et 4 visent quant à elles à tester la capacité de ce modèle à reproduire des résultats expérimentaux existants , et à proposer des explications complémentaires à celles généralement retenues dans la littérature . 1 . Modélisation Selon Bandura ( 1977 ) , l' apprentissage par observation , décrit par le schéma 3 , se décompose en deux phases . Dans la première phase dite d' acquisition , l' individu focalise son attention sur le comportement émis par un individu modèle afin de le mémoriser . Pendant une seconde phase dite de production , l' individu reproduit le comportement en réactivant la représentation mémorisée , et ajuste ses actions en fonction des contraintes induites par la représentation , ceci grâce au processus de Selon Bandura ( 1977 ) , l' apprentissage par observation , décrit par le schéma 3 , se décompose en deux phases . Dans la première phase dite d' acquisition , l' individu focalise son attention sur le comportement émis par un individu modèle afin de le mémoriser . Pendant une seconde phase dite de production , l' individu reproduit le comportement en réactivant la représentation mémorisée , et ajuste ses actions en fonction des contraintes induites par la représentation , ceci grâce au processus de conception-matching .. Schéma 3 : Processus impliqués dans les phases d' acquisition et de production ( adapté de Bandura 1973 ) La démarche que nous avons suivi pour créer OLEANNet consiste à définir une architecture qui doit permettre de modéliser les deux phases précédemment décrites , impliquant les processus d' attention , de rétention , de production et de motivation . De plus , le fonctionnement d' OLEANNet doit refléter le déroulement des processus impliqués dans ce type d' apprentissage . 1.1 . Caractéristiques générales associées à l' élaboration d' OLEANNet OLEANNet est un modèle connexioniste que nous proposons comme implémentation de chaque élément impliqué dans l' apprentissage par observation ( Bandura , 1986 ) . Pour cela , nous cherchons à associer à chacun d' eux un aspect de notre modèle qui s' y ajuste au plus près , et nous définissons le fonctionnement d' OLEANNet en regard du déroulement des processus décrits par Bandura . Lorsqu' il est en situation d' apprentissage par observation , l' individu observant un comportement émis par autrui mémorise les informations qu' il perçoit en y portant attention . Cela implique de considérer que notre modèle contienne un module de perception de l' information extérieure à Lorsqu' il est en situation d' apprentissage par observation , l' individu observant un comportement émis par autrui mémorise les informations qu' il perçoit en y portant attention . Cela implique de considérer que notre modèle contienne un module de perception de l' information extérieure à attention contrainte ( A ) et un espace ( A ) et un espace mémoire ( B ) . Pendant la phase de production , l' individu émet un comportement qu' il compare à celui mémorisé . Le processus de ( B ) . Pendant la phase de production , l' individu émet un comportement qu' il compare à celui mémorisé . Le processus de conception-matching proposé par Bandura induit l' utilisation de la représentation , construite pendant la phase d' acquisition , comme guide d' ajustement du comportement en production ( Bandura , 1986 ) . Certains travaux réalisés en neurologie soutiennent , par ailleurs , l' existence d' un tel processus indiquant qu' une même structure neuronale est activée pendant l' observation et la production d' une action , et qu' une région exécutive s' y ajoute pour générer le comportement ( Decety , Chaminade , Grèzes & Meltzoff , 2002 ) . Cela implique que notre modèle comporte un module proposé par Bandura induit l' utilisation de la représentation , construite pendant la phase d' acquisition , comme guide d' ajustement du comportement en production ( Bandura , 1986 ) . Certains travaux réalisés en neurologie soutiennent , par ailleurs , l' existence d' un tel processus indiquant qu' une même structure neuronale est activée pendant l' observation et la production d' une action , et qu' une région exécutive s' y ajoute pour générer le comportement ( Decety , Chaminade , Grèzes & Meltzoff , 2002 ) . Cela implique que notre modèle comporte un module d' action ( C ) et un module d' ajustement du comportement par ( C ) et un module d' ajustement du comportement par comparaison à celui mémorisé ( D ) . à celui mémorisé ( D ) . Nous avons précédemment souligné qu' au cours des expériences en laboratoire , les contraintes expérimentales induisaient une obligation pour les participants de porter attention à la démonstration et les obligeaient à reproduire le comportement observé . Nous implémentons au plus près ces conditions en contraignant la focalisation attentionnelle sur le comportement du modèle et en fixant la motivation au seuil maximale , elles n' interviendront pas comme facteurs modérateurs de l' émission des comportements . Nous devons donc élaborer une architecture permettant d' exploiter l' ensemble des modules de perception , d' action , de mémoire et de comparaison sachant que nous souhaitons prendre en compte le processus de Nous devons donc élaborer une architecture permettant d' exploiter l' ensemble des modules de perception , d' action , de mémoire et de comparaison sachant que nous souhaitons prendre en compte le processus de conception-matching , peu voire non exploité dans les modélisations existantes . Ces caractéristiques peuvent être associées à un réseau de neurone écologique dont l' architecture est présentée figure 4 ( page suivante ) . Elle se compose d' une couche d' entrée simulant la perception des informations extérieures ( A ) , une couche cachée et une couche de sortie simulant les réponses comportementales ( C ) , ces couches étant reliées entre elles par des poids de connexion simulant l' espace mémoire ( B ) . L' espace mémoire unique est destiné à stocker et réactiver les comportements observés afin de les produire ( renvoie à une seule structure neuronale pour la perception et la production des comportements ) . Les couches d' entrée et de sortie sont en relation directe avec l' environnement qui propose les informations perçues en entrée en fonction des réponses comportementales effectivement produites en sortie . L' implémentation du processus de , peu voire non exploité dans les modélisations existantes . Ces caractéristiques peuvent être associées à un réseau de neurone écologique dont l' architecture est présentée figure 4 ( page suivante ) . Elle se compose d' une couche d' entrée simulant la perception des informations extérieures ( A ) , une couche cachée et une couche de sortie simulant les réponses comportementales ( C ) , ces couches étant reliées entre elles par des poids de connexion simulant l' espace mémoire ( B ) . L' espace mémoire unique est destiné à stocker et réactiver les comportements observés afin de les produire ( renvoie à une seule structure neuronale pour la perception et la production des comportements ) . Les couches d' entrée et de sortie sont en relation directe avec l' environnement qui propose les informations perçues en entrée en fonction des réponses comportementales effectivement produites en sortie . L' implémentation du processus de conception-matching ( D ) implique une comparaison entre comportement mémorisé et comportement produit . Ceci nous conduit à décomposer la couche de sortie afin de créer une boucle de rétroaction entre deux sous-couches de sorties , la première permettant le stockage et la réactivation du comportement observé ; la seconde permettant la production effective du comportement ( renvoie à l' adjonction d' une région neuronale exécutive ) . Ces deux sous-couches interviennent par ailleurs dans l' implémentation des phases d' acquisition et de production . ( D ) implique une comparaison entre comportement mémorisé et comportement produit . Ceci nous conduit à décomposer la couche de sortie afin de créer une boucle de rétroaction entre deux sous-couches de sorties , la première permettant le stockage et la réactivation du comportement observé ; la seconde permettant la production effective du comportement ( renvoie à l' adjonction d' une région neuronale exécutive ) . Ces deux sous-couches interviennent par ailleurs dans l' implémentation des phases d' acquisition et de production . Figure 4 : Caractéristiques retenues pour l' architecture d' OLEANNet Symbolise la matrice de poids de connexion unidirectionnelle entre toutes les unités des deux couches successives 1.2 Fonctionnement d' OLEANNet Nous allons tout d' abord donner des précisions quant aux termes relatifs aux couches d' entrée et de sortie . Comme le présente la figure 5 , la couche d' entrée simule la perception des informations extérieures , nous parlerons d' entrées perceptives . La couche de sortie se décompose en deux sous-couches , cela permet l' implémentation du processus de Nous allons tout d' abord donner des précisions quant aux termes relatifs aux couches d' entrée et de sortie . Comme le présente la figure 5 , la couche d' entrée simule la perception des informations extérieures , nous parlerons d' entrées perceptives . La couche de sortie se décompose en deux sous-couches , cela permet l' implémentation du processus de conception-matching et des phases d' acquisition et de production . Nous emploierons dorénavant le terme de sortie cognitive pour nous référer à la première sous-couche ( comportement mémorisé ) et le terme de sortie motrice pour nous référer à la deuxième sous-couche de sortie ( comportement produit ) . Toutes les unités d' une couche sont reliées à toutes les unités de la couche suivante . et des phases d' acquisition et de production . Nous emploierons dorénavant le terme de sortie cognitive pour nous référer à la première sous-couche ( comportement mémorisé ) et le terme de sortie motrice pour nous référer à la deuxième sous-couche de sortie ( comportement produit ) . Toutes les unités d' une couche sont reliées à toutes les unités de la couche suivante . Figure 5 : Représentation du réseau de neurones implémentant le modèle OLEANNet . Le fonctionnement d' OLEANNet doit répliquer le déroulement de l' apprentissage par observation défini par Bandura ( 1977 ) . Pour expliquer ce fonctionnement , nous nous appuierons sur une situation classique d' apprentissage par observation : observer et mémoriser un comportement puis le reproduire . Pour cela , nous proposons d' envisager deux types d' agentsLe fonctionnement d' OLEANNet doit répliquer le déroulement de l' apprentissage par observation défini par Bandura ( 1977 ) . Pour expliquer ce fonctionnement , nous nous appuierons sur une situation classique d' apprentissage par observation : observer et mémoriser un comportement puis le reproduire . Pour cela , nous proposons d' envisager deux types d' agents [ 10 ] participant à la situation d' apprentissage par observation . Un premier agent dit démonstrateur sera utilisé pour émettre le comportement qu' observera le second agent dit observateur . L' agent démonstrateur ne participe au déroulement de l' apprentissage par observation que par la démonstration qu' il propose , il n' est pas impliqué en tant que processus dans le modèle OLEANNet . A contrario , l' agent observateur est un réseau de type OLEANNet et c' est sur cette architecture que se déroule l' apprentissage par observation . Le fonctionnement de l' agent observateur réplique donc le déroulement de l' apprentissage par observation participant à la situation d' apprentissage par observation . Un premier agent dit démonstrateur sera utilisé pour émettre le comportement qu' observera le second agent dit observateur . L' agent démonstrateur ne participe au déroulement de l' apprentissage par observation que par la démonstration qu' il propose , il n' est pas impliqué en tant que processus dans le modèle OLEANNet . A contrario , l' agent observateur est un réseau de type OLEANNet et c' est sur cette architecture que se déroule l' apprentissage par observation . Le fonctionnement de l' agent observateur réplique donc le déroulement de l' apprentissage par observation [ 11 ] . . Situation retenue et fonctionnement général Deux agents sont placés dans un environnement . L' agent démonstrateur émet un comportement pendant que l' agent observateur , qui ne possède aucune connaissance préalable sur ce comportement , observe cette démonstration afin de la reproduire ultérieurement . Cet apprentissage est régi par les phases et les processus identifiés dans la théorie de Bandura ( 1986 ) . Les contraintes d' émergence de l' apprentissage par observation impliquent que pendant la phase d' acquisition l' agent observateur n' interagisse pas avec l' environnement . Il ne fait dès lors qu' observer l' influence des stimuli sur le comportement de l' agent démonstrateur tout en restant inactif . Pendant cette phase , l' agent observateur observe le comportement émis par l' agent démonstrateur et le mémorise en en construisant une représentation distribuée . La construction de cette représentation est donc contrainte par le comportement de l' agent démonstrateur . En phase de production , l' agent démonstrateur est à son tour inactif et l' agent observateur réagit aux stimuli de l' environnement à partir des informations mémorisées pendant la phase d' acquisition . Pendant cette phase , l' agent observateur réactive la représentation mémorisée afin d' émettre un comportement . Il ajuste à mesure de la production le comportement qu' il exécute à celui mémorisé . Le comportement émis est donc contraint par la représentation mémorisée . Entrons maintenant dans le détail du fonctionnement du modèle OLEANNet pour chacune des phases d' acquisition et de production , nous présenterons successivement chaque étape impliquée dans chacune des phases . 1.2.1 . Phase d' acquisition Pendant cette phase , l' agent démonstrateur réalise une séquence comportementale et l' agent observateur observe et mémorise ce comportement sans aucune activité comportementale . Etape 1 : observation du comportement émis par l' agent démonstrateur La première étape de la phase d' acquisition consiste pour l' agent observateur , sans aucune activité comportementale , à observer le comportementLa première étape de la phase d' acquisition consiste pour l' agent observateur , sans aucune activité comportementale , à observer le comportement [ 12 ] produit par l' agent démonstrateur . Comme indiqué dans la figure 6 , à chaque composante comportementale émise par l' agent démonstrateur , l' agent observateur focalise son attention sur les informations extérieures . Il reçoit sur les entrées perceptives les informations fournies par l' environnement ( composante comportementale , contexte ) et produit sur la sortie cognitive une produit par l' agent démonstrateur . Comme indiqué dans la figure 6 , à chaque composante comportementale émise par l' agent démonstrateur , l' agent observateur focalise son attention sur les informations extérieures . Il reçoit sur les entrées perceptives les informations fournies par l' environnement ( composante comportementale , contexte ) et produit sur la sortie cognitive une proposition de composante comportementale qu' il exécuterait dans la même situation . Cette proposition résulte de la somme des activations des unités antérieures pondérées par les valeurs des poids de connexions . de composante comportementale qu' il exécuterait dans la même situation . Cette proposition résulte de la somme des activations des unités antérieures pondérées par les valeurs des poids de connexions . Figure 6 : Etape de focalisation attentionnelle sur le comportement observé Symbolise la matrice de poids de connexion unidirectionnelle entre toutes les unités des deux couches successives Etape 2 : Mémorisation du comportement observé Dans l' étape 1 , lorsque l' agent observateur fait une proposition de composante comportementale , le calcul de la valeur produite en sortie cognitive se fonde sur des valeurs aléatoires puisque l' agent n' a encore été soumis à aucun apprentissage . L' étape 2 va donc permettre à l' agent observateur de mémoriser le comportement observé sous forme d' une représentation distribuée sur l' ensemble de la matrice de poids de connexions . Pour que cela puisse prendre place , il est nécessaire que l' agent observateur soit soumis à un apprentissage puisque c' est à partir de l' application d' une règle d' apprentissage que les valeurs des matrices de poids sont modifiées et adaptées en regard des situations rencontrées . La représentation ainsi construite intègre l' ensemble des composantes comportementales observées et des informations perceptives , et ce , dans une seule et même structure de poids . Dès lors , la réponse proposée en sortie cognitive est adaptée et non plus aléatoire . La figure 7 ( page suivante ) présente la façon dont est élaborée la représentation du comportement observé . La sortie cognitive acquise pendant cette étape doit servir de contrainte pour la boucle de rétroaction utilisée en phase de production . En d' autres termes , la sortie cognitive doit produire une réponse en terme de composante comportementale adaptée . Pour obtenir ce type de réponse , nous optons pour une contrainte de la rétropropagation pendant cette étape 2 ( mémorisation ) définie par les composantes comportementales produites par l' agent démonstrateur . L' agent démonstrateur sert de superviseur à l' apprentissage , en fournissant la réponse correcte attendue en sortie cognitive pour chaque composante du comportement que l' agent observateur observe . La proposition comportementale émise par l' agent observateur en étape 1 , sur la sortie cognitive en réponse aux informations perceptives , est comparée à celle émise par l' agent démonstrateur pendant la démonstration . L' apprentissage consiste alors en une réduction de l' écart entre la sortie cognitive et la composante comportementale associée qui est proposée par l' agent démonstrateur et ce tout au long du déroulement du comportement observé . Ainsi , au fur et à mesure que l' agent démonstrateur avance dans la séquence comportementale , les valeurs d' entrée perceptives de l' agent observateur sont modifiées puisque l' environnement change de configuration . Il en résulte que chaque valeur de proposition comportementale émise en sortie cognitive est comparée à chaque composante correspondante produite par l' agent démonstrateur . Au terme de cette étape , l' agent observateur aura été soumis à l' apprentissage de chaque composante si bien qu' il acquiert une représentation de l' intégralité du comportement observé intégrant les caractéristiques spatio-temporelles de la séquence . Figure 7 : Etape de mémorisation du comportement observé La phase d' acquisition est décrite de façon séquentielle , néanmoins les deux étapes proposées se déroulent en parallèle . Pendant cette phase , l' agent observateur observe la démonstration réalisée par l' agent démonstrateur en même temps qu' il en construit une représentation distribuée . L' élaboration de cette représentation est supervisée par la démonstration réalisée par l' agent démonstrateur . Cette représentation servira ensuite de guide d' ajustement du comportement effectif de l' agent observateur pendant la phase de production que nous allons maintenant décrire . 1.2.2 . Phase de production Cette phase est réalisée en présence de l' agent démonstrateur dans l' environnement sans que celui -ci n' émette de comportement ( il n' interagit pas de façon active avec l' environnement ) . Seul l' agent observateur est en action , il va utiliser la représentation construite en phase d' acquisition pour guider la réalisation effective de ce comportement . Etape 3 : Activation de la représentation élaborée en phase d' acquisition . Au cours de cette étape , l' agent observateur est soumis aux stimuli de l' environnement . Il reçoit au niveau des entrées perceptives les informations fournies par l' environnement . Leurs activités se propagent au travers du réseau jusqu'aux sorties cognitives et motrices qui émettent Au cours de cette étape , l' agent observateur est soumis aux stimuli de l' environnement . Il reçoit au niveau des entrées perceptives les informations fournies par l' environnement . Leurs activités se propagent au travers du réseau jusqu'aux sorties cognitives et motrices qui émettent simultanément une réponse . une réponse . La sortie cognitive produit une réponse correspondant à ce que l' agent observateur a mémorisé pendant la phase d' acquisition , c' est-à-dire « le souvenir de ce qui a été fait dans la même situation » . Pour chaque entrée perceptive , l' activation est propagée au travers des poids dont les valeurs ont été adaptées dans l' étape 2 . Par conséquent , il y a effectivement activation de la représentation mémorisée pour produire la réponse cognitive . En effet , cette réponse résulte de l' intégration des informations perceptives et des composantes comportementales associées apprises pendant la phase d' acquisition . Simultanément , la sortie motrice émet une réponse encore non adaptée en regard des informations perceptives . Cette réponse correspond à la proposition d' une composante comportementale effective . Elle résulte de la propagation de l' activation des unités d' entrée jusqu'aux unités de sortie motrice pondérées par les poids de connexions . La figure 8 illustre la façon dont la représentation distribuée , construite en phase d' acquisition , est activée tout au long du déroulement de la reproduction . Cette représentation va guider , au cours de la phase de production , l' apprentissage des composantes comportementales observées . Figure 8 : Etape d' activation du comportement mémorisé en phase d' acquisition Etape 4 : Production du comportement Le guidage du comportement effectif est réalisé par comparaison du comportement activé en sortie cognitive à celui proposé en sortie motrice . Ce guide d' ajustement du comportement permet l' intégration au répertoire comportemental des composantes observées . Pour que l' ajustement soit effectif , il est nécessaire de soumettre le réseau à un apprentissage . Comme présenté sur la figure 9 ( page suivante ) , la contrainte d' apprentissage est définie par une boucle de rétro-action implémentant le processus de Le guidage du comportement effectif est réalisé par comparaison du comportement activé en sortie cognitive à celui proposé en sortie motrice . Ce guide d' ajustement du comportement permet l' intégration au répertoire comportemental des composantes observées . Pour que l' ajustement soit effectif , il est nécessaire de soumettre le réseau à un apprentissage . Comme présenté sur la figure 9 ( page suivante ) , la contrainte d' apprentissage est définie par une boucle de rétro-action implémentant le processus de conception-matching . Cette boucle utilise la réponse produite en sortie cognitive comme guide d' ajustement à la réponse produite sur la sortie motrice . Pour chaque entrée perceptive , la sortie cognitive propose une réponse qui sert de contrainte à la rétropropagation sur la sortie motrice . L' apprentissage résulte de la réduction de l' écart entre sortie cognitive et sortie motrice à chaque composante comportementale . L' agent observateur utilise cette contrainte pour produire son comportement effectif . L' environnement fournit alors les nouvelles informations perceptives à l' agent observateur qui renouvelle le processus jusqu'à la fin de la séquence comportementale mémorisée . Cet apprentissage correspond à une adaptation progressive des réponses en sortie motrice , cette adaptation étant guidée par la représentation que l' agent observateur a construite en phase d' acquisition . . Cette boucle utilise la réponse produite en sortie cognitive comme guide d' ajustement à la réponse produite sur la sortie motrice . Pour chaque entrée perceptive , la sortie cognitive propose une réponse qui sert de contrainte à la rétropropagation sur la sortie motrice . L' apprentissage résulte de la réduction de l' écart entre sortie cognitive et sortie motrice à chaque composante comportementale . L' agent observateur utilise cette contrainte pour produire son comportement effectif . L' environnement fournit alors les nouvelles informations perceptives à l' agent observateur qui renouvelle le processus jusqu'à la fin de la séquence comportementale mémorisée . Cet apprentissage correspond à une adaptation progressive des réponses en sortie motrice , cette adaptation étant guidée par la représentation que l' agent observateur a construite en phase d' acquisition . Figure 9 : Etape de production du comportement moteur par évaluation des erreurs La phase de production est décrite en deux étapes , cependant elles interviennent en parallèle . Au cours de cette phase , l' agent observateur utilise la représentation élaborée au cours de la phase d' acquisition comme guide d' ajustement de son comportement . Ce guidage permet l' intégration de nouvelles composantes comportementales au répertoire de base de l' agent observateur . D' après le fonctionnement décrit , OLEANNet implémente l' apprentissage par observation selon les phases d' acquisition et de production décrites ci-dessus en tenant compte des caractéristiques définies comme nécessaires à l' élaboration du modèle connexioniste . Il convient dès lors de tester la fiabilité de l' architecture et du fonctionnement définis pour OLEANNet . Nous présentons dans le paragraphe suivant les simulations permettant d' atteindre cet objectif . 2 . Simulations Afin de tester OLEANNet , nous implémentons une situation d' apprentissage par observation permettant l' acquisiton d' une habileté motrice simple . Nous testons dans une première simulation la fiabilité d' OLEANNet quant à sa capacité à répliquer le phénomène d' apprentissage par observation . Pour cela , nous vérifions que le fonctionnement et les composantes architecturales du modèle répondent aux exigences de phases identifiées par la théorie de Bandura ( 1986 ) . L' objectif étant de montrer que la capacité des agents observateurs à reproduire le comportement observé n' émerge que si l' ensemble des phases d' acquisition et de production est réalisé . Au-delà de la fiabilité du fonctionnement d' OLEANNet à répliquer le phénomène d' apprentissage par observation , il convient de tester plus concrètement sa capacité à produire des comportements différenciés . Si l' ensemble des agents observateurs présente des performances équivalentes cela impliquera qu' OLEANNet est un outil mathématique probant pour la résolution de la tâche . OLEANNet n' étant pas conçu pour optimiser la résolution de la tâche mais pour répliquer un phénomène , nous nous attendons à ce que les agents observateurs présentent des performances différentes en fonction du type d' apprentissage auquel ils sont soumis . Pour cela , nous soumettons les mêmes agents observateurs à différents types de démonstration pour lesquels nous attendons des performances différentes . Dans une troisième simulation , nous testons OLEANNet quant à sa capacité à répliquer les résultats obtenus par Bandura et Jeffery ( 1973 ) sur la dégradation de la performance entre représentation construite et comportement produit . Ce phénomène avéré dans la littérature nous conduira à envisager qu' OLEANNet permet d' aller plus loin en proposant des mécanismes explicatifs de cette dégradation . Enfin , nous envisageons dans une dernière simulation les capacités de transfert et de généralisation d' OLEANNet , propriétés inhérentes aux réseaux de neurones , dont l' émergence se traduit par la capacité des agents observateurs à utiliser les connaissances acquises en observation dans une tâche différente . 2.1 . Définition de la situation expérimentale Afin de conduire le programme de simulation indiqué , nous reprenons une situation classique d' apprentissage par observation s' inspirant du paradigme expérimental utilisé par Bandura et Jeffery ( 1973 ) : observer et mémoriser une tâche motrice puis la reproduire . Nous proposons de définir le cadre général des simulations en présentant tout d' abord une illustration de la situation expérimentale retenue . Comme présenté dans la figure 10 , la situation implémentée implique deux agents placés dans un environnement en deux dimensions . Un agent démonstrateur ( a ) , dont nous définirons la conception dans le paragraphe suivant , réalise un exemple de déplacement entre un point de départ et une cible ( c ) . Le second , l' agent observateur ( b ) qui ne possède aucune connaissance préalable sur ce comportement , observe cette démonstration depuis une position fixe afin de la reproduire ultérieurement . Figure 10 : Situation d' apprentissage intégrant un exmple de démonstration proposée par l' agent démonstrateur en présence de l' agent observateur Point technique sur l' environnement L' environnement modélisé est un espace orthonormé en deux dimensions . Il est simulé par un algorithme qui intègre la structure de l' environnement et permet le calcul des informations fournies en entrée des agents . Chaque point de cet espace correspond à une position d' occupation possible des agents et de la cible . La position de cette dernière est fixée , alors que celle des agents varie en fonction du comportement qu' ils produisent . 2.2 . Caractéristiques techniques de l' implémentation des agents démonstrateurs et observateurs 2.2.1 . Implémentation de l' agent démonstrateur Bien que l' agent démonstrateur n' ait pour nous qu' un intérêt en terme de superviseur de l' apprentissage par observation de l' agent observateur , nous en proposons une implémentation en réseau de neurones . Nous aurions certes pu créer des algorithmes pour simuler des démonstrations de déplacement , cependant nous souhaitons bénéficier de la capacité des réseaux de neurones à présenter des performances différenciées en fonction du type d' apprentissage auquel ils sont soumis . Nous pourrons ainsi générer des agents démonstrateurs à comportements différents et simulerons de façon plus plausible la présence d' autrui . L' agent démonstrateur est implémenté par un réseau de neurones à propagation unidirectionnelle composé de trois couches illustrées par la figure 11 ( page suivante ) . La couche d' entrée contient deux unités recevant les informations extérieures , à savoir la position de la cible à atteindre par rapport à la position occupée par l' agent démonstrateur . L' agent étant orienté dans l' espace , sa position est définie par trois éléments : l' abscisse , l' ordonnée et l' orientation . Cela permet de coder sur la première unité de la couche d' entrée la distance séparant l' agent de la cible ; sur la seconde l' angle entre l' agent orienté et la cible . Ces informations sont fournies en entrée du réseau par l' algorithme de l' environnement en réponse aux actions de l' agent qui le font se déplacer dans l' environnement . En cela , nous utilisons bien la méthode des réseaux de neurones écologiques puisque l' agent est acteur de sa perception . Suite à la production d' une action , l' agent démonstrateur se déplace et reçoit en entrée les nouvelles informations relatives à sa nouvelle position . La couche cachée contient vingt cinq unités et la couche de sortie est composée de deux unités illustrant les actions motrices produites . Ce sont ces actions qui détermineront , par leur application dans l' environnement , les nouvelles entrées perceptives de l' agent . Ces dernières illustrent une action « avance » qui est codée en ( 1 , 1 ) , une action de « quart de tour à gauche » L' agent démonstrateur est implémenté par un réseau de neurones à propagation unidirectionnelle composé de trois couches illustrées par la figure 11 ( page suivante ) . La couche d' entrée contient deux unités recevant les informations extérieures , à savoir la position de la cible à atteindre par rapport à la position occupée par l' agent démonstrateur . L' agent étant orienté dans l' espace , sa position est définie par trois éléments : l' abscisse , l' ordonnée et l' orientation . Cela permet de coder sur la première unité de la couche d' entrée la distance séparant l' agent de la cible ; sur la seconde l' angle entre l' agent orienté et la cible . Ces informations sont fournies en entrée du réseau par l' algorithme de l' environnement en réponse aux actions de l' agent qui le font se déplacer dans l' environnement . En cela , nous utilisons bien la méthode des réseaux de neurones écologiques puisque l' agent est acteur de sa perception . Suite à la production d' une action , l' agent démonstrateur se déplace et reçoit en entrée les nouvelles informations relatives à sa nouvelle position . La couche cachée contient vingt cinq unités et la couche de sortie est composée de deux unités illustrant les actions motrices produites . Ce sont ces actions qui détermineront , par leur application dans l' environnement , les nouvelles entrées perceptives de l' agent . Ces dernières illustrent une action « avance » qui est codée en ( 1 , 1 ) , une action de « quart de tour à gauche » [ 13 ] ( 1 , 0 ) , une action de « quart de tour à droite » ( 1 , 0 ) , une action de « quart de tour à droite » [ 14 ] ( 0 , 1 ) et « ne rien faire » ( 0 , 0 ) . Afin de simplifier l' appellation des actions de quart de tour à gauche ou à droite , nous parlerons d' action gauche et d' action droite . ( 0 , 1 ) et « ne rien faire » ( 0 , 0 ) . Afin de simplifier l' appellation des actions de quart de tour à gauche ou à droite , nous parlerons d' action gauche et d' action droite . Figure 11 : Architecture du réseau de neurone écologique simulant l' agent démonstrateur Apprentissage de l' agent démonstrateur L' objectif de l' apprentissage des agents démonstrateurs est d' acquérir la capacité à se déplacer d' un point de départ jusqu'à une cible . Ceci résulte de la convergence de la matrice de poids vers une solution stable permettant l' approximation efficace d' une fonction liant les entrées perceptives aux sorties motrices . L' apprentissage se déroule de la même façon pour chaque itération d' apprentissage qui correspond à la réalisation du déplacement du point de départ jusqu'à la cible . A chaque action , l' agent reçoit en entrée les informations perceptives et produit en sortie une proposition d' action . Les entrées perceptives codent la distance et l' angle séparant l' agent de la cible , elles sont calculées et fournies par l' environnement . L' action proposée en sortie résulte de la pondération de l' activité des unités par les poids de connexions ( tant que les poids n' ont pas été adaptés à la réalisation de la tâche ces valeurs sont aléatoires ) . Afin d' adapter les poids , nous utilisons la règle de rétropropagation du gradient descendant de l' erreur . Cette erreur est évaluée en comparant les valeurs de sortie ( proposée par l' agent démonstrateur en réponse aux entrées que lui fournit l' environnement ) aux valeurs attendues pour cette situation . Les valeurs attendues ( ou contrainte d' apprentissage ) sont déterminées par l' algorithme d' application de la règle de l' angle qui permet d' approximer la trajectoire idéale , illustrée sur le graphique 1 , représentant la diagonale entre le point de départ et la cible . Graphique 1 : Représentation graphique de la trajectoire idéale , résultant de l' application systématique de la règle de l' angle entre le point ( 1 , 1 ) de départ et la cible ( 10 , 10 ) . Cette règle de l' angle définit une action gauche pour tout angle inférieur ou égal à & 226;& 128;& 147; 45 ° , une action avance pour un angle compris entre & 226;& 128;& 147; 45 ° et 45 ° ( inclus ) et une action droite pour tout angle supérieur à 45 °. Une fois l' erreur évaluée et rétropropagée , l' agent démonstrateur se déplace dans l' environnement suivant l' action évaluée comme étant la plus efficace . Il atteint ainsi une nouvelle position où l' environnement lui fournit les nouvelles entrées perceptives . L' agent propose alors une nouvelle action en sortie et ceci est reproduit jusqu'à ce qu' il atteigne la cible . L' apprentissage s' effectue par incrémentation , en ce sens qu' à chaque action , l' évaluation de l' erreur entre action produite et action la plus efficiente est rétropropagée . 2.2.2 . Implémentation de l' agent observateur support de l' apprentissage par observation L' agent observateur est généré à partir de l' architecture présentée pour OLEANNet , toutefois , elle intègre plus spécifiquement les contraintes liées à l' apprentissage par observation d' une tâche d' atteinte de cible . Comme illustrée par la figure 12 , un agent observateur est implémenté par un modèle OLEANNet composé de quatre couches d' unités : une couche d' entrée , deux couches cachées , une couche de sortie . La couche d' entrée se compose de six unités recevant les informations relatives à la position des agents et de la cible dans l' environnement . Ces informations concernent les positions de la cible par rapport à l' agent démonstrateur et à l' agent observateur , ainsi que la position de l' agent démonstrateur par rapport à l' agent observateur . La couche de sortie se décompose en une première sous-couche de deux unités simulant les sorties cognitives , la deuxième contient deux unités simulant les sorties motrices . Figure 12 : Architecture d' OLEANNet adaptée à l' apprentissage par observation d' une habileté motrice par un agent observateur Enfin , OLEANNet contient deux couches cachées de vingt cinq unités chacune . Ces deux couches sont nécessaires pour obtenir une stabilité des performances entre les agents . Notre objectif n' était pas déterminer une architecture optimisée pour résoudre la tâche , mais de générer une population d' agents capables d' apprendre la tâche . D' autres configurations de couches cachées ( variation du nombre de couches et du nombre d' unités par couches ) ont été préalablement testées et nous ont amené à identifier cette architecture à deux couches cachées de vingt cinq unités comme étant la plus adaptée . Codage des informations d' entrée et de sortie Le codage des positions relatives des objets présents dans l' environnement est réalisé sur les six unités d' entrée selon les valeurs des distances et des angles entre les agents orientés et entre eux et la cible . Ces valeurs appartiennent à l' intervalle [ 0 ; + Le codage des positions relatives des objets présents dans l' environnement est réalisé sur les six unités d' entrée selon les valeurs des distances et des angles entre les agents orientés et entre eux et la cible . Ces valeurs appartiennent à l' intervalle [ 0 ; + & 239;& 130;& 165;& 239;& 130;& 165; [ pour la distance et ] & 226;& 128;& 147; 180 ° et + 180 ° ] pour l' angle . [ pour la distance et ] & 226;& 128;& 147; 180 ° et + 180 ° ] pour l' angle . Les unités de sortie codent les mêmes actions que celles proposées par de l' agent démonstrateur : une action avance ( 1 , 1 ) , une action droite ( 0 , 1 ) , une action gauche ( 1 , 0 ) et ne rien faire ( 0 , 0 ) . De la même façon que pour l' agent démonstrateur les actions gauche et droite correspondent à un pivotement et non à un déplacement . Nous obtenons ainsi un agent dont l' illustration est proposée en figure 13 . Figure 13 : Détail de l' architecture d' un agent observateur type OLEANNet Détail des fonctions de transfert utilisées et des paramètres d' apprentissage Nous détaillons dans ce paragraphe les fonctions utilisées dans le réseau de neurones . Comme nous l' avons exposé en introduction , les valeurs d' activation des unités sont propagées à l' intérieur du réseau selon des fonctions particulières intégrant une pondération par les poids et une valeur de sortie de chaque unité calculée par une fonction de transfert . L' activation qui arrive sur une unité du réseau correspond à la somme pondérée des activations de sortie des unités précédente par les valeurs de poids de connexion , selon l' équation qui suit pour laquelle aL'activation qui arrive sur une unité du réseau correspond à la somme pondérée des activations de sortie des unités précédente par les valeurs de poids de connexion , selon l' équation qui suit pour laquelle aii correspond à l' activation totale arrivant à l' unité , s correspond à l' activation totale arrivant à l' unité , sii à l' activation obtenue en sortie de chacune des unités précédentes , w à l' activation obtenue en sortie de chacune des unités précédentes , wijij aux poids des connexions entre les unités j et i . aux poids des connexions entre les unités j et i . ai = & 239;& 129;& 147;& 239;& 129;& 147; ( si . Wij ) Les valeurs d' activation de sortie des unités d' entrée sont soumises à une fonction de transfert tangente sigmoïde ( afin de maintenir des valeurs entre [ - 1 ; 1 ] ) . si = tansig ( ai ) n = 2 / ( 1 + exp ( - 2 * n ) ) - 1 Les valeurs d' activation de sortie des unités des deux couches cachées et celles des unités des deux sous-couches de sorties sont soumises à fonction de transfert logarithme sigmoïde ( afin de maintenir des valeurs entre [ 0 ; 1 ] ) . si = logsig ( ai ) logsig ( n ) = 1 / ( 1 + exp ( -n ) ) Règle de rétropropagation du gradient descendant de l' erreur Wk + 1 = Wk-& 239;& 129;& 161;& 239;& 129;& 161;gkC ( Wt ) où , W représente la matrice de poids , & 239;& 129;& 161;& 239;& 129;& 161; le coefficient ( ou pas ) d' apprentissage , gk représente le gradient de la fonction de coût par rapport aux poids W et C la valeur de coût . Nous fixons le pas d' apprentissage à 0.2 Itération d' apprentissage : nous considérons qu' une itération d' apprentissage correspond à la mémorisation ( ou production , selon la phase ) de la trajectoire complète . L' adaptation des poids de connexion est effectuée pour chacune des actions de la trajectoire . Cette adaptation est répétée 500 fois à chaque action. : nous considérons qu' une itération d' apprentissage correspond à la mémorisation ( ou production , selon la phase ) de la trajectoire complète . L' adaptation des poids de connexion est effectuée pour chacune des actions de la trajectoire . Cette adaptation est répétée 500 fois à chaque action . Apprentissage de l' agent observateur L' apprentissage de l' agent observateur est régi par les phases d' acquisition et de production exposées pour le fonctionnement d' OLEANNet . Pendant la phase d' acquisition , l' agent observateur , tout en restant inactif , observe et mémorise la démonstration de la trajectoire proposée par l' agent démonstrateur . Tandis qu' à l' inverse , pendant la phase de production , l' agent démonstrateur est inactif et l' agent observateur apprend à reproduire la trajectoire observée . Plus précisément , l' apprentissage de l' agent observateur pendant ces deux phases se déroule de la façon suivante : Phase d' acquisition Au cours de cette phase , l' agent observateur observe la trajectoire réalisée par l' agent démonstrateur et la mémorise sous forme de représentation distribuée . Pour cela , il est soumis à un apprentissage supervisé par les actions du démonstrateur . A chacune des actions émises par l' agent démonstrateur , l' agent observateur perçoit en entrée les informations relatives aux positionnements des objets dans l' environnement et fait une proposition d' action au niveau de la sortie cognitive . Cette proposition d' action est comparée à celle effectivement réalisée par l' agent démonstrateur et l' erreur évaluée est rétropropagée sur les poids de connexions . Ce procédé est renouvelé jusqu'à ce que l' agent démonstrateur ait atteint la cible . Ainsi , l' agent observateur mémorise l' intégralité de la trajectoire observée . Phase de production Cette phase correspond à la production effective d' un comportement moteur permettant à l' agent observateur de se déplacer d' un point de départ équivalent à celui observé jusqu'à la cible . L' agent observateur est placé sur la position de départ de la trajectoire produite par l' agent démonstrateur . Il reçoit les informations perceptives en entrée et propose simultanément une réponse sur la sortie cognitive et sur la sortie motrice . Cela revient à utiliser la représentation construite en phase d' acquisition pour produire une réponse en sortie cognitive . Cette réponse correspond au souvenir de ce qui a été fait par l' agent démonstrateur dans la même situation , et elle est utilisée pour ajuster la proposition d' action motrice produite en sortie motrice . L' apprentissage résulte de l' adaptation des matrices de poids en fonction des écarts observés entre la proposition d' action motrice faite sur la sortie motrice et l' action émergeant de l' utilisation de la représentation sur la sortie cognitive . L' agent observateur se déplace alors selon l' action mémorisée et reçoit les nouvelles informations perceptives en entrée . Le procédé d' adaptation de la réponse motrice à la réponse cognitive est renouvelé jusqu'à ce que l' agent observateur atteigne la cible . Remarque technique Afin de suppléer au problème de l' oubli catastrophique rencontré lors des premiers essais du modèle , nous optons pour une solution permettant de maintenir les critères de définitions que nous nous étions fixés lors de la conception du modèle OLEANNet . Nous souhaitions utiliser un seul espace de mémoire pour mémoriser le comportement observé , et induire la production du comportement . Cependant , les contraintes techniques des réseaux de neurones nous ont conduit à copier la matrice de poids afin de pallier l' oubli catastrophique . L' oubli catastrophique se manifeste lorsque la phase de production prend place sur le réseau adapté en phase d' acquisition . En effet , les matrices de poids sont remises à jour en fonction des erreurs évaluées entre actions motrices proposées et actions cognitives réactivées , si bien que nous perdons alors la représentation adaptée construite pendant la phase d' acquisition . Par conséquent , les sorties cognitives suivantes sont affectées par cet apprentissage qui les rend inadéquates à la résolution de la tâche . Nous optons donc pour une solution simple selon laquelle , la phase de production intervient sur une copie de la matrice obtenue après la phase d' acquisition . Ainsi , cette dernière n' est pas modifiée et conserve toujours la même structure de poids , donc la même représentation de la tâche . Cela ne change en rien la réflexion liée au fonctionnement d' OLEANNet , puisque ce n' est qu' une solution technique de maintien de la résolution de la tâche . 2.3 . Simulation 1 Nous avons testé dans cette première simulation la fiabilité d' OLEANNet quant à sa capacité à répliquer le phénomène d' apprentissage par observation . Pour cela , nous avons vérifié sur une population d' agents observateurs que leur fonctionnement et leurs composantes architecturales répondaient aux exigences des phases identifiées par la théorie de Bandura ( 1986 ) . Tout comme le suggère cette théorie , lorsqu' un individu est confronté à un comportement inconnu , il n' est pas en mesure de le reproduire tant qu' il n' a pas été soumis à l' apprentissage par observation . Cela se traduit chez les agents observateurs par l' inadaptation des matrices de poids à émettre un comportement adapté avant l' apprentissage par observation . Selon Deakin et Proteau ( 2002 ) , la phase d' acquisition n' est à seule pas suffisante pour rendre la représentation fonctionnelle , donc l' individu n' est pas capable d' émettre un comportement adapté malgré une représentation de la tâche correctement mémorisée . Selon notre conception du fonctionnement d' OLEANNet , les agents observateurs ne peuvent émettre un comportement adapté en sortie motrice suite à la seule phase d' acquisition , puisque ces sorties n' ont pas été soumises à l' apprentissage . Nous vérifierons par ailleurs , que la représentation mémorisée pendant cette phase est similaire au comportement observé puisqu' elle a été adaptée en fonction de la démonstration observée . Selon la théorie de l' apprentissage par observation , l' individu ne peut reproduire un comportement observé que si il a été soumis à l' ensemble des phases d' acquisition et de production . D' après le fonctionnement d' OLEANNet que nous proposons , les agents observateurs devraient être capables de produire un déplacement jusqu'à la cible après que les phases d' acquisition et de production aient été réalisées , puisque les sorties motrices auront été adaptées en fonction des sorties cognitives . Les agents observateurs ne devraient donc pas posséder de compétence de déplacement jusqu'à la cible suite à la seule phase d' acquisition , en revanche , ils devraient produire un déplacement efficace après avoir suivi l' ensemble des phases d' acquisition et de production . Méthode Population Quatorze agents observateurs ont été générés à partir de l' architecture d' OLEANNet , adaptée à l' apprentissage par observation d' une habileté motrice . Ils possédaient tous la même architecture et les mêmes fonctions , néanmoins , ils se différenciaient par les valeurs des poids de connexion attribuées aléatoirement avant l' apprentissage par observation . Tâche La tâche des agents observateurs consistait à observer la trajectoire proposée par un agent démonstrateur entre un point de départ et une cible , puis à la reproduire . Pour obtenir la démonstration , l' agent démonstrateur était placé en position ( 1 , 1 , 1 ) et la cible en position ( 10 , 10 , non orientée ) , et il était soumis à vingt cinq itérations d' apprentissageLa tâche des agents observateurs consistait à observer la trajectoire proposée par un agent démonstrateur entre un point de départ et une cible , puis à la reproduire . Pour obtenir la démonstration , l' agent démonstrateur était placé en position ( 1 , 1 , 1 ) et la cible en position ( 10 , 10 , non orientée ) , et il était soumis à vingt cinq itérations d' apprentissage [ 15 ] de l' application de la règle de l' angle ( 25 itérations avec 500 adaptations des poids à chaque pas ) . Nous avons obtenu en simulation de l' application de la règle de l' angle ( 25 itérations avec 500 adaptations des poids à chaque pas ) . Nous avons obtenu en simulation [ 16 ] , une trajectoire reportée sur le graphique 2 qui illustre l' apprentissage de la règle par l' agent démonstrateur . Cette trajectoire est appelée la démonstration illustrative de la règle , en ce sens qu' elle respecte la règle de l' angle pour la moitié des actions . Elle propose cinq actions droites , quatre actions gauches et dix huit actions avance ; soit vingt sept actions au total. , une trajectoire reportée sur le graphique 2 qui illustre l' apprentissage de la règle par l' agent démonstrateur . Cette trajectoire est appelée la démonstration illustrative de la règle , en ce sens qu' elle respecte la règle de l' angle pour la moitié des actions . Elle propose cinq actions droites , quatre actions gauches et dix huit actions avance ; soit vingt sept actions au total . Graphique 2 : Trajectoire représentative du déplacement de l' agent démonstrateur utilisée pour la démonstration illustrative de la règle de l' angle Procédure Afin de déterminer les capacités de déplacement des agents observateurs nous les avons soumis à trois vérifications faisant suite aux phases de l' apprentissage par observation . La première vérification consistait à tester la capacité des agents observateurs avant les phases d' acquisition et de production . Pour cela , les agents observateurs étaient placés en position ( 1 , 1 , 1 ) et laisser libre de produire un comportement . La simulation du déplacement de chacun des agents observateurs avant l' apprentissage , c' est-à-dire suite à l' initialisation des poids de connexion ( tirage aléatoire de valeurs ) , permet d' identifier les actions produites par chacun pour des matrices de poids aléatoires et différentes . Cela correspond au répertoire comportemental de base de l' agent observateur , c' est-à-dire aux actions élémentaires dont il dispose avant et sans apprentissage de la tâche . Ce test permettait de vérifier que l' observateur est effectivement incapable de réaliser un déplacement jusqu'à la cible lorsque l' apprentissage par observation n' a pas encore eu lieu . La deuxième vérification prenait place suite à la phase d' acquisition pour laquelle l' agent observateur était placé en position ( 1 , 1 , 1 ) et observait la trajectoire produite par l' agent démonstrateur . La phase d' acquisition consistait en 25 itérations d' apprentissage de la démonstration . Plus précisément , les agents observateurs observaient 25 fois la démonstration et adaptaient 500 fois à chaque action leurs matrices de poids . Ce choix de 25 itérations provient de tests préalables ayant permis d' identifier cette situation d' apprentissage comme la plus efficace en terme de stabilité de l' apprentissage . Suite à cela , l' agent observateur était placé en position ( 1 , 1 , 1 ) et la simulation du déplacement indiquait si la phase d' acquisition était suffisante , à elle seule , pour générer une solution efficace dans la production effective du déplacement . De plus , elle permettait d' évaluer la représentation mémorisée . La simulation permettait donc d' attester de l' incapacité des agents à se déplacer effectivement jusqu'à la cible dans la mesure où les poids relatifs aux sorties motrices n' étaient pas modifiés par la phase d' acquisition ( test des actions produites en sortie motrice ) , et de tester le déplacement mémorisé ( test des actions produites en sortie cognitive ) . La dernière vérification intervenait suite à l' ensemble des phases d' acquisition et de production . Après la phase d' acquisition , les agents observateurs étaient soumis à la phase de production . Ils reproduisaient 25 fois ( nombre optimal d' itérations nécessaires avec 500 adaptations des poids à chaque pas ) le déplacement mémorisé , et ce , depuis leur position de départ ( 1 , 1 , 1 ) jusqu'à la cible . Cela conduisait à la mise en oeuvre du comportement moteur et son ajustement par rapport à celui mémorisé pendant la phase d' acquisition . La simulation du déplacement testait alors la capacité des agents observateurs à réaliser effectivement le déplacement observé . Pour chacune de ces vérifications , nous avons calculé la quantité d' agents observateurs produisant un déplacement efficace . Ce dernier étant défini comme la capacité des agents à se déplacer du point de départ jusqu'à la cible lorsqu' ils sont en situation d' action dans l' environnement . Résultats Vérification avant apprentissage par observation Les résultats de la simulation du déplacement de chacun des agents observateurs avant les phases d' acquisition et production indiquent qu' aucune des matrices de poids de départ ne permet un déplacement efficace jusqu'à la cible . Comme attendu , les agents observateurs sont initialement incapables de produire un comportement de déplacement jusqu'à la cible . En d' autres termes , ils ne disposent pas des compétences nécessaires à la réalisation de la tâche . Les agents observateurs ne produisent qu' un type de réponse motrice : une action avance ou une action droite ou encore une action gauche . De plus , nous relevons que tous les agents observateurs ne proposent pas le même type d' action ; ils possèdent donc des répertoires comportementaux de base différents . Vérification suite à la phase d' acquisition La simulation du déplacement réalisé par les agents observateurs suite à la seule phase d' acquisition indique , comme attendu , qu' ils sont incapables de se déplacer jusqu'à la cible . Aucun des agents observateurs ne produit au niveau des sorties motrices des actions lui permettant d' atteindre la cible . Néanmoins , nous pouvons noter que la phase d' acquisition influence la réponse produite en sortie motrice . Par exemple , si l' action produite avant apprentissage par observation était une action « gauche » , elle devient « avance » après la phase d' acquisition . Il s' ensuit , malgré cette modification , que l' agent observateur est incapable de produire une trajectoire satisfaisante . Le test des actions produites en sortie cognitive soutient qu' ils ont pourtant mémorisé une trajectoire permettant le déplacement du point de départ jusqu'à la cible . On peut donc attester que l' agent observateur dispose d' une représentation correcte du déplacement mais que cette seule connaissance ne lui permet pas de réaliser effectivement le déplacement jusqu'à la cible . Vérification suite aux phases d' acquisition et de production La simulation du déplacement suite aux phases d' acquisition et de production indique que 9 agents sur 14 ( soit 64 , 3 % ) atteignent la cible . Lorsqu' ils sont soumis à l' ensemble des phases d' apprentissage par observation , les agents observateurs acquièrent la capacité à se déplacer du point de départ jusqu'à la cible . Cette capacité résulte d' une part de la construction satisfaisante de la représentation du déplacement en phase d' acquisition , d' autre part de l' utilisation efficace de cette représentation comme guide d' ajustement du comportement en phase de production . La représentation distribuée , construite au cours de la phase d' acquisition , sert de guide à la production . En effet , elle permet à l' agent observateur de contraindre efficacement , par l' action rappelée , les actions qu' il produit en phase de production . Ainsi , les agents observateurs sont capables de produire un déplacement efficace jusqu'à la cible , à partir de l' observation d' une démonstration proposée par un agent démonstrateur dont un exemple est proposé graphique 3 . Graphique 3 : Exemple d' une trajectoire du point de départ ( 1 , 1 ) jusqu'à la cible ( 10 , 10 ) proposée par un agent observateur suite à l' ensemble des phases d' acquisition et de production ( graphique de gauche ) par rapport à la trajectoire observée ( graphique de droite ) . Discussion L' objectif de cette première simulation était de tester la fiabilité du fonctionnement d' OLEANNet à répliquer le phénomène d' apprentissage par observation . Selon Bandura ( 1986 ) , cet apprentissage est sous-tendu par deux phases induisant l' élaboration d' une représentation cognitive du comportement observé ( phase d' acquisition ) , et l' utilisation de cette représentation comme guide d' ajustement du comportement effectivement produit ( phase de production ) . Nous supposions dès lors que les agents observateurs ne présenteraient des capacités de déplacement d' un point de départ jusqu'à une cible qu' après avoir été soumis à l' ensemble de ces deux phases . Conformément à cette hypothèse , l' initialisation des matrices de poids nous permet d' observer que les agents observateurs ne disposent pas de compétence de base à se déplacer efficacement jusqu'à la cible . Cette initialisation traduit bien qu' aucune connaissance adaptée à la réalisation d' une tâche inconnue n' émerge préalablement à l' apprentissage par observation . Les agents observateurs ne possèdent qu' un répertoire comportemental rudimentaire composé d' un seul type d' action . La position de départ étant en Pendant la phase d' acquisition , les agents observateurs observaient le déplacement de l' agent démonstrateur et le mémorisaient . Pour cela , ils produisaient en sortie cognitive une proposition d' action et la comparaient à celle produite par l' agent démonstrateur . L' erreur évaluée entre ces actions était rétropropagée , et ceci pour chacune des actions produites par l' agent démonstrateur au cours de son déplacement jusqu'à la cible . Le test des actions émises par les agents observateurs en sortie cognitive suite à cette phase indiquait qu' ils avaient mémorisé correctement le déplacement . Néanmoins , comme le suggère la théorie ils étaient incapables de produire effectivement un déplacement . Cela se traduisait par leur incapacité à atteindre la cible à partir de leur position de départ . Cette phase est donc nécessaire à la construction d' une représentation adéquate du déplacement observé , cependant elle n' améliore pas à elle seule la capacité de déplacement des agents observateurs . Ce résultat va dans le sens de ceux obtenus par Deakin et Proteau ( 2000 ) montrant l' incapacité des sujets à utiliser la représentation cognitive en l' absence de la phase de production . Par ailleurs , comme le suggère Bandura ( 1986 ) par le processus de Par ailleurs , comme le suggère Bandura ( 1986 ) par le processus de conception-matching , la représentation construite en phase d' acquisition sert de guide d' ajustement lors de la phase de production . Dans le cadre de notre modèle , nous avons implémenté ce processus sous la forme d' une boucle de rétro-action entre les sorties cognitives et motrices . Cette boucle permet de rétropropager l' erreur évaluée entre les sorties motrice et cognitive pour les mêmes informations perçues en entrée . Ce processus apparaît indispensable aux agents observateurs pour acquérir la capacité à se déplacer efficacement . En effet , la simulation du déplacement suite à l' ensemble des phases nous permet d' observer qu' en contraignant l' apprentissage sur les sorties motrices par la réponse cognitive réactivée , les agents sont alors capables de produire dans plus de 60 % des cas un déplacement efficace. , la représentation construite en phase d' acquisition sert de guide d' ajustement lors de la phase de production . Dans le cadre de notre modèle , nous avons implémenté ce processus sous la forme d' une boucle de rétro-action entre les sorties cognitives et motrices . Cette boucle permet de rétropropager l' erreur évaluée entre les sorties motrice et cognitive pour les mêmes informations perçues en entrée . Ce processus apparaît indispensable aux agents observateurs pour acquérir la capacité à se déplacer efficacement . En effet , la simulation du déplacement suite à l' ensemble des phases nous permet d' observer qu' en contraignant l' apprentissage sur les sorties motrices par la réponse cognitive réactivée , les agents sont alors capables de produire dans plus de 60 % des cas un déplacement efficace . Ces résultats suggèrent qu' OLEANNet est fiable quant à sa capacité à répliquer le phénomène d' apprentissage par observation , puisque sans la combinaison des deux phases les agents observateurs sont incapables de se déplacer efficacement . Les modalités de fonctionnement et l' architecture utilisés simulent correctement les phases suggérées dans la théorie de l' apprentissage par observation . Sur la base des résultats relevés suite à chaque phase , nous pouvons considérer qu' OLEANNet constitue bien une implémentation possible de la théorie de l' apprentissage par observation telle qu' elle est définie par Bandura ( 1986 ) . Bien que cette première simulation soutienne l' architecture et le fonctionnement définis pour OLEANNet , elle ne renseigne pas sur la forme de l' apprentissage . Pour tester cela , nous conduisons une deuxième simulation qui nous permettra de déterminer si des différences de performances apparaissent suite à des apprentissages différents . Si c' est effectivement le cas , nous pourrons avancer qu' OLEANNet n' est pas un simple outil mathématique trouvant une solution unique à la résolution de la tâche . 2.4 . Simulation 2 L' objectif de cette simulation était de vérifier l' émergence de performances différenciées en fonction du type d' apprentissage auxquels les agents observateurs étaient soumis . Ceci contribue à la validation du modèle , en ce sens qu' il est indispensable qu' OLEANNet ne présente pas de saturation d' apprentissage ; c' est-à-dire que les agents observateurs n' émettent pas des réponses équivalentes en toutes circonstances . Si aucune différence n' apparaissait nous serions confrontés à un modèle optimisé pour la résolution de la tâche . Afin de tester la résultante de l' apprentissage par observation , nous avons conduit sur une même population d' agent deux conditions d' apprentissage se différenciant selon la démonstration proposée ( illustrative vs peu illustrative ) . Les agents observateurs devraient présenter des capacités de déplacement différentes selon qu' ils aient été soumis à une démonstration illustrative de la règle sous-jacente à l' apprentissage de l' agent démonstrateur ou à une démonstration peu illustrative de cette règle . Méthode Participants Quinze agents observateurs ont été générés pour cette simulation . Ils ont été utilisés en parallèle dans chacune des conditions expérimentales : le même agent avec la même matrice de poids de départ ( valeurs tirées aléatoirement ) est utilisé dans chacune des conditions . Ainsi , l' apprentissage n' est pas affecté d' une condition à l' autre puisque celui -ci intervient sur la matrice de poids de Quinze agents observateurs ont été générés pour cette simulation . Ils ont été utilisés en parallèle dans chacune des conditions expérimentales : le même agent avec la même matrice de poids de départ ( valeurs tirées aléatoirement ) est utilisé dans chacune des conditions . Ainsi , l' apprentissage n' est pas affecté d' une condition à l' autre puisque celui -ci intervient sur la matrice de poids de départ . Cette utilisation en parallèle revient à créer deux groupes expérimentaux indépendants Cette utilisation en parallèle revient à créer deux groupes expérimentaux indépendants Tâche et procédure Les agents observateurs ont été soumis à l' apprentissage par observation du déplacement d' un point de départ à une cible selon deux trajectoires différentes décrites ci-après . Ces trajectoires étaient obtenues suite à la création de deux agents démonstrateurs soumis à deux conditions d' apprentissage variant selon le nombre d' itérations d' apprentissage autorisées . Cela permettait de créer deux agents démonstrateurs disposant de capacités différenciées de déplacement se traduisant par la production de trajectoiresLes agents observateurs ont été soumis à l' apprentissage par observation du déplacement d' un point de départ à une cible selon deux trajectoires différentes décrites ci-après . Ces trajectoires étaient obtenues suite à la création de deux agents démonstrateurs soumis à deux conditions d' apprentissage variant selon le nombre d' itérations d' apprentissage autorisées . Cela permettait de créer deux agents démonstrateurs disposant de capacités différenciées de déplacement se traduisant par la production de trajectoires [ 17 ] différentes entre le point de départ et la cible . différentes entre le point de départ et la cible . Description des trajectoires utilisées en démonstration Le premier agent démonstrateur était placé en position ( 1 , 1 , 1 ) et la cible en position ( 10 , 10 , non orientée ) . Il était soumis à vingt cinq itérations d' apprentissageLe premier agent démonstrateur était placé en position ( 1 , 1 , 1 ) et la cible en position ( 10 , 10 , non orientée ) . Il était soumis à vingt cinq itérations d' apprentissage [ 18 ] de l' application de la règle de l' angle . Rappelons que cette règle définit une action gauche pour tout angle inférieur ou égal à & 226;& 128;& 147; 45 ° , une action avance pour un angle compris entre & 226;& 128;& 147; 45 ° et 45 ° ( inclus ) et une action droite pour tout angle supérieur à 45 . La trajectoire obtenue , illustrée graphique 4 , comportait neuf changements de direction et dix huit actions avance . Cette trajectoire est utilisée pour la condition de démonstration illustrative puisqu' elle respecte la règle de l' angle pour moitié des actions . de l' application de la règle de l' angle . Rappelons que cette règle définit une action gauche pour tout angle inférieur ou égal à & 226;& 128;& 147; 45 ° , une action avance pour un angle compris entre & 226;& 128;& 147; 45 ° et 45 ° ( inclus ) et une action droite pour tout angle supérieur à 45 . La trajectoire obtenue , illustrée graphique 4 , comportait neuf changements de direction et dix huit actions avance . Cette trajectoire est utilisée pour la condition de démonstration illustrative puisqu' elle respecte la règle de l' angle pour moitié des actions . Graphique 4 : Trajectoire illustrative de la règle de l' angle proposée en démonstration par le premier agent démonstrateur Le second agent démonstrateur était placé en position ( 1 , 1 , 1 ) et la cible en position ( 10 , 10 , non orientée ) , il était soumis à quinze itérations d' apprentissage de l' application de la règle de l' angle . Nous avons obtenu en simulation une trajectoire reportée sur le graphique 5 ( page suivante ) illustrant l' apprentissage imparfait de la règle . Le déplacement ne respectant pas pour chaque position la règle de l' angle , nous utiliserons cette trajectoire pour la condition de démonstration peu illustrative de le règle . Elle intégrait trois actions « droite » , trois actions « gauche » et dix huit actions « avance » soit un total de vingt quatre actions . Graphique 5 : Trajectoire peu illustrative de la règle de l' angle proposée en démonstration par le second agent démonstrateur Paramètres d' apprentissage des agents observateurs L' apprentissage par observation des agents observateurs respectait les phases testées dans la simulation 1 . Les agents observateurs étaient soumis à 25 itérations d' apprentissage en phase d' acquisition pour laquelle ils étaient placés en position ( 1 , 1 , 1 ) , et étaient autorisés à reproduire 25 fois la trajectoire en phase de production à partir de la position ( 1 , 1 , 1 ) . Mesure Le type de démonstration observé devrait influencer la construction de la représentation en phase d' acquisition ainsi que la production effective du comportement puisque celui -ci dépend de la représentation mémorisée . Pour en rendre compte , la capacité de déplacement était évaluée à deux niveaux : le premier niveau correspondait à la simulation du déplacement au niveau de la sortie cognitive suite à la phase d' acquisition , ce qui permet d' évaluer la différence entre trajectoire observée et trajectoire mémorisée ( cette évaluation sera nommée le premier niveau correspondait à la simulation du déplacement au niveau de la sortie cognitive suite à la phase d' acquisition , ce qui permet d' évaluer la différence entre trajectoire observée et trajectoire mémorisée ( cette évaluation sera nommée mémorisation ) . ) . le second niveau référait à la simulation du déplacement sur la sortie motrice suite à l' ensemble des phases d' acquisition et de production , c' est-à-dire tester la production effective du déplacement . Cela permet d' évaluer la différence entre trajectoire produite et trajectoire observée ( cette évaluation sera nommée le second niveau référait à la simulation du déplacement sur la sortie motrice suite à l' ensemble des phases d' acquisition et de production , c' est-à-dire tester la production effective du déplacement . Cela permet d' évaluer la différence entre trajectoire produite et trajectoire observée ( cette évaluation sera nommée production ) . ) . Trois indicateurs ont été utilisés pour mesurer la capacité de déplacement : - la distance euclidienne entre trajectoires mémorisée et observée ( pour la mémorisation ) , - la distance euclidienne entre la trajectoire produite et celle observée ( pour la production ) , nb : chacune de ces distances a été calculée par la moyenne des distances entre chaque point des trajectoires comparées ( incluant les positions de changement de direction ) . Plus la distance est faible et plus les trajectoires sont proches l' une de l' autre . - le nombre de changements de direction réalisé par les agents observateurs au cours du déplacement jusqu'à la cible . Résultats Le traitement des résultats porte sur les données recueillies auprès des 10 agents observateurs ayant réussi à atteindre la cible dans chacune des conditions expérimentales . Les données obtenues auprès des 10 agents observateurs sont soumises à une analyse de variance selon le plan factoriel 2 ( type de démonstration observé ) * 2 ( niveau d' évaluation ) . Les données relatives aux agents n' ayant pas réussi la tâche sont exclues de l' analyse afin d' identifier spécifiquement l' influence de la démonstration sur l' apprentissage . Distance entre trajectoires Nous observons un effet principal du type de démonstration sur le niveau d' évaluation , Nous observons un effet principal du type de démonstration sur le niveau d' évaluation , F ( 1 , 18 ) = 10.48 , ( 1 , 18 ) = 10.48 , p < . 01 . La distance moyenne entre trajectoires est plus faible pour la démonstration illustrative ( < . 01 . La distance moyenne entre trajectoires est plus faible pour la démonstration illustrative ( M = 1.17 ) que pour la démonstration peu illustrative ( = 1.17 ) que pour la démonstration peu illustrative ( M = 1.52 ) . En d' autres termes , l' apprentissage de la trajectoire observée est de meilleure qualité lorsque la démonstration est illustrative de la règle de l' angle. = 1.52 ) . En d' autres termes , l' apprentissage de la trajectoire observée est de meilleure qualité lorsque la démonstration est illustrative de la règle de l' angle . Plus spécifiquement , nous relevons un effet simple de la démonstration sur le niveau de mémorisation , c' est-à-dire au niveau la représentation élaborée en phase d' acquisition , Plus spécifiquement , nous relevons un effet simple de la démonstration sur le niveau de mémorisation , c' est-à-dire au niveau la représentation élaborée en phase d' acquisition , F ( 1 , 18 ) = 12.68 , ( 1 , 18 ) = 12.68 , p < . 01 . La représentation construite au cours de la phase d' acquisition est plus proche de la trajectoire observée lorsque la démonstration est illustrative ( < . 01 . La représentation construite au cours de la phase d' acquisition est plus proche de la trajectoire observée lorsque la démonstration est illustrative ( M = 1.02 ) en comparaison de celle peu illustrative ( 1.02 ) en comparaison de celle peu illustrative ( M = 1.50 ) . Cependant , aucun effet de la démonstration n' apparaît sur le niveau de production , 1.50 ) . Cependant , aucun effet de la démonstration n' apparaît sur le niveau de production , F ( 1 , 18 ) = 3.27 , NS . Les résultats indiquent que la performance réalisée en production est équivalente pour la démonstration illustrative ( 1 , 18 ) = 3.27 , NS . Les résultats indiquent que la performance réalisée en production est équivalente pour la démonstration illustrative ( M = 1.32 ) et pour la démonstration peu illustrative ( 1.32 ) et pour la démonstration peu illustrative ( M = 1.54 ) . Il semble que la production effective du comportement n' est donc pas influencée par le type de démonstration observé. = 1.54 ) . Il semble que la production effective du comportement n' est donc pas influencée par le type de démonstration observé . Un effet principal du niveau d' évaluation est mis en évidence par l' analyse de variance , Un effet principal du niveau d' évaluation est mis en évidence par l' analyse de variance , F ( 1 , 18 ) = 6.43 , ( 1 , 18 ) = 6.43 , p < . 05 . La distance moyenne obtenue est plus faible pour le niveau de mémorisation ( < . 05 . La distance moyenne obtenue est plus faible pour le niveau de mémorisation ( M = 1.26 ) que celle du niveau de production ( 1.26 ) que celle du niveau de production ( M = 1.43 ) . Cela indique que les agents observateurs mémorisent une trajectoire plus proche de celle observée que ne l' est la trajectoire effectivement produite . 1.43 ) . Cela indique que les agents observateurs mémorisent une trajectoire plus proche de celle observée que ne l' est la trajectoire effectivement produite . Lorsque nous nous intéressons aux effets simples du niveau d' évaluation sur chacune des démonstrations , nous observons que la détérioration de la performance est présente entre la mémorisation ( Lorsque nous nous intéressons aux effets simples du niveau d' évaluation sur chacune des démonstrations , nous observons que la détérioration de la performance est présente entre la mémorisation ( M = 1.02 ) et la production ( 1.02 ) et la production ( M = 1.32 ) pour le cas de l' observation d' une démonstration illustrative , ( 1.32 ) pour le cas de l' observation d' une démonstration illustrative , ( F ( 1 , 18 ) = 10.30 , ( 1 , 18 ) = 10.30 , p < . 01 ) . En revanche , cet effet n' apparaît pas lorsque les agents sont soumis à l' observation d' une démonstration peu illustrative ( < . 01 ) . En revanche , cet effet n' apparaît pas lorsque les agents sont soumis à l' observation d' une démonstration peu illustrative ( M = 1.50 et 1.50 et M = 1.54 ) , 1.54 ) , F ( 1 , 18 ) < 1 . ( 1 , 18 ) < 1 . Tableau 1 : Distances moyennes entre les trajectoires selon la démonstration et le niveau d' évaluation Note : les moyennes qui ne partagent pas les mêmes indices diffèrent au moins à p < . 05 Pour résumer , le type de démonstration influence la qualité de la trajectoire mémorisée , sans pour autant influencer la qualité de la trajectoire produite . Cependant , le type de démonstration semble induire des effets différentiels sur la comparaison entre trajectoires mémorisée et produite selon l' illustrativité de la trajectoire observée . Changements de direction L' analyse de variance conduite sur les données met en évidence un effet principal de la démonstration observée sur le nombre de changements de direction , L' analyse de variance conduite sur les données met en évidence un effet principal de la démonstration observée sur le nombre de changements de direction , F ( 1 , 18 ) = 19.19 , ( 1 , 18 ) = 19.19 , p < . 01 . Le nombre de changements de direction est plus important pour la démonstration illustrative ( < . 01 . Le nombre de changements de direction est plus important pour la démonstration illustrative ( M = . 37 ) que ceux réalisés suite à la démonstration peu illustrative ( . 37 ) que ceux réalisés suite à la démonstration peu illustrative ( M = . 31 ) . . 31 ) . En ce qui concerne l' analyse de l' effet simple de la démonstration sur la mémorisation , un plus grand nombre de changements de direction est mémorisé suite à l' observation d' une démonstration illustrative ( En ce qui concerne l' analyse de l' effet simple de la démonstration sur la mémorisation , un plus grand nombre de changements de direction est mémorisé suite à l' observation d' une démonstration illustrative ( M = . 35 ) en comparaison à ceux mémorisés suite à une démonstration peu illustrative ( . 35 ) en comparaison à ceux mémorisés suite à une démonstration peu illustrative ( M = . 30 ) , . 30 ) , F ( 1 , 18 ) = 8.50 , ( 1 , 18 ) = 8.50 , p < . 01 . Le nombre de changements de direction observé influence directement leur intégration à la représentation élaborée : plus les changements sont nombreux dans la démonstration plus la représentation en contient. < . 01 . Le nombre de changements de direction observé influence directement leur intégration à la représentation élaborée : plus les changements sont nombreux dans la démonstration plus la représentation en contient . De la même façon , nous observons un effet simple de la démonstration sur le niveau de production , De la même façon , nous observons un effet simple de la démonstration sur le niveau de production , F ( 1 , 18 ) = 17.20 , ( 1 , 18 ) = 17.20 , p < . 01 . Cela se manifeste par moins de changement de direction pour les agents observateurs de la démonstration peu illustrative ( < . 01 . Cela se manifeste par moins de changement de direction pour les agents observateurs de la démonstration peu illustrative ( M = . 32 ) que ceux observateurs de la démonstration illustrative ( . 32 ) que ceux observateurs de la démonstration illustrative ( M = . 40 ) . De façon équivalente à la trajectoire mémorisée , la démonstration influence la production effective du comportement en intégrant davantage de changements de direction lorsque la trajectoire observée est illustrative de la règle . Ces résultats indiquent que la démonstration observée influence le comportement des agents observateurs tant au niveau de la représentation construite que celui de la production effective , dans le sens d' une utilisation de la règle de l' angle plus importante lorsque celle -ci a été suffisamment illustrée ( les moyennes qui correspondent sont présentées sur le graphique 6 page suivante ) .. 40 ) . De façon équivalente à la trajectoire mémorisée , la démonstration influence la production effective du comportement en intégrant davantage de changements de direction lorsque la trajectoire observée est illustrative de la règle . Ces résultats indiquent que la démonstration observée influence le comportement des agents observateurs tant au niveau de la représentation construite que celui de la production effective , dans le sens d' une utilisation de la règle de l' angle plus importante lorsque celle -ci a été suffisamment illustrée ( les moyennes qui correspondent sont présentées sur le graphique 6 page suivante ) . L' analyse met en évidence un effet principal du niveau d' évaluation ( L' analyse met en évidence un effet principal du niveau d' évaluation ( F ( 1 , 18 ) = 11.44 , ( 1 , 18 ) = 11.44 , p < . 01 ) . Les résultats indiquent que les changements sont plus fréquents ( < . 01 ) . Les résultats indiquent que les changements sont plus fréquents ( M = . 36 ) pour le niveau de reproduction en comparaison au niveau de mémorisation ( . 36 ) pour le niveau de reproduction en comparaison au niveau de mémorisation ( M = . 33 ) . . 33 ) . Graphique 6 : Changement de direction moyen en mémorisation et reproduction en fonction de la démonstration observée . Discussion Cette deuxième simulation avait pour objectif de vérifier qu' OLEANNet était en mesure d' émettre des comportements différenciés selon les conditions d' apprentissage , sans quoi le modèle aurait pu être considéré comme un simple outil mathématique . Les résultats rendent compte d' une effective différenciation des performances se manifestant tant au niveau de la représentation élaborée suite à la phase d' acquisition qu' au niveau de la production effective du déplacement . Un même agent observateur placé dans une situation d' apprentissage selon une démonstration illustrative de la règle de l' angle ou une démonstration peu illustrative , émet donc des comportements différents . L' analyse du déplacement mémorisé par les agents observateurs indique que la représentation élaborée suite à l' observation d' une démonstration illustrative est plus proche de la trajectoire observée et qu' elle intègre davantage de changements de direction que celle construite suite à l' observation d' une démonstration peu illustrative . L' analyse du déplacement effectivement produit indique que le type de démonstration observé n' a pas d' influence sur la distance entre trajectoires observées et produites . Cela suggère que la démonstration n' influence pas la forme de la trajectoire produite par rapport à celle observée . Cependant , le nombre d' actions de changements de direction utilisé est plus fréquent pour les agents soumis à la démonstration illustrative . La manifestation de l' influence de la démonstration ne transparaît pas au niveau d' un critère global d' évaluation de la distance entre les trajectoires produite et observée , mais apparaît dans l' utilisation que les agents font des actions de changement de direction . L' influence de la démonstration est donc manifeste à un niveau d' évaluation de la performance plus spécifique . Lorsque les agents sont soumis à l' apprentissage par observation de déplacements différents , leur performance en est influencée . Les agents n' apprennent pas de façon équivalente la tâche selon la démonstration observée , il y a donc émergence de différence entre les groupes qui est induite par la condition expérimentale , et ceci est d' autant plus intéressant que ce sont les mêmes agents qui sont utilisés dans les deux conditions . De plus , dans une même condition expérimentale les agents ne produisent pas la même performance , ce qui indique que la capacité d' apprentissage dépend du répertoire comportemental de base dont ils disposent . Ces éléments contribuent à valider OLEANNet quant à sa fiabilité à répliquer le phénomène d' apprentissage par observation , en proposant d' une part des différences inter individuelles et d' autre part des différences entre groupes expérimentaux . Par ailleurs , l' analyse des niveaux d' évaluation nous a permis d' observer une diminution de la distance entre trajectoires pour le niveau de mémorisation comparé à celui de production , et ce , pour la démonstration illustrative . La distance à la trajectoire observée en mémorisation est plus faible ( donc de meilleure qualité ) que celle en production . Cela provient de la conception même d' OLEANNet , puisque nous avons défini deux phases d' apprentissage successives . La première concerne la mémorisation , donc l' adaptation des matrices de poids en fonction de la démonstration observée , induisant une première approximation de la tâche . La seconde phase implique la production du comportement , donc l' adaptation des matrices de poids en fonction de la réactivation de la représentation . Cela implique à une seconde approximation de la tâche fondée sur l' approximation déjà réalisée en phase d' acquisition . Malgré l' absence d' un tel effet chez les agents observateurs de trajectoire peu illustrative , la dégradation de la performance observée auprès des agents observateurs de la démonstration illustrative va dans le sens de ceux obtenus dans l' expérience de Bandura et Jeffery ( 1973 ) . La simulation qui suit tentera d' explorer plus précisément comment une telle dégradation peut apparaître . 2.5 . Simulation 3 Les précédentes simulations nous ont permis de considérer l' architecture et le fonctionnement d' OLEANNet comme un modèle fiable de l' apprentissage par observation , présentant des performances différenciées selon les conditions d' apprentissage et reflétant des différences inter individuel . De plus , d' après le fonctionnement d' OLEANNet , nous avons constaté que les agents présentaient bien une dégradation de leur performance entre la trajectoire mémorisée et celle reproduite . Ce phénomène avéré dans la littérature nous amène à envisager qu' au-delà d' une simple réplication des résultats classiques , OLEANNet permet de proposer des mécanismes explicatifs de cette dégradation . Cette troisième simulation comportait deux objectifs : le premier était de tester la capacité d' OLEANNet à répliquer des résultats classiques ; le second était de voir si l' utilisation d' OLEANNet pouvait nous conduire à envisager des mécanismes explicatifs de la dégradation entre la performance reflétée par la représentation construite et celle du comportement effectivement produit . Dans une expérience sur l' apprentissage d' un mouvement de bras séquentialisé , Bandura et Jeffery ( 1973 ) ont montré que les individus qui codaient sous formes de symboles une séquence d' actions observée rappelaient mieux le codage qu' ils ne réalisaient le mouvement . Dans leur étude , les sujets étaient invités à observer un mouvement de bras représentant une suite d' actions et à utiliser un codage sous forme de lettres ou de chiffres pour le mémoriser . Ce codage consistait à associer à chaque action élémentaire une lettre ou un chiffre et les sujets devaient mémoriser cet ensemble de lettres ou de chiffres . Les résultats indiquaient que le rappel du codage verbal et numérique était correct à 82 % , alors que le mouvement était reproduit de façon satisfaisante dans 64 % des cas . La simulation que nous présentons doit permettre de mettre en évidence la même détérioration de la performance entre la phase d' acquisition et la phase de production . Si OLEANNet est valide , alors la représentation construite au cours de l' observation devrait être plus proche de ce que l' agent observateur perçoit réellement que ne le serait la résultante du mouvement après la phase de production . Méthode Population Nous avons réutilisé les quinze agents observateurs de la simulation précédenteNous avons réutilisé les quinze agents observateurs de la simulation précédente [ 19 ] Tâche et procédure La tâche des agents observateurs consistait à observer et reproduire le déplacement réalisé par un agent démonstrateur permettant d' atteindre une cible placée en ( 10 , 10 ) depuis un point de départ fixe ( 1 , 1 ) . Nous réutilisons le premier agent démonstrateur de la simulation précédente qui réalisait une démonstration illustrative de la règle de l' angle , présentée graphique 7 . Cette démonstration était obtenue suite à l' apprentissage de l' application de la règle de l' angle qui représente la trajectoire idéale ( illustrée graphique 8 , page suivante ) . Graphique 7 : Trajectoire illustrative de la règle de l' angle proposée en démonstration par le premier agent démonstrateur Graphique 8 : Trajectoire idéale représentant l' application systématique de la règle de l' angle Paramètres d' apprentissage des agents observateurs L' apprentissage des agents observateurs était régit par les phases d' acquisition et de production pré-testées dans la simulation 1 . Ils ont été soumis à une phase d' acquisition contenant 25 itérations d' apprentissage et à une phase de production contenant 25 itérations d' apprentissage . Les agents observateurs ont été placés en position ( 1 , 1 , 1 ) pour chacune des phases d' acquisition et de production . Mesure Afin de confronter les résultats obtenus par les agents observateurs à ceux obtenus par les participants de l' étude de Bandura et Jeffery ( 1973 ) , nous avons utilisé plusieurs indicateurs : la réussite à la tâche la distance euclidienne moyenne entre trajectoires mémorisée ou produite avec la trajectoire observée . la distance euclidienne moyenne entre la trajectoire mémorisée ( ou produite ) avec la trajectoire idéale . Cela permet d' évaluer la capacité des agents observateurs à approximer la règle de l' angle à partir de son illustration . nb : Chacune de ces distances a été calculée par la moyenne d' écart entre chaque point ( incluant les positions de changements de direction ) des trajectoires comparées . Plus la distance est faible , plus les trajectoires sont proches l' une de l' autre . Rappelons que suite à la phase d' acquisition , la simulation du déplacement au niveau de la sortie cognitive , permet de tester la trajectoire mémorisée par les agents observateurs . Il s' agit de tester la proximité de la représentation construite avec la trajectoire observée et avec la trajectoire idéale . La simulation du déplacement suite à la phase de production teste la production effective du déplacement en sortie motrice . Elle permet d' évaluer la proximité entre trajectoire produite et trajectoire observée , et entre trajectoire produite et trajectoire idéale Résultats Réussite à la tâche d' atteinte de cible La simulation du déplacement des agents observateurs suite à l' apprentissage par observation indique qu' ils ont , globalement développé une compétence à se déplacer , mais pas forcément jusqu'à la cible . Ils ont ainsi complété leur répertoire comportemental de base avec d' autres types d' actions que celles dont ils disposaient a priori . Nous avons vu , dans la première simulation , que lorsque les agents sont testés avant l' apprentissage , ils n' émettent qu' un seul type d' action , et que ce répertoire est complété d' une part lors de la phase d' acquisition puis lors de la phase de production . Au terme de l' apprentissage certains ont acquis la capacité à se déplacer efficacement , le graphique 10 en propose un exemple , ils sont donc capables d' enchaîner les actions de façon à atteindre la cible depuis leur position de départ . En revanche , nous verrons que d' autres agents ne réalisent pas l' intégralité du déplacement . Les résultats de la simulation du déplacement mémorisé indiquent que la représentation construite suite à la phase d' acquisition retrace pour 86.6 % ( 13 agents sur 15 ) des agents observateurs une trajectoire du point de départ jusqu'à la cible . Cela signifie qu' ils ont mémorisé un déplacement efficace et qu' ils sont capables de le rappeler correctement ( cf. l' exemple présenté graphique 10 ) . Les deux agents restant ont développé une représentation incomplète de la trajectoire , en ce sens qu' elle n' intègre pas la totalité du déplacement mais seulement une partie . La trajectoire mémorisée présente dans les deux cas , un déplacement de type « avance » puis toujours « tourner à droite » . Nous observons que suite à la phase de production seul 66.6 % réalisent correctement l' intégralité du déplacement du point de départ jusqu'à la cible . De plus , nous remarquons que les deux agents n' ayant pas mémorisé la trajectoire complète ne sont pas en mesure de reproduire un comportement adéquat . Cela atteste d' une part que lorsque les agents n' ont pas mémorisé l' intégralité de la séquence d' actions observée , la représentation devient caduque pour la production effective du comportement . Par ailleurs , pour les agents ayant correctement mémorisé la démonstration , 76 , 6 % sont en mesure d' utiliser efficacement la représentation élaborée comme guide d' ajustement de leur comportement . D' après ces premiers résultats , 86.6 % des agents observateurs rappellent correctement la trajectoire observée et 66.6 % sont en mesure de la reproduire . Distance entre trajectoire mémorisée , produite et trajectoire observée Une analyse de variance sur les trajectoires mémorisée et produite est menée sur les données des agents observateurs ayant réussit la tâche d' atteinte de cible suite à la phase de production . Les résultats obtenus par les 66.6 % d' agents observateurs ayant réussi la tâche indiquent qu' en terme de distance , la trajectoire mémorisée est plus proche de la trajectoire observée ( Une analyse de variance sur les trajectoires mémorisée et produite est menée sur les données des agents observateurs ayant réussit la tâche d' atteinte de cible suite à la phase de production . Les résultats obtenus par les 66.6 % d' agents observateurs ayant réussi la tâche indiquent qu' en terme de distance , la trajectoire mémorisée est plus proche de la trajectoire observée ( M = 1.02 ) que ne l' est la trajectoire produite ( 1.02 ) que ne l' est la trajectoire produite ( M = 1.32 ) , 1.32 ) , F ( 1 , 9 ) = 14.91 , ( 1 , 9 ) = 14.91 , p < . 01 . Conformément au fonctionnement d' OLEANNet et aux résultats de la littérature expérimentale , la distance entre trajectoire mémorisée et produite , par rapport à celle observée augmente , cela réplique une dégradation de la performance évaluée suite à la phase d' acquisition et suite à la phase de production dont une illustration est présentée par le graphique 10 ( page suivante ) , par rapport à la démonstration observée ( cf. graphique 9 , page suivante ) . < . 01 . Conformément au fonctionnement d' OLEANNet et aux résultats de la littérature expérimentale , la distance entre trajectoire mémorisée et produite , par rapport à celle observée augmente , cela réplique une dégradation de la performance évaluée suite à la phase d' acquisition et suite à la phase de production dont une illustration est présentée par le graphique 10 ( page suivante ) , par rapport à la démonstration observée ( cf. graphique 9 , page suivante ) . Graphique 9 : Trajectoire proposée en démonstration Graphique 10 : Exemple de trajectoire proposée lors de la simulation du déplacement sur les sorties cognitives ( représentation mémorisée ) , graphique de gauche ; et exemple de trajectoire proposée lors de la simulation du déplacement sur les sorties motrices ( production effective ) , graphique de droite . Allons plus loin sur cette dégradation , en regardant de quelle façon les écarts entre les trajectoires évoluent . Nous créons pour cela un indice théorique de ce que serait la valeur de la distance entre trajectoire produite et observée si elle résultait de la somme des dégradations successives . Pour chaque agent observateur , nous calculons la somme de la distance entre trajectoire mémorisée et observée et la distance entre les trajectoires produite et mémorisée . L' analyse de ces résultats indique que la distance entre les trajectoires mémorisée et observée ( Allons plus loin sur cette dégradation , en regardant de quelle façon les écarts entre les trajectoires évoluent . Nous créons pour cela un indice théorique de ce que serait la valeur de la distance entre trajectoire produite et observée si elle résultait de la somme des dégradations successives . Pour chaque agent observateur , nous calculons la somme de la distance entre trajectoire mémorisée et observée et la distance entre les trajectoires produite et mémorisée . L' analyse de ces résultats indique que la distance entre les trajectoires mémorisée et observée ( M = 1.02 ) et la distance entre la trajectoire produite et celle mémorisée ( 1.02 ) et la distance entre la trajectoire produite et celle mémorisée ( M = . 75 ) sont équivalentes , . 75 ) sont équivalentes , F ( 1 , 9 ) = 2.03 , NS . Si l' approximation de la trajectoire produite correspondait au cumul additif des deux détériorations , alors nous ne devrions pas observer de différence entre le total de l' écart obtenu ( indice théorique ) et l' écart effectivement relevé entre trajectoire produite et observée . Comme présenté dans le tableau 2 , la moyenne des distances relevées sur la trajectoire produite ( ( 1 , 9 ) = 2.03 , NS . Si l' approximation de la trajectoire produite correspondait au cumul additif des deux détériorations , alors nous ne devrions pas observer de différence entre le total de l' écart obtenu ( indice théorique ) et l' écart effectivement relevé entre trajectoire produite et observée . Comme présenté dans le tableau 2 , la moyenne des distances relevées sur la trajectoire produite ( M = 1.32 ) est inférieure à la distance proposée par l' indice théorique ( 1.32 ) est inférieure à la distance proposée par l' indice théorique ( M = 1.78 ) , 1.78 ) , F ( 1 , 9 ) = 21.08 , ( 1 , 9 ) = 21.08 , p < . 01 . Nous observons que la dégradation obtenue suite à la phase d' acquisition ne corresponde pas à un cumul additif des détériorations mais à une combinaison des deux détériorations successives ( < . 01 . Nous observons que la dégradation obtenue suite à la phase d' acquisition ne corresponde pas à un cumul additif des détériorations mais à une combinaison des deux détériorations successives ( M = 1.02 et 1.02 et M = . 7 ) .. 7 ) . Tableau 2 : Illustration des distances moyennes entre trajectoire observée-mémorisée et produite Note : les moyennes qui ne partagent pas les mêmes indices diffèrent au moins à p < . 05 Distance entre trajectoire mémorisée et produite par rapport à la trajectoire observée et à la trajectoire idéale L' analyse des déplacements mémorisés et produits par les agents ayant réussi la tâche indiquent un effet principal de la trajectoire de comparaison , L' analyse des déplacements mémorisés et produits par les agents ayant réussi la tâche indiquent un effet principal de la trajectoire de comparaison , F ( 1 , 9 ) = 42.95 , ( 1 , 9 ) = 42.95 , p < . 01 . Comme reporté dans le tableau 3 ( page suivante ) , la distance moyenne obtenue en comparaison de la trajectoire idéale est plus faible ( < . 01 . Comme reporté dans le tableau 3 ( page suivante ) , la distance moyenne obtenue en comparaison de la trajectoire idéale est plus faible ( M = 1.03 ) que celle obtenue en comparaison de la trajectoire observée ( 1.03 ) que celle obtenue en comparaison de la trajectoire observée ( M = 1.17 ) . De plus , l' effet principal de détérioration de la performance est de nouveau observé , 1.17 ) . De plus , l' effet principal de détérioration de la performance est de nouveau observé , F ( 1 , 9 ) = 12.56 , ( 1 , 9 ) = 12.56 , p < . 01 , indiquant que la distance de la trajectoire produite est plus importante ( < . 01 , indiquant que la distance de la trajectoire produite est plus importante ( M = 1.26 ) que celle mémorisée ( 1.26 ) que celle mémorisée ( M = . 94 ) . . 94 ) . Tableau 3 : Récapitulatif des distances obtenues entre les trajectoires comparées Note : les moyennes qui ne partagent pas les mêmes indices diffèrent au moins à p < . 05 Plus spécifiquement , l' analyse de l' effet simple de la trajectoire de comparaison sur la mémorisation et la production , montre que les agents produisent une trajectoire plus éloignée de la trajectoire observée ( Plus spécifiquement , l' analyse de l' effet simple de la trajectoire de comparaison sur la mémorisation et la production , montre que les agents produisent une trajectoire plus éloignée de la trajectoire observée ( M = 1.32 ) que de la trajectoire idéale ( 1.32 ) que de la trajectoire idéale ( M = 1.19 ) , 1.19 ) , F ( 1 , 9 ) = 18.65 , ( 1 , 9 ) = 18.65 , p < . 01 . Cela semble indiquer que les agents observateurs approximent mieux la trajectoire idéale que celle observée . A partir de l' observation de la démonstration de la tâche d' atteinte de cible selon une trajectoire illustrative ( mais non soumise à l' application systématique de la règle de l' angle ) , les agents observateurs sont capables d' approximer la réalisation idéale de la tâche. < . 01 . Cela semble indiquer que les agents observateurs approximent mieux la trajectoire idéale que celle observée . A partir de l' observation de la démonstration de la tâche d' atteinte de cible selon une trajectoire illustrative ( mais non soumise à l' application systématique de la règle de l' angle ) , les agents observateurs sont capables d' approximer la réalisation idéale de la tâche . Discussion L' objectif premier de cette troisième simulation était de répliquer les résultats obtenus par Bandura et Jeffery ( 1973 ) sur la dégradation de la performance entre les actions mémorisées et celles effectivement reproduites . Ces auteurs ont montré que le rappel symbolique de la séquence était correct pour 82 % des sujets et que 64 % d' entre eux étaient en mesure de reproduire fidèlement la séquence observée . Les résultats de cette simulation vont en ce sens , en effet , 86.6 % des agents observateurs rappellent correctement la séquence d' actions observée et que seuls 66.6 % reproduisent de façon efficace le déplacement jusqu'à la cible . De plus , l' analyse sur les distances entre trajectoires indique que la trajectoire mémorisée est plus proche de la trajectoire observée que ne l' est celle produite effectivement par les agents . L' isomorphie du L' objectif premier de cette troisième simulation était de répliquer les résultats obtenus par Bandura et Jeffery ( 1973 ) sur la dégradation de la performance entre les actions mémorisées et celles effectivement reproduites . Ces auteurs ont montré que le rappel symbolique de la séquence était correct pour 82 % des sujets et que 64 % d' entre eux étaient en mesure de reproduire fidèlement la séquence observée . Les résultats de cette simulation vont en ce sens , en effet , 86.6 % des agents observateurs rappellent correctement la séquence d' actions observée et que seuls 66.6 % reproduisent de façon efficace le déplacement jusqu'à la cible . De plus , l' analyse sur les distances entre trajectoires indique que la trajectoire mémorisée est plus proche de la trajectoire observée que ne l' est celle produite effectivement par les agents . L' isomorphie du pattern de résultats que nous avons obtenus avec ceux observés par Bandura et Jeffery ( 1973 ) , soutient qu' OLEANNet réplique correctement les données de la littérature expérimentale concernant la dégradation de la performance entre rappel et reproduction . de résultats que nous avons obtenus avec ceux observés par Bandura et Jeffery ( 1973 ) , soutient qu' OLEANNet réplique correctement les données de la littérature expérimentale concernant la dégradation de la performance entre rappel et reproduction . Le second objectif que nous nous étions fixé était d' évaluer l' intérêt de l' utilisation d' OLEANNet pour comprendre cette dégradation . En regard du fonctionnement d' OLEANNet , nous postulions que la dégradation de la performance repose sur la succession d' approximations réalisées pendant l' apprentissage par observation . La première approximation intervient lors de la phase d' acquisition et la seconde lors de la phase de production . Au cours de la phase d' acquisition , la contrainte d' apprentissage est déterminée par l' action émise par l' agent démonstrateur . Cet apprentissage résulte de la diminution progressive de l' écart évalué entre actions émises par l' agent démonstrateur et actions proposées sur la sortie cognitive par l' agent observateur . Ceci conduit l' agent à intégrer à la représentation , à mesure de la phase d' acquisition , les actions rencontrées en les superposant dans une même structure de poids . Au terme de cette phase , l' application de la règle d' apprentissage conduit à obtenir une erreur globale sur l' ensemble du déplacement la plus faible possible , ce qui se concrétise par la construction d' une représentation permettant de satisfaire la résolution de la tâche tout en intégrant l' ensemble des contraintes . Néanmoins , la représentation distribuée de la situation émergeant de l' apprentissage ne peut intégrer efficacement chacune des actions relatives à chaque position perçue . Sinon cela signifierait qu' il existe une matrice de poids unique de convergence ; c' est-à-dire une matrice dont les valeurs satisfont exactement les critères de la tâche . Ceci n' étant pas notre objectif , nous avons montré dans la simulation précédente ( simulation 2 ) que ce n' était effectivement pas le cas puisque que tous les agents ne proposaient pas la même forme de trajectoire lors de l' exécution . Ce qui revient à obtenir une diminution de l' erreur globale n' atteignant pas une erreur globale nulle . De plus , les résultats soutiennent que la représentation distribuée élaborée au fur et à mesure de cette phase d' acquisition correspond à une version dégradée de la trajectoire observée . C' est à cause de l' approximation réalisée pour satisfaire les contraintes d' apprentissage de la tâche que la représentation élaborée est imparfaite ; la trajectoire mémorisée correspond donc à une approximation de la trajectoire observéeLe second objectif que nous nous étions fixé était d' évaluer l' intérêt de l' utilisation d' OLEANNet pour comprendre cette dégradation . En regard du fonctionnement d' OLEANNet , nous postulions que la dégradation de la performance repose sur la succession d' approximations réalisées pendant l' apprentissage par observation . La première approximation intervient lors de la phase d' acquisition et la seconde lors de la phase de production . Au cours de la phase d' acquisition , la contrainte d' apprentissage est déterminée par l' action émise par l' agent démonstrateur . Cet apprentissage résulte de la diminution progressive de l' écart évalué entre actions émises par l' agent démonstrateur et actions proposées sur la sortie cognitive par l' agent observateur . Ceci conduit l' agent à intégrer à la représentation , à mesure de la phase d' acquisition , les actions rencontrées en les superposant dans une même structure de poids . Au terme de cette phase , l' application de la règle d' apprentissage conduit à obtenir une erreur globale sur l' ensemble du déplacement la plus faible possible , ce qui se concrétise par la construction d' une représentation permettant de satisfaire la résolution de la tâche tout en intégrant l' ensemble des contraintes . Néanmoins , la représentation distribuée de la situation émergeant de l' apprentissage ne peut intégrer efficacement chacune des actions relatives à chaque position perçue . Sinon cela signifierait qu' il existe une matrice de poids unique de convergence ; c' est-à-dire une matrice dont les valeurs satisfont exactement les critères de la tâche . Ceci n' étant pas notre objectif , nous avons montré dans la simulation précédente ( simulation 2 ) que ce n' était effectivement pas le cas puisque que tous les agents ne proposaient pas la même forme de trajectoire lors de l' exécution . Ce qui revient à obtenir une diminution de l' erreur globale n' atteignant pas une erreur globale nulle . De plus , les résultats soutiennent que la représentation distribuée élaborée au fur et à mesure de cette phase d' acquisition correspond à une version dégradée de la trajectoire observée . C' est à cause de l' approximation réalisée pour satisfaire les contraintes d' apprentissage de la tâche que la représentation élaborée est imparfaite ; la trajectoire mémorisée correspond donc à une approximation de la trajectoire observée [ 20 ] .. Au cours de la phase de production , l' exécution du déplacement est contrainte par la représentation approximative construite en phase d' acquisition . Pour cela , la représentation construite en phase d' acquisition est activée et sert de guide d' ajustement à l' émission correcte de la séquence d' actions . L' apprentissage résulte de la détection et de la correction des erreurs entre actions émises sur la sortie motrice et actions réactivées sur la sortie cognitive . Le comportement produit correspond alors de nouveau à une approximation de celui mémorisé . Le même raisonnement que celui exposé pour l' approximation de la trajectoire mémorisée peut être appliqué de nouveau . S' il existait une solution unique de convergence de la matrice de poids alors nous serions dans le cadre d' un modèle dont les capacités ne seraient pas différenciées en fonction des situations . Cette seconde approximation étant réalisée sur une trajectoire approximative mémorisée , elle se rajoute à l' approximation faite au cours de la phase d' acquisition si bien que la performance en est encore diminuée . Ces approximations successives ne se cumulent cependant pas de façon additive . Nous avons pu observer que si c' était un cumul additif , la trajectoire réalisée en production serait encore plus éloignée de la trajectoire observée qu' elle ne l' est en réalité . Nous pouvons donc apporter une explication possible aux résultats obtenus par Bandura et Jeffery ( 1973 ) . Dans leur expérience , les sujets réalisaient une première approximation de la tâche en mémorisant la séquence d' actions . Cette représentation approximative était ensuite réactivée pour produire le mouvement . Au cours de la phase de production , la performance était de nouveau diminuée puisqu' elle résultait d' une seconde approximation réalisée sur la représentation réactivée . Le Nous pouvons donc apporter une explication possible aux résultats obtenus par Bandura et Jeffery ( 1973 ) . Dans leur expérience , les sujets réalisaient une première approximation de la tâche en mémorisant la séquence d' actions . Cette représentation approximative était ensuite réactivée pour produire le mouvement . Au cours de la phase de production , la performance était de nouveau diminuée puisqu' elle résultait d' une seconde approximation réalisée sur la représentation réactivée . Le pattern de résultats , à savoir une diminution de la performance entre phase d' observation et phase de production , obtenu tant dans les expériences auprès de sujets humains que dans les simulations résulterait donc de la succession non additive des approximations de la tâche au cours des phases d' apprentissage . Le modèle OLEANNet que nous avons implémenté , consistant en une architecture , un fonctionnement et des règles d' apprentissage , spécifiquement élaboré pour l' acquisition d' une habileté motrice semble probant pour répliquer le phénomène d' apprentissage par observation de ce type de tâche , cependant nous pouvons nous demandé s' il conserve pour autant les capacités inhérentes au modèle connexioniste , telle que la généralisation que nous allons tester dans la simulation suivante . de résultats , à savoir une diminution de la performance entre phase d' observation et phase de production , obtenu tant dans les expériences auprès de sujets humains que dans les simulations résulterait donc de la succession non additive des approximations de la tâche au cours des phases d' apprentissage . Le modèle OLEANNet que nous avons implémenté , consistant en une architecture , un fonctionnement et des règles d' apprentissage , spécifiquement élaboré pour l' acquisition d' une habileté motrice semble probant pour répliquer le phénomène d' apprentissage par observation de ce type de tâche , cependant nous pouvons nous demandé s' il conserve pour autant les capacités inhérentes au modèle connexioniste , telle que la généralisation que nous allons tester dans la simulation suivante . 2.6 . Simulation 4 L' objectif de cette simulation était de vérifier l' émergence des capacités de transfert et de généralisation d' OLEANNet à partir de l' apprentissage d' une tâche simple d' atteinte de cible . De nombreuses études confirment que l' apprentissage par pratique physique induit de meilleures performances que l' apprentissage par observation en test de reproduction ( Blandin Blandin , Lhuisset McCullagh & Little , 1990 ) . En revanche , peu d' entre elles ce sont intéressées à l' étude des bénéfices en tâche de transfert . Dans une étude de Shea , Wright , David , Wulf , et Whitacre ( 2000 ) , les individus devaient apprendre à maintenir un curseur sur une ligne droite en pressant les touches d' un clavier d' ordinateur . Cette tâche était apprise , soit en pratique physique , soit par simple observation d' un individu réalisant cette tâche ( pas de pratique autre que le test ) . Ensuite , les sujets devaient refaire la tâche sur une ligne non droite . Les résultats de leur première expérience indiquaient que les sujets apprenant seuls faisaient moins d' erreurs que ceux apprenant par observation dans la reproduction effective de la tâche , mais que ces deux groupes ne différaient pas dans la réalisation de la tâche de transfert . Dans une seconde expérience , Shea L' objectif de cette simulation était de vérifier l' émergence des capacités de transfert et de généralisation d' OLEANNet à partir de l' apprentissage d' une tâche simple d' atteinte de cible . De nombreuses études confirment que l' apprentissage par pratique physique induit de meilleures performances que l' apprentissage par observation en test de reproduction ( Blandin Blandin , Lhuisset & Proteau , 1999 ; McCullagh & Little , 1990 ) . En revanche , peu d' entre elles ce sont intéressées à l' étude des bénéfices en tâche de transfert . Dans une étude de Shea , Wright , David , Wulf , et Whitacre ( 2000 ) , les individus devaient apprendre à maintenir un curseur sur une ligne droite en pressant les touches d' un clavier d' ordinateur . Cette tâche était apprise , soit en pratique physique , soit par simple observation d' un individu réalisant cette tâche ( pas de pratique autre que le test ) . Ensuite , les sujets devaient refaire la tâche sur une ligne non droite . Les résultats de leur première expérience indiquaient que les sujets apprenant seuls faisaient moins d' erreurs que ceux apprenant par observation dans la reproduction effective de la tâche , mais que ces deux groupes ne différaient pas dans la réalisation de la tâche de transfert . Dans une seconde expérience , Shea et al. ( 2000 ) ont montré qu' en proposant un apprentissage par observation complet c' est-à-dire une phase d' acquisition suivie d' une phase de production , les performances sont améliorées . En effet , en tâche de transfert les individus apprenant la tâche ( ligne droite ) par observation et la pratiquant faisaient moins d' erreurs que ceux apprenant la tâche seuls . L' explication proposée , par les auteurs , considère la nature des caractéristiques apprises selon le mode d' apprentissage auquel l' individu est soumis . Lorsqu' un individu apprend par pratique physique , il apprendrait les caractéristiques spécifiques de la tâche , si bien qu' il serait performant en tâche de transfert si ces caractéristiques sont généralisables et transférables , alors qu' un individu apprenant par observation intègrerait les caractéristiques plus générales de résolution de la tâche si bien qu' il serait plus à même de transférer ses connaissances . ( 2000 ) ont montré qu' en proposant un apprentissage par observation complet c' est-à-dire une phase d' acquisition suivie d' une phase de production , les performances sont améliorées . En effet , en tâche de transfert les individus apprenant la tâche ( ligne droite ) par observation et la pratiquant faisaient moins d' erreurs que ceux apprenant la tâche seuls . L' explication proposée , par les auteurs , considère la nature des caractéristiques apprises selon le mode d' apprentissage auquel l' individu est soumis . Lorsqu' un individu apprend par pratique physique , il apprendrait les caractéristiques spécifiques de la tâche , si bien qu' il serait performant en tâche de transfert si ces caractéristiques sont généralisables et transférables , alors qu' un individu apprenant par observation intègrerait les caractéristiques plus générales de résolution de la tâche si bien qu' il serait plus à même de transférer ses connaissances . Au vue des capacités de généralisation des modèles connexionistes , nous pensons qu' OLEANNet est capable d' utiliser les connaissances acquises pour les adapter efficacement dans un nouvel environnement , de façon à répliquer la structure des résultats obtenus par Shea Au vue des capacités de généralisation des modèles connexionistes , nous pensons qu' OLEANNet est capable d' utiliser les connaissances acquises pour les adapter efficacement dans un nouvel environnement , de façon à répliquer la structure des résultats obtenus par Shea et al. ( 2000 ) . Pour tester cela , les agents observateurs ayant appris par observation ou par essai-erreur seront testés sur une tâche de transfert de connaissances . ( 2000 ) . Pour tester cela , les agents observateurs ayant appris par observation ou par essai-erreur seront testés sur une tâche de transfert de connaissances . Méthode Population Pour réaliser cette simulation , nous avons utilisé les neuf agents observateurs de la simulation 2 ayant appris à partir de la démonstration d' une trajectoire illustrative ou peu illustrative de la règle de l' angle . Tâche et procédure La tâche et la procédure suivies pour les agents observateurs , soumis à l' apprentissage par observation , ayant été présentée en détail dans la simulation 2 , nous n' en ferons qu' un rappel . La tâche consistait à observer et mémoriser le déplacement d' un agent démonstrateur proposant soit une trajectoire illustrative soit une trajectoire peu illustrative de la règle de l' angle , ceci pour 25 itérations d' apprentissage en phase d' acquisition puis 25 itérations en phase de production . L' apprentissage par essai-erreur était induit pour les mêmes agents observateurs , notons que cet apprentissage prenait place sur les matrices de poids de départ encore non adaptées à la résolution de la tâche . Pour ces agents , l' apprentissage intervenait uniquement au niveau des sorties motrices dont la contrainte était fournie par la règle de l' angle . Cela revenait à proposer aux agents observateurs de produire un comportement de déplacement , du point départ ( 1 , 1 , 1 ) jusqu'à la cible ( 10 , 10 ) , au niveau des sorties motrices et d' utiliser les actions fournies par la règle de l' angle pour contrainte . L' apprentissage résulte de la rétropropagation de l' erreur évaluée entre action proposée en sortie motrice et action fournie par la règle à mesure de leur déplacement jusqu'à la cible . Au terme des 25 itérations d' apprentissage autorisées , les agents devraient être en mesure d' émettre un comportement de déplacement leur permettant d' atteindre la cible . Une fois que les agents observateurs ont appris par observation et par essai-erreur , ils ont été placés dans l' environnement et testés quant à leur capacité à atteindre la cible depuis leur point de départ en ( 1 , 1 , 1 ) . Ils étaient ensuite placés dans un environnement contenant plusieurs obstacles . Bien que l' illustration présentée graphique 11 de l' environnement soit différente des précédentes , il s' agit toujours du même espace en deux dimensions où certaines positions ont été inhibées . La tâche consistait alors pour les agents observateurs à atteindre la cible en évitant les obstacles au travers et sur lesquels ils ne pouvaient passer . Cette tâche constituait bien une tâche de transfert puisqu' elle faisait appel aux mêmes connaissances , il s' agissait de se déplacer pour atteindre la même cible dans un environnement complexifié . Graphique 11 : Illustration graphique de l' environnement contenant les obstacles ( en noir ) , la position de départ ( d ) et la cible ( c ) Afin d' évaluer la performance des agents observateurs , le critère de comparaison utilisé correspondait au nombre d' actions réalisées par chacun d' eux pour atteindre la cible depuis leur position de départ . Résultats En premier lieu , la simulation du déplacement , en environnement vide d' obstacle , des agents observateurs ayant appris selon une démonstration illustrative , peu illustrative ou par essai-erreur indique que tous les agents atteignent la cible depuis la position de départ . Néanmoins , en tâche de transfert le taux de réussite global est de 96.29 % ( un seul agent ne réussit pas à atteindre la cible depuis la position de départNéanmoins , en tâche de transfert le taux de réussite global est de 96.29 % ( un seul agent ne réussit pas à atteindre la cible depuis la position de départ [ 21 ] ) . Pour déterminer la performance des agents , dont un exemple d' illustration est proposé graphique 12 , une analyse est réalisée sur le nombre d' actions effectuées pour atteindre la cible . Plus le nombre d' actions est faible plus la capacité d' adaptation des connaissances antérieurement acquises est importante . L' analyse de variance indique un effet du type d' apprentissage , ) . Pour déterminer la performance des agents , dont un exemple d' illustration est proposé graphique 12 , une analyse est réalisée sur le nombre d' actions effectuées pour atteindre la cible . Plus le nombre d' actions est faible plus la capacité d' adaptation des connaissances antérieurement acquises est importante . L' analyse de variance indique un effet du type d' apprentissage , F ( 2 , 21 ) = 68.67 , ( 2 , 21 ) = 68.67 , p < . 01 . Les agents observateurs de la trajectoire illustrative produisent 33.9 actions , ceux ayant appris seuls en produisent 31.9 , et ceux ayant appris à partir de la trajectoire peu illustrative proposent 28.8 actions pour atteindre la cible . Plus spécifiquement , les agents observateurs de la trajectoire illustrative réalisent autant de pas ( < . 01 . Les agents observateurs de la trajectoire illustrative produisent 33.9 actions , ceux ayant appris seuls en produisent 31.9 , et ceux ayant appris à partir de la trajectoire peu illustrative proposent 28.8 actions pour atteindre la cible . Plus spécifiquement , les agents observateurs de la trajectoire illustrative réalisent autant de pas ( M = 34 ) que ceux ayant appris seul ( 34 ) que ceux ayant appris seul ( M = 32 ) , mais plus de pas que ceux ayant appris à partir de l' observation d' une trajectoire peu illustrative de la règle ( 32 ) , mais plus de pas que ceux ayant appris à partir de l' observation d' une trajectoire peu illustrative de la règle ( M = 28 , 8 ) , 28 , 8 ) , F ( 1 , 21 ) = 14.74 , ( 1 , 21 ) = 14.74 , p < . 01 . < . 01 . Graphique 12 : Exemples de trajectoires ( en gris ) réalisées par un agent ayant appris à partir d' une démonstration illustrative ( Graphique de gauche ) et un agent ayant appris à partir d' une trajectoire peu illustrative ( graphique de droite ) dans l' environnement contenant les obstacles de la position de départ ( d ) jusqu'à la cible ( c ) Discussion Les résultats obtenus en tâche de transfert vont dans le sens de ceux obtenus par Shea Les résultats obtenus en tâche de transfert vont dans le sens de ceux obtenus par Shea et al. ( 2000 ) . Ainsi , les agents observateurs ayant appris à partir d' une trajectoire illustrative obtiennent des performances équivalentes à celles de ceux ayant appris seuls . Cependant , ces groupes émettent plus d' actions que les agents ayant appris à partir d' une trajectoire peu illustrative . Il semble que ces derniers sont plus à même de ré-utiliser leurs connaissances pour résoudre la tâche de transfert . Notre explication de ce résultat repose sur les caractéristiques de la représentation distribuée construite pendant l' apprentissage . Ainsi , l' approximation de la tâche réalisée à partir de l' observation d' une démonstration illustrative ou par essai-erreur induit la construction d' une représentation complexe au niveau informationnel contrairement à celle provenant de l' observation de la trajectoire peu illustrative . Cette complexité résulte de l' approximation successive des actions de l' agent démonstrateur , puis des actions guidant le comportement en production . ( 2000 ) . Ainsi , les agents observateurs ayant appris à partir d' une trajectoire illustrative obtiennent des performances équivalentes à celles de ceux ayant appris seuls . Cependant , ces groupes émettent plus d' actions que les agents ayant appris à partir d' une trajectoire peu illustrative . Il semble que ces derniers sont plus à même de ré-utiliser leurs connaissances pour résoudre la tâche de transfert . Notre explication de ce résultat repose sur les caractéristiques de la représentation distribuée construite pendant l' apprentissage . Ainsi , l' approximation de la tâche réalisée à partir de l' observation d' une démonstration illustrative ou par essai-erreur induit la construction d' une représentation complexe au niveau informationnel contrairement à celle provenant de l' observation de la trajectoire peu illustrative . Cette complexité résulte de l' approximation successive des actions de l' agent démonstrateur , puis des actions guidant le comportement en production . Plus spécifiquement , lorsque l' agent observateur observe une Plus spécifiquement , lorsque l' agent observateur observe une démonstration illustrative de la tâche , il perçoit une trajectoire contenant un grand nombre de changements de direction . La représentation construite intègre donc la séquence générale d' actions permettant l' atteinte de la cible , mais intègre aussi un grand nombre d' actions permettant de changer de direction . Lors des premières itérations d' apprentissage , l' erreur évaluée entre la sortie cognitive et les actions émises par l' agent démonstrateur est importante , et d' autant plus importante que les changements de direction sont fréquents . L' erreur rétropropagée est alors élevée . L' adaptation qui en résulte approxime au plus près les caractéristiques de cette trajectoire particulière . Nous avions effectivement vu lors de la deuxième simulation que la trajectoire mémorisée était plus proche de celle observée pour l' observation d' une démonstration illustrative que pour une démonstration peu illustrative . Cette représentation étant proche de celle observée , elle semble moins généralisable . En effet , la tâche avec la présence d' obstacles ne fait pas appel à une représentation distribuée construite pour une trajectoire comportant beaucoup de changement de direction , mais à une représentation induisant une capacité de généralisation à partir d' un exemplaire appris . L' approximation de la trajectoire est dans ce cas détaillée , mais manque de souplesse d' utilisation : elle intègre en particulier les changements de direction à des situations particulières de l' environnement . de la tâche , il perçoit une trajectoire contenant un grand nombre de changements de direction . La représentation construite intègre donc la séquence générale d' actions permettant l' atteinte de la cible , mais intègre aussi un grand nombre d' actions permettant de changer de direction . Lors des premières itérations d' apprentissage , l' erreur évaluée entre la sortie cognitive et les actions émises par l' agent démonstrateur est importante , et d' autant plus importante que les changements de direction sont fréquents . L' erreur rétropropagée est alors élevée . L' adaptation qui en résulte approxime au plus près les caractéristiques de cette trajectoire particulière . Nous avions effectivement vu lors de la deuxième simulation que la trajectoire mémorisée était plus proche de celle observée pour l' observation d' une démonstration illustrative que pour une démonstration peu illustrative . Cette représentation étant proche de celle observée , elle semble moins généralisable . En effet , la tâche avec la présence d' obstacles ne fait pas appel à une représentation distribuée construite pour une trajectoire comportant beaucoup de changement de direction , mais à une représentation induisant une capacité de généralisation à partir d' un exemplaire appris . L' approximation de la trajectoire est dans ce cas détaillée , mais manque de souplesse d' utilisation : elle intègre en particulier les changements de direction à des situations particulières de l' environnement . Dans le cas d' une Dans le cas d' une démonstration peu illustrative , l' agent observateur apprend à approximer une trajectoire qui s' avère moins éloignée de ce qu' il pourrait produire sur la sortie cognitive . L' erreur évaluée est alors moindre , la rétropropagation implique donc des changements moins conséquents au niveau de la représentation en mémoire ( matrice de poids ) . En intégrant une trajectoire présentant moins de changements de direction , les agents observateurs améliorent leur performance en tâche de transfert , si bien qu' ils réussissent tous la tâche . Les connaissances extraites au cours de l' apprentissage par observation s' avèrent plus facilement généralisables car elles ne sont pas spécifiques à la réalisation idéale de la tâche , mais spécifiques à la tâche de déplacement jusqu'à la cible . Ces connaissances sont plus générales donc plus facilement transférables car elles sont plus simples à utiliser ou encore plus décontextualisées : elles n' impliquent pas l' utilisation de tel changement de direction dans telles circonstances , mais intègre la possibilité de changer de direction. , l' agent observateur apprend à approximer une trajectoire qui s' avère moins éloignée de ce qu' il pourrait produire sur la sortie cognitive . L' erreur évaluée est alors moindre , la rétropropagation implique donc des changements moins conséquents au niveau de la représentation en mémoire ( matrice de poids ) . En intégrant une trajectoire présentant moins de changements de direction , les agents observateurs améliorent leur performance en tâche de transfert , si bien qu' ils réussissent tous la tâche . Les connaissances extraites au cours de l' apprentissage par observation s' avèrent plus facilement généralisables car elles ne sont pas spécifiques à la réalisation idéale de la tâche , mais spécifiques à la tâche de déplacement jusqu'à la cible . Ces connaissances sont plus générales donc plus facilement transférables car elles sont plus simples à utiliser ou encore plus décontextualisées : elles n' impliquent pas l' utilisation de tel changement de direction dans telles circonstances , mais intègre la possibilité de changer de direction . 3 . Discussion générale Les simulations réalisées ont montré la possibilité d' implémenter sous forme de réseaux de neurones écologiques une situation sociale au cours de laquelle un agent observateur apprenait à réaliser une tâche sur la base des informations extraites d' une démonstration . Le modèle connexioniste proposé semble être valide pour répliquer le phénomène d' apprentissage par observation . La première simulation a permis de rendre compte de la nécessité des phases d' apprentissage implémentées pour OLEANNet , à savoir deux phases d' apprentissage & 226;& 128;& 147; acquisition et production- mettant en oeuvre les processus d' attention , de rétention et de production ( Bandura , 1986 ) . Pendant la phase d' acquisition , la représentation construite traduit la mémorisation de la trajectoire observée . Cependant , comme attendu , cette seule phase n' est pas suffisante à une reproduction correcte puisqu' aucun des agents observateurs testés n' atteint la cible , et qu' ils ne produisent qu' un seul type d' action ( ce qui représente leur répertoire comportemental de base ) . Comme l' ont indiqué Deakin et Proteau ( 2000 ) , la représentation construite au cours de l' acquisition ne peut être utilisée comme moteur du comportement de façon directe . En effet , elle est rendue fonctionnelle par le biais de la phase de production qui va considérer la réactivation de la représentation et son utilisation comme guide au comportement . Ainsi , la phase de production à laquelle est soumise l' agent observateur permet de rendre la représentation fonctionnelle et de générer un déplacement efficace de l' agent jusqu'à la cible . Il y a donc nécessité d' une première phase de construction de la représentation du déplacement observé , et d' une seconde phase au cours de laquelle l' observateur réactive cette représentation et l' utilise comme guide de production et d' ajustement de son comportement . Le fonctionnement définit pour OLEANNet réplique le déroulement des phases identifiées par Bandura dans la théorie de l' apprentissage par observation , sans pour autant qu' une représentation symbolique ne médiatise cet apprentissage . Les résultats de la deuxième simulation indiquent par ailleurs que notre modèle n' est pas un simple outil mathématique de résolution de la tâche puisque les agents observateurs présentent des performances différentes selon le modèle d' apprentissage auquel ils sont soumis . Ainsi , selon le type de démonstration observé les agents observateurs présentent des qualités d' apprentissage différentes , ce qui implique que le modèle conçu est en mesure de proposer des comportements différenciés . A partir des résultats de la simulation 3 et pour partie ceux de la simulation 4 , nous observons que les performances obtenues par les agents observateurs répliquent deux résultats observés dans les recherches sur l' apprentissage par observation . Les résultats obtenus dans la troisième simulation montrent une détérioration de la performance entre ce qui est appris et ce qui est reproduit . Ils répliquent ceux obtenus par Bandura et Jeffery ( 1973 ) , qui indiquaient que l' individu testé suite à la phase de rétention rappelait mieux ce qu' il avait codé , qu' il ne le réalisait effectivement en phase de production . De même avec OLEANNet , la représentation construite au cours de la phase d' acquisition est de meilleure qualité dans l' approximation de la trajectoire observée que ne l' est la production effective du comportement . Cela implique que l' élaboration et l' utilisation d' une représentation distribuée renvoient au même Les résultats de la deuxième simulation indiquent par ailleurs que notre modèle n' est pas un simple outil mathématique de résolution de la tâche puisque les agents observateurs présentent des performances différentes selon le modèle d' apprentissage auquel ils sont soumis . Ainsi , selon le type de démonstration observé les agents observateurs présentent des qualités d' apprentissage différentes , ce qui implique que le modèle conçu est en mesure de proposer des comportements différenciés . A partir des résultats de la simulation 3 et pour partie ceux de la simulation 4 , nous observons que les performances obtenues par les agents observateurs répliquent deux résultats observés dans les recherches sur l' apprentissage par observation . Les résultats obtenus dans la troisième simulation montrent une détérioration de la performance entre ce qui est appris et ce qui est reproduit . Ils répliquent ceux obtenus par Bandura et Jeffery ( 1973 ) , qui indiquaient que l' individu testé suite à la phase de rétention rappelait mieux ce qu' il avait codé , qu' il ne le réalisait effectivement en phase de production . De même avec OLEANNet , la représentation construite au cours de la phase d' acquisition est de meilleure qualité dans l' approximation de la trajectoire observée que ne l' est la production effective du comportement . Cela implique que l' élaboration et l' utilisation d' une représentation distribuée renvoient au même pattern de résultats , donc que l' émergence de l' apprentissage par observation apparaît en dehors du recours aux symboles . de résultats , donc que l' émergence de l' apprentissage par observation apparaît en dehors du recours aux symboles . Les résultats de la dernière simulation montrent qu' au-delà d' une simple réplication des résultats quant à une tâche de transfert , OLEANNet exhibe effectivement la capacité à généraliser un comportement appris à de nouvelles situations . Les résultats obtenus en tâche de transfert révèlent que les agents observateurs réalisent efficacement la tâche , cependant , un effet facilitateur de l' observation d' une démonstration peu illustrative a pu être constaté . Ces résultats vont dans le sens de ceux obtenus par Shea Les résultats de la dernière simulation montrent qu' au-delà d' une simple réplication des résultats quant à une tâche de transfert , OLEANNet exhibe effectivement la capacité à généraliser un comportement appris à de nouvelles situations . Les résultats obtenus en tâche de transfert révèlent que les agents observateurs réalisent efficacement la tâche , cependant , un effet facilitateur de l' observation d' une démonstration peu illustrative a pu être constaté . Ces résultats vont dans le sens de ceux obtenus par Shea et al. ( 2000 ) puisque les agents ayant appris à partir d' une démonstration peu illustrative sont plus à même de transférer ces connaissances sur une situation similaire que ceux ayant appris seuls et ceux ayant appris par observation d' une démonstration illustrative . Cela indique que la représentation construite au cours de l' apprentissage par observation permet le transfert de ces connaissances sur une situation voisine . ( 2000 ) puisque les agents ayant appris à partir d' une démonstration peu illustrative sont plus à même de transférer ces connaissances sur une situation similaire que ceux ayant appris seuls et ceux ayant appris par observation d' une démonstration illustrative . Cela indique que la représentation construite au cours de l' apprentissage par observation permet le transfert de ces connaissances sur une situation voisine . Au-delà de la validation de l' architecture d' OLEANNet , ces simulations nous permettent d' envisager des explications aux résultats obtenus . Ainsi , la dégradation de la performance souvent observée en expérimentation , mais peu expliquée , peut être envisagée comme le résultat des approximations successives qui interviennent en phase d' acquisition puis en phase de production . Ainsi , au cours de l' apprentissage l' individu réaliserait une première approximation de la tâche pendant la phase d' acquisition . Cette approximation traduit le codage qui s' opère sur les informations saillantes du comportement observé . Ce codage n' implique cependant pas une réalisation efficace en dehors de la phase de production . De plus , en fonction de l' illustrativité de la tâche , la représentation construite intègre plus ou moins d' éléments spécifiques . Plus la trajectoire observée est illustrative , plus l' apprentissage est contraignant . La représentation élaborée en observation intègre alors des informations particulières sur les changements de direction . En revanche , l' observation d' une trajectoire peu illustrative induit une contrainte d' apprentissage moindre . La représentation intègre alors des caractéristiques plus générales d' atteinte de cible . Au cours de la phase de production , l' individu réalise une seconde approximation à partir de l' approximation précédente . C' est la raison pour laquelle la réalisation effective de la tâche est plus éloignée de la démonstration que ne l' est la représentation construite au cours de l' observation . Ce qui reflète une effective dégradation de la performance entre rappel et production . En fonction du type d' apprentissage auquel les agents sont soumis ( observation de trajectoire proche ou éloignée de la diagonale ) , l' utilisation de la représentation comme guide de la production va induire une contrainte plus ou moins exigeante dans l' approximation du comportement effectif . Cela se traduit en tâche de transfert par une capacité à généraliser de façon performante les connaissances acquises lorsque celles -ci sont peu spécifiques à la tâche . Enfin , au-delà d' un simple apprentissage classique , les simulations rendent compte d' un effet d' approximation de la trajectoire idéale . En effet , il s' avère que les agents observateurs sont plus performants dans l' approximation de la trajectoire idéale après la phase de production qu' ils ne le sont dans l' approximation de la trajectoire observée . Ces résultats vont dans le sens de ceux obtenus par Blandin Au-delà de la validation de l' architecture d' OLEANNet , ces simulations nous permettent d' envisager des explications aux résultats obtenus . Ainsi , la dégradation de la performance souvent observée en expérimentation , mais peu expliquée , peut être envisagée comme le résultat des approximations successives qui interviennent en phase d' acquisition puis en phase de production . Ainsi , au cours de l' apprentissage l' individu réaliserait une première approximation de la tâche pendant la phase d' acquisition . Cette approximation traduit le codage qui s' opère sur les informations saillantes du comportement observé . Ce codage n' implique cependant pas une réalisation efficace en dehors de la phase de production . De plus , en fonction de l' illustrativité de la tâche , la représentation construite intègre plus ou moins d' éléments spécifiques . Plus la trajectoire observée est illustrative , plus l' apprentissage est contraignant . La représentation élaborée en observation intègre alors des informations particulières sur les changements de direction . En revanche , l' observation d' une trajectoire peu illustrative induit une contrainte d' apprentissage moindre . La représentation intègre alors des caractéristiques plus générales d' atteinte de cible . Au cours de la phase de production , l' individu réalise une seconde approximation à partir de l' approximation précédente . C' est la raison pour laquelle la réalisation effective de la tâche est plus éloignée de la démonstration que ne l' est la représentation construite au cours de l' observation . Ce qui reflète une effective dégradation de la performance entre rappel et production . En fonction du type d' apprentissage auquel les agents sont soumis ( observation de trajectoire proche ou éloignée de la diagonale ) , l' utilisation de la représentation comme guide de la production va induire une contrainte plus ou moins exigeante dans l' approximation du comportement effectif . Cela se traduit en tâche de transfert par une capacité à généraliser de façon performante les connaissances acquises lorsque celles -ci sont peu spécifiques à la tâche . Enfin , au-delà d' un simple apprentissage classique , les simulations rendent compte d' un effet d' approximation de la trajectoire idéale . En effet , il s' avère que les agents observateurs sont plus performants dans l' approximation de la trajectoire idéale après la phase de production qu' ils ne le sont dans l' approximation de la trajectoire observée . Ces résultats vont dans le sens de ceux obtenus par Blandin et al. ( 1999 ) , et montrent que l' apprentissage par observation permet non seulement la reproduction d' un comportement mais permet l' apprentissage de la règle sous-jacente à ce comportement . ( 1999 ) , et montrent que l' apprentissage par observation permet non seulement la reproduction d' un comportement mais permet l' apprentissage de la règle sous-jacente à ce comportement . Le simulations conduites dans ce chapitre nous amènent à penser qu' OLEANNet était un modèle probant de l' apprentissage par observation tant au niveau de son fonctionnement que de sa capacité à répliquer des résultats classiques . De plus , OLEANNet nous a permis de proposer des explications complémentaires de phénomènes constatés lors de l' apprentissage par observation d' une habileté motrice . Nous avions proposé qu' au-delà de ces critères , OLEANNet serait en mesure de proposer des prédictions sur le comportement des sujets humains , nous proposons dans le chapitre suivant de tester l' adéquation de ces prédictions aux données recueillies auprès de sujets humains dans le cadre d' une tâche équivalente . Chapitre 2 : Confrontation des prédictions d' OLEANNet aux données recueillies auprès des sujets humains La confrontation des prédictions d' OLEANNet aux données humaines nécessite de concevoir , pour la passation avec les sujets humains , une tâche équivalente à celle utilisée pour les simulations précédentes . La tâche des sujets consiste à observer une démonstration de l' utilisation d' un dispositif reflétant une séquence d' actions ( permettant le déplacement d' un pion dans un espace en deux dimensions ) , puis de la reproduire . Il convient dans un premier temps de tester que l' observation améliore la performance par rapport à un apprentissage par pratique physique uniquement et de déterminer les conditions minimales pour que cet apprentissage par observation émerge ( pré-test ) . En effet , Kelly et Burton ( 2001 ) , les tâches impliquant des séquences d' actions ne peuvent pas toutes être apprises par observation . Ceci permet de vérifier que la tâche proposée est bien une tâche d' apprentissage et que cet apprentissage est amélioré par l' observation préalable de quelqu' un la réalisant . Nous proposons ensuite trois études considérant des aspects particuliers de l' apprentissage par observation . Chaque étude se décompose en une simulation et une expérience . Nous présenterons dans la partie simulation les résultats et les prédictions d' OLEANNet , puis dans la partie expérience la confrontation systématique des prédictions obtenues aux données recueillies chez les sujets humains pour les mêmes conditions expérimentales . La première étude , inspirée des travaux de Deakin et Proteau ( 2002 ) , a pour objectif de déterminer l' influence du programme d' acquisition ( variation du nombre d' observations et de pratiques ) et de deux séquences d' actions ( deux démonstrations de déplacement du pion ) sur la performance en reproduction . Dans la deuxième étude , nous examinerons plus précisément l' évolution de l' apprentissage en fonction des conditions d' observation en neutralisant certaines des limites relevées dans la première étude . En réponse aux problèmes de détermination des facteurs rendant la représentation cognitive fonctionnelle , nous essayerons d' identifier si l' observation et/ou la pratique sont à la base de l' émergence de la fonctionnalité de la représentation . Peu d' études , à notre connaissance , rendent compte de l' effet de la représentativité de la séquence observée sur la performance , nous proposons donc dans une troisième étude de déterminer l' influence spécifique de la séquence observée sur la performance en reproduction . 1 . Pré-test et pilotage de la tâche proposée aux sujets humains L' objectif de ce pré-test était de tester la tâche créée pour les sujets humains . Nous devions pour cela vérifier que la tâche proposée pouvait être apprise par observation , et nous nous attendions à ce que les sujets réussissent mieux la tâche lorsqu' ils sont soumis à un apprentissage par observation que lorsqu' ils apprennent seuls . Ensuite , ce pré-test permettait de déterminer les conditions minimales requises pour que l' apprentissage par observation soit efficace . Méthode Participants Cinquante six étudiants de première année de Psychologie à l' Université de Savoie ont participé volontairement à cette expérience . Ils étaient tous droitiers et aucun ne présentaient de trouble visuel . Matériel Les sujets étaient placés face à un ordinateur portable ( iBook ) auquel était reliée une souris externe . Comme indiqué dans la figure 14 , l' écran présentait un dispositif programmé sur Hypercard . Ce dispositif était constitué de deux compteurs sous lesquels quatre flèches orientées étaient disposées en étoile . Les compteurs présentaient des valeurs calculées automatiquement à chaque action de la souris sur l' une des flèches . Le dispositif permettait de déplacer fictivement un pion Le dispositif permettait de déplacer fictivement un pion orienté dans un espace orthonormé . La flèche du haut permettait de déplacer le pion d' une unité positive ( avance ) et la flèche du bas de déplacer le pion d' une unité négative ( recule ) . La flèche de droite permettait de faire pivoter le pion d' un quart de tour à droite et la flèche de gauche de faire pivoter le pion d' un quart de tour à gauche dans un espace orthonormé . La flèche du haut permettait de déplacer le pion d' une unité positive ( avance ) et la flèche du bas de déplacer le pion d' une unité négative ( recule ) . La flèche de droite permettait de faire pivoter le pion d' un quart de tour à droite et la flèche de gauche de faire pivoter le pion d' un quart de tour à gauche [ 22 ] . Les sujets ne pouvaient qu' observer le dispositif présenté figure 14 ( page suivante ) , sans savoir que celui -ci ne faisait que refléter des informations concernant le déplacement d' un pion dans un espace à deux dimensions . . Les sujets ne pouvaient qu' observer le dispositif présenté figure 14 ( page suivante ) , sans savoir que celui -ci ne faisait que refléter des informations concernant le déplacement d' un pion dans un espace à deux dimensions . Figure 14 : Représentation du dispositif présenté à l' écran et observé par les sujets Un algorithme calculait en temps réel les valeurs de chacun des compteurs . La première valeur ( compteur de gauche ) représentait la distance euclidienne entre le pion orienté et la cible à atteindre ( point de référence ) ; la seconde ( compteur de droite ) indiquait l' angle entre le pion orienté et la cible . A chacune des actions de la souris sur l' une des flèches , ces valeurs étaient mises automatiquement à jour . Elles étaient arrondies à l' unité supérieure pour les valeurs supérieures à 0.5 et à l' unité inférieure pour les valeurs inférieures à 0.5 afin de ne pas surcharger la quantité d' informations présentées sur chacun des compteurs . Les éléments nécessaires au calcul de la distance et de l' angle sont présentés sur la figure 15 . Figure 15 : Positionnement du pion au départ et de la cible pour le calcul des valeurs des compteurs à chaque action de souris sur les flèches . Tâche Les sujets étaient testés individuellement et affectés aléatoirement à l' une des 2 conditions expérimentales d' apprentissage ( seul vs par observation ) . La tâche des sujets consistait à obtenir des valeurs de compteurs égales à zéro en cliquant sur les flèches soit en utilisant seul le dispositif , ce qui revenait à un apprentissage de la tâche par essai-erreur ( condition seul ) soit suite à l' observation de la réalisation de la tâche par l' expérimentateur ( condition d' apprentissage par observation ) . Quelle que soit la condition expérimentale , le point de départ était défini par des valeurs de 23 pour la distance ( compteur gauche ) et 45 pour l' angle ( compteur droit ) . Les conditions expérimentales étaient rendues équivalentes quant au nombre d' essais total d' apprentissage . Chaque sujet de la condition seul devait utiliser huit fois le dispositif . Les sujets de la condition observation observaient quatre fois la démonstration puis réalisaient quatre essais de manipulation du dispositif ( nous reviendrons sur le choix du nombre d' essais dans le paragraphe pilotage p. 144 ) . Description [ 23 ] de la démonstration observée en condition d' apprentissage par observation .. La démonstration de l' utilisation du dispositifLa démonstration de l' utilisation du dispositif [ 24 ] proposée par l' expérimentateur reflétait le déplacement du pion d' un point de départ ayant pour coordonnées ( 1 , 1 ) jusqu'à un point cible ayant pour coordonnées ( 17 , 17 ) . Ceci se traduisait au niveau des compteurs par des valeurs de 23 et 45 au départ , et des valeurs de 0 et 0 au point cible . Cette trajectoire , présentée graphique 13 ( page suivante ) , contenait au total 41 actions réparties en 31 actions avance , 5 actions gauche et 5 actions droite . Cette trajectoire était une illustration de l' utilisation de la règle de l' angle utilisée en simulation . Cependant , les sujets n' avaient pas de support visuel de la trajectoire , il ne la voyait pas en tant que telle . Dès lors , il ne pouvait accéder à la règle qu' au travers des variations des valeurs de compteurs lors de l' utilisation du dispositif par l' expérimentateur . proposée par l' expérimentateur reflétait le déplacement du pion d' un point de départ ayant pour coordonnées ( 1 , 1 ) jusqu'à un point cible ayant pour coordonnées ( 17 , 17 ) . Ceci se traduisait au niveau des compteurs par des valeurs de 23 et 45 au départ , et des valeurs de 0 et 0 au point cible . Cette trajectoire , présentée graphique 13 ( page suivante ) , contenait au total 41 actions réparties en 31 actions avance , 5 actions gauche et 5 actions droite . Cette trajectoire était une illustration de l' utilisation de la règle de l' angle utilisée en simulation . Cependant , les sujets n' avaient pas de support visuel de la trajectoire , il ne la voyait pas en tant que telle . Dès lors , il ne pouvait accéder à la règle qu' au travers des variations des valeurs de compteurs lors de l' utilisation du dispositif par l' expérimentateur . Graphique 13 : Graphique illustrant la trajectoire représentative du déplacement du pion orienté en fonction des actions réalisées au cours de la démonstration . Procédure La même présentation du dispositif a été proposée à tous les sujets . Il leur a été demandé d' imaginer que le dispositif ( compteur et flèche ) était un environnement virtuel dans lequel il était possible de se déplacer à l' aide des flèches ( pointées avec le curseur de la souris ) . Il leur était indiqué que les seules informations dont ils disposaient étaient les deux compteurs ( pointés avec le curseur de la souris ) dont les valeurs variaient à chaque action de souris . Une illustration de la variation de ces valeurs a été proposée au sujet par une action de souris sur chacune des quatre flèches dans le sens des aiguilles d' une montre . Aucun des sujets n' était donc familiarisé par une pratique physique personnelle de la tâche . Condition d' apprentissage par essai-erreur Il était proposé aux sujets d' essayer d' atteindre la cible définie par la valeur zéro pour chacun des compteurs à partir de la position définie par 23 ( compteur gauche ) et 45 ( compteur droit ) , en actionnant les flèches . Il leur était précisé qu' ils auraient la possibilité de réaliser plusieurs essais et que la fin de chacun des essais leur serait indiquée à mesure . Condition d' apprentissage par observation L' apprentissage par observation se déroulait selon les phases d' acquisition et de production . Pour la phase d' acquisition , il était demandé aux sujets d' observer attentivement une démonstration de la façon de se comporter dans cet environnement pour atteindre une cible particulière ( définie par les valeurs 0 , 0 ) à partir d' une position de départ fixe ( définie par 23 , 45 ) . Il n' était pas précisé aux sujets où porter leur attention . Le coût cognitif était donc élevé puisqu' ils devaient porter conjointement leur attention sur les variations des compteurs et sur les actions de la souris sur les flèches . Il leur était précisé qu' ils verraient plusieurs fois cette démonstration et qu' ils devraient ensuite faire de même plusieurs fois . Cette consigne a été élaborée de façon à obliger le sujet à observer afin de reproduire ultérieurement la séquence d' actions , puisque sans précision de la reproduction ultérieure , ce ne sont pas les mêmes processus mis en jeu ( Decety L' apprentissage par observation se déroulait selon les phases d' acquisition et de production . Pour la phase d' acquisition , il était demandé aux sujets d' observer attentivement une démonstration de la façon de se comporter dans cet environnement pour atteindre une cible particulière ( définie par les valeurs 0 , 0 ) à partir d' une position de départ fixe ( définie par 23 , 45 ) . Il n' était pas précisé aux sujets où porter leur attention . Le coût cognitif était donc élevé puisqu' ils devaient porter conjointement leur attention sur les variations des compteurs et sur les actions de la souris sur les flèches . Il leur était précisé qu' ils verraient plusieurs fois cette démonstration et qu' ils devraient ensuite faire de même plusieurs fois . Cette consigne a été élaborée de façon à obliger le sujet à observer afin de reproduire ultérieurement la séquence d' actions , puisque sans précision de la reproduction ultérieure , ce ne sont pas les mêmes processus mis en jeu ( Decety et al. , 1997 ) . Pour la phase de production , les sujets étaient ensuite invités à reproduire la séquence observée en utilisant la souris . Il leur était indiqué qu' ils disposeraient de plusieurs essais et que la fin de chaque essai leur serait indiquée au fur et à mesure. , 1997 ) . Pour la phase de production , les sujets étaient ensuite invités à reproduire la séquence observée en utilisant la souris . Il leur était indiqué qu' ils disposeraient de plusieurs essais et que la fin de chaque essai leur serait indiquée au fur et à mesure . Etant donné l' objectif de ce pré-test , nous testerons l' efficacité de l' apprentissage par observation dans la condition la plus restrictive de quatre observations et quatre reproductions déterminées lors du pilotage de la tâche que nous allons maintenant exposer . Pilotage L' objectif du pilotage était de déterminer les conditions minimales requises pour que les sujets apprennent la tâche par observation . Cela permettait de déterminer le nombre d' observation maximal auquel les sujets pouvaient être soumis avant d' accéder à un apprentissage « par coeur » de la démonstration proposée . Ce pilotage a été conduit auprès de dix sujets . Nous leur avons proposé un apprentissage par observation selon la procédure précédemment expliquée ( 16 observations de la démonstration et 16 reproductions de la séquence observée ) . Suite à cela , nous avons demandé aux sujets d' évaluer combien d' observations au minimum ils estimaient nécessaires pour reproduire la séquence et d' indiquer le nombre maximum d' observations qui leur semblait nécessaire pour apprendre la séquence et être capable de la décrire verbalement . Ce pilotage , nous a permis d' identifier qu' un minimum de 4 observations et un maximum de 8 observations semblait nécessaires pour que les sujets s' estiment en mesure de verbaliser la séquence . Nous choisissons de considérer qu' un minimum de quatre observations et un maximum de sept observations de la démonstration seront utilisés lors de l' apprentissage par observation . Mesure Afin de vérifier que cette tâche pouvait être apprise par observation , la variable dépendante retenue était la distance minimale de passage de la trajectoire réalisée par le sujet par rapport à la cible . Elle était évaluée par la distance euclidienne entre le point de passage le plus proche de la cible et le point cible . Le choix de cet indicateur au dépend d' un indicateur de réussite dichotomique de type oui / non permettait de quantifier de façon plus précise les effets des conditions mises en jeu dans l' expérience . En effet , même si les sujets n' atteignaient pas la cible , cette distance permettait d' évaluer la façon dont était influencée la manipulation du dispositif par les conditions d' apprentissage . Plus la distance était faible plus les sujets approchaient de la cible , donc plus l' apprentissage était efficace . Cet indicateur était relevé sur les quatre essais communs de manipulation du dispositif dits essais de pratique , c' est-à-dire les quatre derniers essais en condition seul et les quatre essais de production en condition d' apprentissage par observation . Pour chaque essai , les sujets étaient autorisés à produire quarante cinq actions de souris . Résultats Les données recueillies sur les quatre essais de pratique sont soumises à une analyse de variance selon un plan 2 ( condition d' apprentissage ) * 4 ( essais de pratique ) , intégrant une mesure répétée sur ce dernier facteur . L' analyse canonique indique un effet de la condition d' apprentissage sur la distance de passage de la trajectoire réalisée par les sujets , L' analyse canonique indique un effet de la condition d' apprentissage sur la distance de passage de la trajectoire réalisée par les sujets , F ( 1 , 27 ) = 10.46 , ( 1 , 27 ) = 10.46 , p < . 01 . La trajectoire réalisée par les sujets ayant appris la tâche par observation passe plus près du point cible ( < . 01 . La trajectoire réalisée par les sujets ayant appris la tâche par observation passe plus près du point cible ( M = 5.44 ) que celle proposée par les sujets ayant appris la tâche seul ( 5.44 ) que celle proposée par les sujets ayant appris la tâche seul ( M = 13.80 ) . Comme indiqué dans le tableau 4 , la distance moyenne de passage n' est pas influencée par la pratique , 13.80 ) . Comme indiqué dans le tableau 4 , la distance moyenne de passage n' est pas influencée par la pratique , F ( 3 , 81 ) = 2.09 , NS . De plus , la condition d' apprentissage n' influence pas les essais de pratique , puisque aucun effet d' interaction entre ces deux variables n' apparaît , ( 3 , 81 ) = 2.09 , NS . De plus , la condition d' apprentissage n' influence pas les essais de pratique , puisque aucun effet d' interaction entre ces deux variables n' apparaît , F ( 3 , 81 ) = . 71 , NS. ( 3 , 81 ) = . 71 , NS . Tableau 4 : Distance moyenne de passage pour chaque essai selon les conditions d' apprentissage Note : les moyennes qui ne partagent pas les mêmes indices diffèrent au moins à p < . 05 Discussion Ce pré-test avait pour objectif de vérifier que la tâche conçue permettait de mettre en évidence une amélioration de la performance lorsque les sujets étaient soumis à une phase d' acquisition préalable à la production effective de la tâche . Les résultats obtenus vont en ce sens , le point de passage de la trajectoire est plus proche de la cible pour les sujets ayant appris par observation par rapport à ceux ayant appris seul . La performance est donc améliorée par l' observation préalable de l' utilisation du dispositif . Nous avons pris soin de ne donner aux sujets aucun support visuel de la trajectoire , il ne pouvait donc pas construire une représentation imagée de celle -ci . Malgré cela , ils apprennent à produire un comportement approchant celui observé : ils construisent donc une représentation efficace de l' utilisation du dispositif . De plus , les sujets sont incapables de verbaliser la séquence ; c' est-à-dire qu' aucun n' est en mesure de la rappeler verbalement ni d' en expliquer le fonctionnement . Les sujets semblent avoir appris de façon implicite à manipuler le dispositif conduisant à intégrer la règle de l' angle . Il semble que l' amélioration de la réalisation de la tâche est sous-tendue par la possibilité de créer une représentation , non symbolique , de la démonstration au cours de la phase d' acquisition et d' utiliser cette représentation comme guide du comportement au cours de la phase de production . La tâche créée , malgré le coût attentionnel qu' elle induit , peut donc être apprise par observation . Par ailleurs , elle est non verbalisable ce qui implique un apprentissage implicite de la règle de l' angle . Cela nous conduit à considérer que la tâche conçue peut être utilisée comme base de confrontation des résultats obtenus par les sujets à ceux prédits par OLEANNet . 2 . Etude 1 La littérature sur l' acquisition des habiletés motrices fournit de nombreuses données sur l' influence des phases de l' apprentissage par observation sur la performance , nous souhaitons utiliser ce cadre pour tester notre modèle . L' un des résultats récurrent indique que la performance est influencée par la répartition des essais proposés en phase d' acquisition et ceux proposés en phase de production . Ainsi , Deakin et Proteau ( 2002 ) ont mis en évidence que l' apprentissage par observation n' était efficace que si le sujet avait la possibilité de pratiquer suffisamment de fois la tâche . Dans cette expérience , les sujets devaient compléter un puzzle informatique , en déplaçant des boîtes dans un espace fermé de type damier dont certaines cases étaient interdites afin de les faire entrer dans un espace de destination . Tous les sujets disposaient du même nombre d' essais total , seule la répartition des essais d' observation et de pratique étaient manipulée . La première condition impliquait 100 % des essais en pratique : les sujets réalisaient la tâche seul . Dans la deuxième condition , les sujets observaient pour 50 % des essais la réalisation de la tâche et la pratiquaient pendant 50 % des essais . Dans la dernière condition , 75 % des essais étaient destinés à l' observation et les 25 % restants à la pratique . Les résultats indiquaient que le taux de réussite à la complétion du puzzle était plus important pour les conditions 1 et 2 que celui de la condition 3 ( impliquant une majorité d' essais d' observations ) . Selon Deakin et Proteau ( 2002 ) , les individus ne peuvent bénéficier de l' apprentissage par observation qu' à partir du moment où ils ont la possibilité de confronter les connaissances mémorisées en phase d' acquisition suffisamment de fois à la pratique personnelle de cette activité . Selon ces auteurs , la performance est influencée par la quantité de pratique qui permet de rendre la représentation construite en phase d' acquisition fonctionnelle , c' est-à-dire utilisable efficacement pour guider le comportement en phase de production . Par ailleurs , Carroll et Bandura ( 1990 ) ont montré , pour l' apprentissage par observation d' une séquence de gestes du bras , que plus l' individu voyait la démonstration , plus la représentation construite était adéquate , et que de là dépendait la performance . En effet , la performance des sujets en reconnaissance des gestes observés sur des photos augmentait avec la quantité d' observations autorisée . D' après ces deux résultats , il semble difficile de déterminer si la fonctionnalité de la représentation dépend d' une quantité d' observation ou d' une quantité de pratique . De plus , nous avons constaté que la procédure expérimentale utilisée par Deakin et Proteau ( 2002 ) intercalait les phases de production avec les phases d' acquisition : les sujets observaient et pratiquaient la tâche , puis observaient et pratiquaient de nouveau . Il s' avère dès lors difficile de déterminer si la performance est influencée par la pratique ou si elle est influencée par l' observation . Selon nous , l' étude de l' influence de chacune des phases ne peut être mise en évidence qu' en dissociant les essais d' observation et de pratique tout en maintenant constant le nombre d' essai total . Pour cela , nous avons testé l' influence de chacune des phases en proposant aux sujets la totalité des essais d' observation en phase d' acquisition avant de pratiquer la totalité des essais restants en phase de production . Par ailleurs , les simulations du chapitre précédent nous ont conduit à considérer le type de démonstration observé comme influençant la performance . Nous avons donc intégré cette variable . Les résultats de la simulation 2 ( p. 112 ) indiquaient que l' influence de la démonstration n' était manifeste qu' à un niveau d' évaluation spécifique de la performance se traduisant par une amélioration de la performance pour une démonstration peu illustrative de la règle . Dans un premier temps , nous avons conduit une simulation intégrant la répartition des essais entre phase d' acquisition et phase de production et le type de démonstration observé , OLEANNet devrait nous fournir des prédictions sur l' influence de chacune de ces variables sur la performance . L' expérience qui a suivi permettait la confrontation systématique des données des sujets , pour des conditions expérimentales équivalentes , aux prédictions d' OLEANNet . 2.1 . Simulation L' objectif de cette simulation était de produire un ensemble de données permettant de prédire les résultats qu' obtiendraient les sujets pour des programmes d' apprentissage par observation manipulant la répartition d' observation et de pratique ainsi que le type de démonstration observé . Nous ne posons aucune hypothèse spécifique quant aux résultats d' OLEANNet puisque nous souhaitons les utiliser en terme de prédictions , mais nous nous attendons à un effet du programme d' apprentissage et de la démonstration observée sur la performance . Méthode Participants Au total cent vingt six agents observateurs ont été soumis aux phases d' apprentissage par observation . Ces agents observateurs correspondaient à vingt et un réseaux de neurones de type OLEANNet dont les matrices de poids de départ étaient tirées aléatoirement . Comme explicité au cours de la validation d' OLEANNet ( cf. simulation 2 , p . 112 ) , le tirage aléatoire des matrices de poids de départ permettait de générer des agents dont les répertoires comportementaux de base étaient différents et de les utiliser dans chacune des conditions expérimentales sans qu' elles ne s' affectent mutuellement . Tâche et procédure Avant propos Lorsque les agents observateurs sont soumis à l' apprentissage par observation , il s' agit toujours de celui défini pour OLEANNet dans le chapitre précédent . A savoir , qu' il est régi par les phases identifiées comme nécessaires à l' acquisition d' un nouveau comportement . La première phase dite phase d' acquisition consiste pour les agents à observer et mémoriser le comportement émis par l' agent démonstrateur . La seconde dite phase de production consiste à reproduire ce comportement en utilisant la représentation distribuée construite pendant la première phase comme guide d' ajustement du comportement émis . Suite à ces deux phases , les agents observateurs sont testés quant à leur capacité à reproduire le comportement observé . Pour les agents démonstrateurs , nous réutilisons ceux créés pour les simulations du chapitre précédent , nous ne détaillerons donc pas les conditions de leur apprentissage . La tâche des agents consistait à apprendre par observation l' une des trajectoires permettant d' atteindre une cible selon des programmes d' apprentissage manipulant la répartition des quantités d' observations et de pratiques . Pour cela , nous avons utilisé deux démonstrations et trois types de programmes dont les détails suivent . Trajectoires utilisées pour les démonstrations Les agents observateurs ont été soumis à l' apprentissage par observation du déplacement d' un point de départ jusqu'à une cible selon deux trajectoires différentes . La tâche des agents observateurs consistait en 25 observations de la démonstration de la trajectoire ( phase d' acquisition ) puis en 25 reproductions ( phase de production ) . Deux agents démonstrateurs ont été utilisés présentant deux trajectoires possibles pour atteindre une cible placée en ( 10 , 10 ) depuis une position de départ ( 1 , 1 ) . La première , peu illustrative de la règle de l' angle , présentée sur le graphique 14 , contenait 6 changements de direction et 18 actions avance ( démonstration 1 ) soit un total de 24 actions . La seconde , illustrative de la règle proposait 27 actions réparties en 9 changements de direction et 18 actions avance ( démonstration 2 ; illustrée graphique 15 , page suivante ) . Graphique 14 : Trajectoire peu illustrative de la règle de l' angle proposée en démonstration par le second agent démonstrateur Graphique 15 : Trajectoire illustrative de la règle de l' angle proposée en démonstration par le premier agent démonstrateur Caractéristiques des programmes d' apprentissage appliqués aux agents observateurs Les programmes d' apprentissage sont inspirés du paradigme expérimental utilisé par Deakin et Proteau ( 2002 ) , répartissant le pourcentage d' essais en phase d' acquisition et de production ( 50 % d' observation et 50 % de pratique , 75 % d' observation et 25 % de pratique , 100 % d' observation ) . Nous avons utilisé comme base de répartition des essais la condition de 25 itérations en phase d' acquisition et 25 itérations en phase de production correspondant à l' émergence d' un apprentissage par observation efficace ( déterminé dans les simulations de validation d' OLEANNet ) . Trois programmes d' apprentissage contenant le même nombre d' essais total , c' est-à-dire cinquante essais , ont été élaborés à partir des contraintes exposées : Programme 1 : la répartition des essais était équilibrée entre observation et pratique , cela revenait à proposer 25 itérations en phase d' acquisition et 25 itérations en phase de production . Programme 2 : il contenait une majorité d' observation , la phase d' acquisition contenait 38 itérations et la phase de production en contenait 12 . Programme 3 : il proposait un apprentissage reposant sur 49 itérations en phase d' acquisition et 1 itération en phase de production . Résumé du Design expérimental Tableau 5 : Résumé des conditions expérimentales croisant type de démonstration et programmes d' apprentissage Mesure Les critères retenus pour évaluer la performance mesurent la réussite à la tâche et la qualité de la reproduction . Pour réaliser ces mesures , nous retenons les deux types d' indicateurs décrits ci-après . Indicateur de réussite : - distance euclidienne entre le point de passage de la trajectoire le plus proche de la cible et le point cible ( distance de passage ) . Plus la distance est faible , plus la trajectoire produite s' approche de la cible . Cette mesure informe sur ce que nous qualifions de réussite à la tâche . Indicateurs de qualité : - distance euclidienne moyenne entre trajectoire produite et trajectoire observée ( distance ) . Cette distance correspond à la moyenne des distances entre chaque point de la trajectoire réalisée et les points de la trajectoire observée . Plus la distance moyenne est élevée plus la trajectoire produite s' éloigne de la trajectoire observée . Cette mesure informe sur la qualité générale de la trajectoire produite . - Similarité chronologique moyenne des actions ( similarité ) . Chaque action proposée à mesure de la trajectoire produite est comparée à celle proposée en démonstration . Plus la moyenne obtenue est élevée plus les trajectoires sont similaires . Cette mesure informe sur la qualité spécifique de la séquence d' action . Résultats Une analyse de variance est réalisée sur les données collectées lors de la simulation du déplacement des agents suite à l' apprentissage par observation selon un plan factoriel 2 ( type de démonstration ) * 3 ( programme d' apprentissage ) . Réussite à la tâche mesurée par la distance de passage L' analyse des effets principaux indique que le programme d' apprentissage n' a pas d' effet sur la distance de passage de la trajectoire produite par rapport au point cible , L' analyse des effets principaux indique que le programme d' apprentissage n' a pas d' effet sur la distance de passage de la trajectoire produite par rapport au point cible , F ( 2 , 120 ) = 1.12 , NS , la réussite à la tâche est équivalente pour les trois programmes ( ( 2 , 120 ) = 1.12 , NS , la réussite à la tâche est équivalente pour les trois programmes ( M = 1.96 , 1.96 , M = 2.65 et 2.65 et M = 3.24 respectivement pour les programmes de 1 à 3 ) . Le type de démonstration observé induit une distance de passage plus faible pour la démonstration peu illustrative ( 3.24 respectivement pour les programmes de 1 à 3 ) . Le type de démonstration observé induit une distance de passage plus faible pour la démonstration peu illustrative ( M = 1.86 ) par rapport à la démonstration illustrative ( 1.86 ) par rapport à la démonstration illustrative ( M = 3.36 ) , 3.36 ) , F ( 1 , 120 ) = 4.49 , ( 1 , 120 ) = 4.49 , p < . 05 . Cependant , nous ne relevons aucun effet de l' interaction , < . 05 . Cependant , nous ne relevons aucun effet de l' interaction , F ( 2 , 120 ) = 1.41 , NS. ( 2 , 120 ) = 1.41 , NS . Qualité générale mesurée par la distance entre les trajectoires produite et observée Concernant la qualité générale , l' analyse des effets principaux indique un effet du programme d' apprentissage sur la distance entre les trajectoires produite et observée , Concernant la qualité générale , l' analyse des effets principaux indique un effet du programme d' apprentissage sur la distance entre les trajectoires produite et observée , F ( 2 , 120 ) = 3.56 , ( 2 , 120 ) = 3.56 , p < . 05 . La distance moyenne obtenue augmente avec l' augmentation de la quantité d' observation , donc avec la diminution de la pratique ( < . 05 . La distance moyenne obtenue augmente avec l' augmentation de la quantité d' observation , donc avec la diminution de la pratique ( M = 2.13 , 2.13 , M = 2.60 , 2.60 , M = 3.91 respectivement pour les programmes de 1 à 3 ) . Le type de démonstration observé n' influence cependant pas la distance entre les trajectoires ( 3.91 respectivement pour les programmes de 1 à 3 ) . Le type de démonstration observé n' influence cependant pas la distance entre les trajectoires ( Md 1 = 2.71 et d 1 = 2.71 et Md 2 = 3.05 ) , d 2 = 3.05 ) , F ( 1 , 120 ) = . 37 , NS . En outre , nous n' observons aucun effet d' interaction entre ces variables , ( 1 , 120 ) = . 37 , NS . En outre , nous n' observons aucun effet d' interaction entre ces variables , F ( 2 , 120 ) = . 20 , NS. ( 2 , 120 ) = . 20 , NS . Qualité spécifique mesurée par la similarité chronologique des actions L' analyse de variance réalisée sur les données de similarité moyenne obtenue auprès des agents ne met en évidence aucun effet principal ni du programme d' apprentissage ( L' analyse de variance réalisée sur les données de similarité moyenne obtenue auprès des agents ne met en évidence aucun effet principal ni du programme d' apprentissage ( F ( 2 , 120 ) < 1 ) , ni du type de démonstration ( ( 2 , 120 ) < 1 ) , ni du type de démonstration ( F ( 1 , 120 ) < 1 ) ni d' effet d' interaction entre ces variables , ( ( 1 , 120 ) < 1 ) ni d' effet d' interaction entre ces variables , ( F ( 2 , 120 ) = 2.12 , NS ) . Nous ne proposons donc aucune prédiction quant aux résultats attendus chez les sujets humains . ( 2 , 120 ) = 2.12 , NS ) . Nous ne proposons donc aucune prédiction quant aux résultats attendus chez les sujets humains . Prédictions d' OLEANNet A partir des résultats obtenus avec OLEANNet , nous pouvons émettre un ensemble d' hypothèses concernant les effets attendus auprès des sujets humains dans l' expérience qui suit . Ainsi , nous posons l' hypothèse selon laquelle le type de démonstration observé influencerait la réussite à la tâche et que l' effet du programme d' apprentissage se manifesterait au niveau de la qualité générale de la trajectoire produite . Plus spécifiquement , il semble que l' observation d' une démonstration peu illustrative contribue à un meilleur apprentissage qu' une démonstration illustrative . Cela devrait se traduire chez les sujets par une distance de passage ( de la trajectoire produite par rapport à la cible ) plus faible lorsque celle -ci fait suite à une démonstration peu illustrative par rapport à une démonstration illustrative . De plus , nous pouvons émettre l' hypothèse d' une diminution de la qualité générale de la trajectoire produite . Cela se traduit par une augmentation de la distance entre les trajectoires produite et observée , avec l' augmentation de la quantité d' observation et la diminution de la quantité de pratique . Lorsqu' OLEANNet ne prédit aucun effet , nous analysons quand même les données des sujets . 2.2 . Expérience Afin de confronter ces premières prédictions d' OLEANNet aux données de sujets humains , nous avons proposé des conditions expérimentales , analogues à celles utilisées en simulation , sur un dispositif équivalent à celui présenté dans le pré-test de la tâche . Cela nous a permis de tester l' effet du type de démonstration et celui de programme d' apprentissage dans des conditions expérimentales similaires à celles de la simulation . Nous attendions un effet de la démonstration sur la réussite à la tâche dans le sens d' un meilleur apprentissage pour une démonstration peu illustrative en comparaison d' une démonstration illustrative . De plus , un effet du programme d' apprentissage sur la qualité générale de la trajectoire produite devrait apparaître dans le sens d' une diminution de la qualité avec l' augmentation du nombre d' observations . Méthode Participants Quatre vingt neuf étudiants de première année de psychologie ont participé volontairement à l' expérience . Ils sont tous droitiers et aucun ne présente de trouble visuel . Matériel Le matériel utilisé pour cette expérience est strictement équivalent à celui validé dans le pré-test . Pour résumer , il s' agit d' un dispositif , intégrant deux compteurs et quatre flèches orientées , présenté sur un ordinateur portable de type Ibook avec une souris externe . Il simule le déplacement fictif d' un pion dans un espace en deux dimensions ( non visible par le sujet ) , dont la position est codée sous forme de distance et d' angle au niveau des compteurs ( visibles par le sujet ) . Le programme de calcul des valeurs des compteurs liées aux actions de souris sur les flèches est programmé sur hypercard et l' affichage des valeurs réactualisées est immédiat . Tâche et procédure Les sujets étaient testés individuellement et aléatoirement affectés dans les conditions expérimentales . La tâche des sujets consistait à obtenir des valeurs de compteurs égales à zéro en cliquant sur les flèches à l' aide de la souris . Les mêmes conditions expérimentales que celles utilisées en simulation ont été mises en place auprès des sujets . Elles étaient de la même façon issues du croisement du type de démonstration ( 2 ) et du programme d' apprentissage ( 3 ) . La procédure d' apprentissage par observation des sujets était également équivalente à celle présentée pour la condition d' apprentissage par observation du le pré-test . Après avoir présenté le dispositif au sujet , il était invité à observer attentivement la démonstration de son utilisation par l' expérimentateur , puis à reproduire l' utilisation de ce dispositif . Trajectoires utilisées pour la démonstration Nous avons créé deux démonstrations selon que la trajectoire illustre fréquemment ou non le respect de la règle de l' angle ( utilisée en simulation ) . Nous n' avons pu utiliser celles des simulations puisqu' elles impliquaient des séquences d' actions sur les flèches facilement mémorisables . Puisque , par exemple , la trajectoire illustrative revenait à utiliser les flèches selon la séquence répétée gauche-haut-droite-haut . La périodicité étant évidente la tâche aurait été apprise explicitement , ce qui était contraire à l' objectif fixé de non verbalisation . La première démonstration correspondait à une trajectoire peu illustrative de la règle de l' angle utilisée dans les simulations . Comme illustré sur le graphique 16 , elle contenait 6 actions de changements de direction et 32 actions avance , soit 38 actions au totales . Le point de départ de cette trajectoire est identifié par des valeurs de compteur de 22 et 45 , le point cible est défini par des valeurs de 0 et 0 . Graphique 16 : Trajectoire illustrant le déplacement du pion orienté selon la démonstration peu illustrative de la règle de l' angle La seconde démonstration correspondait à une trajectoire illustrative de la règle de l' angle , en ce sens qu' elle inclut plus de changements de direction que la précédente . Elle comporte 10 actions de changement de direction et 31 actions avance , soit 41 actions au total . La trajectoire proposée pour cette démonstration est présentée sur le graphique 17 . Le point de départ est identifié par des valeurs aux compteurs de 23 et 45 et des valeurs de 0 et 0 pour le point cible . Graphique 17 : Trajectoire illustrant le déplacement du pion orienté selon la démonstration illustrative de la règle de l' angle Caractéristiques des programmes d' apprentissage appliqués aux agents observateurs La répartition de la quantité d' observations en phase d' acquisition et de la quantité de pratiques en phase de production était contrainte par la capacité d' apprentissage des sujets relevée lors du pré-test et du pilotage . A savoir un minimum de 4 essais et un maximum de 7 essais d' observation en phase d' acquisition . Chacun des programmes contenait un total de 8 essais . Ainsi , le programme d' apprentissage 1 proposait 4 observations de la démonstration et 4 pratiques . Le deuxième , à majorité d' observation , contenait 6 observations et 2 pratiques . Le dernier impliquait 7 observations et 1 pratique . Résumé du design expérimental Tableau 6 : Résumé des conditions expérimentales croisant type de démonstration et programmes d' apprentissage Mesure Nous avons utilisé les mêmes critères d' évaluation de la performance que ceux utilisés dans la simulation . Ces mesures sont prises sur le dernier essai de pratique de chaque sujet . Indicateur de réussite : - distance euclidienne entre le point de passage de la trajectoire le plus proche de la cible et le point cible ( distance de passage ) . Plus la distance est faible , plus la trajectoire produite s' approche de la cible . Indicateurs de qualité : - distance euclidienne moyenne entre la trajectoire produite et la trajectoire observée ( distance ) . Plus la distance est faible , meilleure est la qualité générale de la trajectoire produite . - Similarité chronologique moyenne des actions ( similarité ) . Plus la similarité est élevée , meilleure est la qualité spécifique de la trajectoire produite . Résultats Les données sont traitées par une analyse de variance selon le plan factoriel 2 ( type de démonstration ) * 3 ( programme d' apprentissage ) . Les données d' un sujet ayant appris de façon explicite la séquence sont retirées de l' analyse . De plus , nous avons retiré aléatoirement des sujets dans chaque condition et présentons l' analyse à groupes d' effectifs égaux dans la suite de l' exposé des résultatsLes données sont traitées par une analyse de variance selon le plan factoriel 2 ( type de démonstration ) * 3 ( programme d' apprentissage ) . Les données d' un sujet ayant appris de façon explicite la séquence sont retirées de l' analyse . De plus , nous avons retiré aléatoirement des sujets dans chaque condition et présentons l' analyse à groupes d' effectifs égaux dans la suite de l' exposé des résultats [ 25 ] . . Réussite à la tâche mesurée par la distance de passage de la trajectoire par rapport au point cible L' analyse des données des sujets indique que le programme d' apprentissage n' influence pas la réussite à la tâche , L' analyse des données des sujets indique que le programme d' apprentissage n' influence pas la réussite à la tâche , F ( 2 , 78 ) = 1.11 , NS . Les trajectoires réalisées par les sujets passent toutes à la même distance du point cible ( ( 2 , 78 ) = 1.11 , NS . Les trajectoires réalisées par les sujets passent toutes à la même distance du point cible ( M = 4.12 , 4.12 , M = 4.18 et 4.18 et M = 2.10 respectivement pour les programmes de 1 à 3 ) . De plus , l' hypothèse émise à partir d' OLEANNet concernant l' effet de la démonstration est infirmée , la moyenne de distance de passage des sujets ayant observée la démonstration peu illustrative ( 2.10 respectivement pour les programmes de 1 à 3 ) . De plus , l' hypothèse émise à partir d' OLEANNet concernant l' effet de la démonstration est infirmée , la moyenne de distance de passage des sujets ayant observée la démonstration peu illustrative ( M = 2.89 ) ne diffère pas de celle obtenue pour la démonstration illustrative ( 2.89 ) ne diffère pas de celle obtenue pour la démonstration illustrative ( M = 4.05 ) , 4.05 ) , F ( 2 , 78 ) < 1 , NS . De plus , aucun effet de l' interaction entre programme d' apprentissage et démonstration n' apparaît , ( 2 , 78 ) < 1 , NS . De plus , aucun effet de l' interaction entre programme d' apprentissage et démonstration n' apparaît , F ( 2 , 78 ) < 1 , NS . Néanmoins , comme indiqué dans le tableau 7 , nous pouvons noter que les moyennes de distance de passage obtenues par les sujets suivent le même ( 2 , 78 ) < 1 , NS . Néanmoins , comme indiqué dans le tableau 7 , nous pouvons noter que les moyennes de distance de passage obtenues par les sujets suivent le même pattern que celles obtenues chez les agents que celles obtenues chez les agents [ 26 ] . . Tableau 7 : Distance de passage au point cible obtenues par les agents et les sujets selon la démonstration observée en phase d' acquisition Note : les moyennes qui ne partagent pas les mêmes indices diffèrent au moins à p < . 05 Qualité générale mesurée par la distance entre trajectoires produite et observée L' analyse de variance ne met en évidence aucun effet principal du programme d' apprentissage sur la qualité générale de la trajectoire produite , L' analyse de variance ne met en évidence aucun effet principal du programme d' apprentissage sur la qualité générale de la trajectoire produite , F ( 2 , 78 ) = 1.93 , NS . La distance moyenne ( entre la trajectoires produite et celle observée ) obtenue pour chacun des programmes d' apprentissage est équivalente ( ( 2 , 78 ) = 1.93 , NS . La distance moyenne ( entre la trajectoires produite et celle observée ) obtenue pour chacun des programmes d' apprentissage est équivalente ( M = 5.02 , 5.02 , M = 4.24 et 4.24 et M = 2.90 respectivement pour chaque programme ) . Ce résultat infirme l' hypothèse issue des résultats d' OLEANNet qui indiquait un effet du programme d' apprentissage sur la distance entre les trajectoires produite et observée . De plus , en comparant les moyennes obtenues dans chaque programme d' apprentissage par les agents et par les sujets , présentées tableau 8 , il s' avère que la distribution des moyennes des sujets est inverse à celle obtenue auprès des agents . 2.90 respectivement pour chaque programme ) . Ce résultat infirme l' hypothèse issue des résultats d' OLEANNet qui indiquait un effet du programme d' apprentissage sur la distance entre les trajectoires produite et observée . De plus , en comparant les moyennes obtenues dans chaque programme d' apprentissage par les agents et par les sujets , présentées tableau 8 , il s' avère que la distribution des moyennes des sujets est inverse à celle obtenue auprès des agents . Tableau 8 : Distance moyenne ente la trajectoire produite et celle observée selon le programme l' apprentissage suivi Note : les moyennes qui ne partagent pas les mêmes indices diffèrent au moins à p < . 05 Nous n' observons aucun effet principal du type de démonstration observé pendant la phase d' acquisition , celui -ci n' influence pas la qualité générale , Nous n' observons aucun effet principal du type de démonstration observé pendant la phase d' acquisition , celui -ci n' influence pas la qualité générale , F ( 1 , 78 ) < 1 . La distance moyenne obtenue pour la démonstration peu illustrative ( ( 1 , 78 ) < 1 . La distance moyenne obtenue pour la démonstration peu illustrative ( M = 4.11 ) est équivalente à celle obtenue pour la démonstration illustrative ( 4.11 ) est équivalente à celle obtenue pour la démonstration illustrative ( M = 4.01 ) . Bien qu' OLEANNet ne permettait pas d' émettre une hypothèse sur l' effet de cette variable , les données indiquent de nouveau un 4.01 ) . Bien qu' OLEANNet ne permettait pas d' émettre une hypothèse sur l' effet de cette variable , les données indiquent de nouveau un pattern de moyennes inversé entre les sujets ( de moyennes inversé entre les sujets ( M = 4.11 et 4.11 et M = 4.01 respectivement par démonstration ) et les agents ( 4.01 respectivement par démonstration ) et les agents ( M = 2.71 et M = 3.05 ) . Aucun effet d' interaction entre le type de démonstration et le programme d' apprentissage suivi n' apparaît , 2.71 et M = 3.05 ) . Aucun effet d' interaction entre le type de démonstration et le programme d' apprentissage suivi n' apparaît , F ( 2 , 78 ) < 1 . Nous pouvons constater sur le graphique 18 , que les ( 2 , 78 ) < 1 . Nous pouvons constater sur le graphique 18 , que les patterns de données observés chez les agents et chez les sujets sont totalement inversés sur le croisement des programmes d' apprentissage par le type de démonstration . de données observés chez les agents et chez les sujets sont totalement inversés sur le croisement des programmes d' apprentissage par le type de démonstration . Graphique 18 : Comparatif des courbes de distances moyennes ( entre les trajectoires produite et observée ) obtenue par les agents et les sujets en fonction de la condition expérimentale [ 27 ] . Qualité spécifique mesurée par la similarité chronologique des actions Concernant la similarité des actions , OLEANNet ne nous permettait pas d' émettre d' hypothèse quant aux effets du type de démonstration observé et du programme d' apprentissage suivi . L' analyse des données obtenues auprès des sujets indique cependant , une tendance d' effet principal du programme d' apprentissage suivi , Concernant la similarité des actions , OLEANNet ne nous permettait pas d' émettre d' hypothèse quant aux effets du type de démonstration observé et du programme d' apprentissage suivi . L' analyse des données obtenues auprès des sujets indique cependant , une tendance d' effet principal du programme d' apprentissage suivi , F ( 2 , 78 ) = 2.67 , ( 2 , 78 ) = 2.67 , p = . 07 . Comme présenté dans le tableau 9 ( page suivante ) , la similarité chronologique des actions augmente à mesure que le nombre d' observations augmente . De plus , un effet principal du type de démonstration est observé , indiquant une similarité plus élevée pour la démonstration peu illustrative ( = . 07 . Comme présenté dans le tableau 9 ( page suivante ) , la similarité chronologique des actions augmente à mesure que le nombre d' observations augmente . De plus , un effet principal du type de démonstration est observé , indiquant une similarité plus élevée pour la démonstration peu illustrative ( M = . 74 ) en regard de celle obtenue pour la démonstration illustrative ( . 74 ) en regard de celle obtenue pour la démonstration illustrative ( M = . 58 ) , . 58 ) , F ( 1 , 78 ) = 34.41 , p < . 01 . Aucun effet d' interaction n' apparaît entre la variable type de démonstration et programmes d' apprentissage , ( 1 , 78 ) = 34.41 , p < . 01 . Aucun effet d' interaction n' apparaît entre la variable type de démonstration et programmes d' apprentissage , F ( 2 , 78 ) < 1 , NS. ( 2 , 78 ) < 1 , NS . Tableau 9 : Similarité moyenne obtenue selon la démonstration observée et le programme d' apprentissage suivi . Note : les moyennes qui ne partagent pas les mêmes indices diffèrent au moins à p < . 05 Discussion L' objectif de cette étude était de déterminer si l' amélioration de la performance provenait de la quantité d' essais alloués à la phase d' acquisition ou aux essais alloués à la phase de production , en intégrant le type de démonstration observé . La simulation de ces conditions expérimentales avec OLEANNet nous a conduit à émettre des hypothèses que nous avons confrontées aux résultats des sujets . Tout d' abord , les résultats obtenus en simulation concernant le programme d' apprentissage ont mis en évidence que la qualité générale de la trajectoire produite augmentait avec l' augmentation du nombre de pratiques . Ceci va dans le sens des résultats obtenus par Deakin et Proteau ( 2002 ) , à savoir que l' apprentissage par observation est efficace seulement si le nombre de pratiques est suffisant pour rendre la représentation construite en phase d' acquisition fonctionnelle . Cette fonctionnalité est plus efficace lorsque la représentation est réactivée suffisamment de fois en phase de production , c' est-à-dire pour le programme proposant un équilibre entre observation et pratique . De plus , concernant l' effet du type de démonstration les résultats obtenus soutiennent ceux que nous avons obtenus en simulation de validation . Ainsi , plus la démonstration est illustrative des changements de direction moins l' apprentissage par observation est efficace en terme de réussite à la tâche . Ceci se traduit par une distance de passage de la trajectoire plus proche de la cible lorsque les agents sont soumis à la démonstration peu illustrative . Il semble que la trajectoire illustrative est plus difficile à apprendre par observation puisqu' elle nécessite une approximation plus exigeante du fait des contraintes liées aux changements fréquents de direction . De fait , l' adaptation de la représentation distribuée prend plus de temps , c' est-à-dire qu' elle nécessite plus d' itérations d' apprentissage en phase d' acquisition . Ces résultats d' OLEANNet nous ont amené à émettre l' hypothèse d' un effet de la démonstration sur la réussite à la tâche et d' un effet du programme d' apprentissage sur la qualité générale de la trajectoire produite . L' évaluation de ces prédictions auprès des données des sujets est peu satisfaisante . Malgré une configuration de données identique , la réussite à la tâche ne semble pas dépendre du type de démonstration observé par les sujets . La distance de passage est équivalente pour les deux démonstrations . OLEANNet prédisait pourtant une meilleure performance pour les sujets soumis à la démonstration peu illustrative , du fait que la trajectoire illustrative était plus difficile à approximer que la trajectoire peu illustrative . Des tests complémentaires nous permettraient d' identifier si l' une des trajectoires est plus difficile que l' autre pour les sujets . Néanmoins , nous ne disposons pas , à ce stade de nos recherches , de suffisamment d' éléments pour dire si l' une des trajectoires est plus difficile à apprendre que l' autre . Concernant la qualité générale de la trajectoire produite , nous attendions un effet du programme d' apprentissage , dans le sens d' une diminution de la qualité avec l' augmentation du nombre d' essais d' observations . Les résultats d' analyses sur les données des sujets infirment cette hypothèse . Cependant , nous avons relevé une tendance d' effet du programme sur la qualité spécifique de la trajectoire produite , indiquant une augmentation de la similarité des actions avec l' augmentation des essais d' observation . Bien que la qualité générale ne soit pas améliorée par un nombre d' observations supérieur , cette augmentation implique une meilleure similarité des actions pour les sujets . De plus , la similarité des actions est améliorée pour tous les sujets ayant observé la démonstration peu illustrative . Il semble que l' augmentation de la similarité , donc la mémorisation de la succession des actions , est liée au nombre d' observations autorisées en phase d' acquisition et au type de démonstration . Ce constat soulève de nouveau le problème de la difficulté de la démonstration observée . Cela semble indiquer d' une part , que la trajectoire peu illustrative soit plus facilement mémorisable que la trajectoire de la démonstration illustrative , d' autre part , que la mémorisation de la séquence d' actions soit facilitée par l' augmentation du nombre d' observations . Par ailleurs , en nous appuyant sur le paradigme de Deakin et Proteau ( 2002 ) , nous avons contraint les programmes d' apprentissage à utiliser le même d' essais total , et la performance a été évaluée sur le dernier essai de pratique . Dès lors , les conditions expérimentales varient conjointement sur le nombre d' essais d' observation et sur le nombre d' essais de pratique . L' absence de conformité des résultats , tant avec ceux de la littérature que ceux obtenus en simulation , nous incite à penser que le nombre d' essais de pratiques n' étant pas équivalent pour chaque programme d' apprentissage , il est encore difficile d' identifier clairement si les résultats sont effectivement dus à la pratique ou s' ils peuvent être expliqués par une quantité d' observations différente . Nous émettons donc deux hypothèses que nous testerons dans l' étude 2 afin de déterminer si la fonctionnalité résulte de la phase d' acquisition ou de la phase de production . Plus spécifiquement , est -ce que la fonctionnalité de la représentation provient de la qualité de la représentation construite au terme de la phase d' acquisition ou provient -elle de la qualité de l' ajustement du comportement à la représentation suite à la phase de production ? Il semble suite à cette discussion que les trajectoires ne sont pas si équivalentes que nous l' avions supposé . En effet , nous avions pris soin de créer des trajectoires identiques du point de vue des points d' arrivée et de départ , et de seulement faire varier le nombre de changements de direction pour les différencier . La démonstration peu illustrative contenait dès lors 38 actions et la démonstration illustrative 41 actions . Ce premier point laisse supposer que la démonstration peu illustrative serait plus facilement mémorisable car elle contient moins d' actions . L' effet constaté du type de démonstration sur la similarité des actions tend à soutenir cette hypothèse . Un autre élément a pu être mis en évidence concernant la tâche en elle-même . Nous avions proposé aux sujets , au terme de la passation , d' indiquer par écrit quelle stratégie ils avaient utilisée pour atteindre les valeurs zéro aux compteurs . L' étude de leur réponse et des coordonnées des trajectoires réalisées par chacun des sujets nous a permis d' identifier une stratégie commune . En effet , les sujets ont expliqué avoir repérer au cours de la démonstration une valeur particulière du compteur droit de 90 . Ils ont indiqué qu' en phase de pratique , lorsqu' ils obtenaient cette même valeur sur le compteur droit , il leur suffisait d' actionner la flèche du haut ( avance ) pour atteindre les valeurs cibles zéro . Ils ont indiqué que la séquence qu' ils réalisaient cherchait principalement à obtenir rapidement cette valeur de 90 , ce que les coordonnées des trajectoires ont confirmées . Cet élément nous laisse supposer que la tâche proposée fait appel à une intégration explicite de l' information de la valeur 90 , fournie lors de la démonstration . Ce constat va à l' encontre des contraintes que nous nous étions fixées pour la tâche , à savoir une impossibilité de coder symboliquement la démonstration , il conviendra d' en proposer une amélioration au cours des études suivantes . 3 . Etude 2 La première étude a mis en évidence un manque de prédictivité d' OLEANNet concernant les résultats obtenus auprès des sujets . Cependant , nous avons pu relever plusieurs éléments permettant de remettre en cause ces résultats expérimentaux . Le premier élément concernait l' utilisation d' une stratégie explicite de manipulation du dispositif . Cela était induit par les choix de positionnement du point de départ et du point de référence ( la cible ) du calcul de la distance et de l' angle . Le second proposait que le test des programmes d' apprentissage , répartissant pour un même nombre d' essais total la quantité d' observations et de pratiques , nous semblait peu à même d' expliquer les résultats obtenus . En effet , cela ne nous permettait pas de dissocier précisément les effets de l' observation de ceux de la pratique . L' objectif de cette étude était donc double : d' une part , améliorer le dispositif utilisé chez les sujets humains pour confronter de nouveau les prédictions d' OLEANNet aux données des sujets ; d' autre part , proposer un test spécifique de l' hypothèse alternative envisagée au problème de la fonctionnalité de la représentation . Nous avons précédemment indiqué que tester l' influence de la phase d' acquisition et celle de la phase de production sur un même nombre d' essais total n' était pas adéquat . Pour remédier à cela , nous avons étudié les effets différentiels de l' apprentissage par observation d' une trajectoire selon la variation de la quantité d' observations auxquelles sont soumis les participants en maintenant constant le nombre d' essais alloués à la phase de production . Nous avons récolté en simulation les nouvelles prédictions d' OLEANNet quant à ces conditions , puis nous les avons confrontées aux données des sujets . Dans le même temps , nous avons reconsidéré le dispositif de la tâche afin de remédier au problème de la valeur explicite identifiée dans l' étude précédente . Dans un second temps de l' expérience , nous avons tenté de répondre spécifiquement au problème de la fonctionnalité précédemment évoqué . Pour cela , nous avons testé auprès des sujets si la représentation élaborée au cours de la phase d' acquisition était rendue fonctionnelle par la pratique ou si cette fonctionnalité dépendait de la qualité de la représentation construite au terme de la phase d' acquisition . 3.1 . Simulation L' objectif de cette simulation était de proposer un ensemble de prédictions quant à l' influence du nombre d' observations autorisées pendant la phase d' acquisition sur la performance produite suite à une phase de production maintenue équivalente , c' est-à-dire contenant toujours le même nombre d' essais de pratique . En regard du fonctionnement d' OLEANNet , nous supposons que l' augmentation du nombre d' itération d' apprentissage en phase d' acquisition améliore la construction de la représentation de la trajectoire , si bien que la phase de production en est elle-même améliorée . En effet , à mesure des itérations , en phase d' acquisition , l' approximation de la trajectoire observée est affinée , c' est-à-dire que l' erreur globale relevée sur le déplacement diminue . Lorsque la phase de production prend place suite à une phase d' acquisition contenant peu d' itérations , le guidage de l' apprentissage est contraint par une trajectoire très approximative de celle observée ( l' erreur globale est élevée ) , la performance en production est donc moins bonne . Méthode Participants Quatre vingt cinq agents observateurs ont été soumis aux phases de l' apprentissage par observation . Ces agents observateurs résultent d' une base de dix sept agents observateurs qui ont été soumis concurrentiellement à cinq conditions d' observation . Ces groupes expérimentaux étaient considérés comme indépendants du fait que l' apprentissage dans une condition n' affecte pas l' apprentissage dans une autre condition . Tâche et procédure La tâche des agents observateurs consistait à apprendre par observation une démonstration de la façon de se comporter dans l' environnement pour se déplacer jusqu'à une cible ( 10 , 10 ) . La démonstration réalisée par l' agent démonstrateur était identique à celle utilisée précédemment comme trajectoire illustrative de la règle de l' angle . Elle comportait un total de 28 actions dont 5 actions droite et 4 actions gauche . La procédure d' apprentissage par observation utilisée est identique à celle présentée au cours des simulations de validation . Afin de tester un effet d' apprentissage différentiel selon la quantité d' observations , les agents sont répartis dans cinq conditions expérimentales ( dites condition d' observation ) . Ces conditions variaient selon le nombre d' itération d' apprentissage en phase d' acquisition , mais pour chacune la phase de production contenait 25 itérations . Ainsi , les agents observateurs ont été soumis à une phase d' acquisition pendant laquelle ils observaient et mémorisaient la démonstration de l' agent démonstrateur pendant 6 ( c 1 ) , 12 ( c 2 ) , 18 ( c 3 ) , 25 ( c 4 ) ou 31 ( c 5 ) itérations . La phase de production consistait à reproduire pendant 25 itérations la trajectoire mémorisée en utilisant la représentation distribuée , construite pendant la première phase comme guide d' ajustement du comportement . Mesure Les indicateurs utilisés sont identiques à ceux utilisés précédemment , d' une part la réussite à la tâche , d' autre part la qualité de la reproduction . Indicateur de réussite : - distance du point de passage le plus proche de la cible au cours de la trajectoire produite par le participant ( réussite ) Indicateurs de qualité de la trajectoire réalisée - distance euclidienne moyenne entre la trajectoire observée et la trajectoire produite ( qualité générale ) - similarité chronologique des actions ( qualité spécifique ) Résultats Les données relevées lors de la simulation du déplacement des agents suite à l' apprentissage par observation sont traitées par une analyse de variance à un critère de classification ( quantité d' observations ) . Réussite à la tâche mesurée par la distance du point de passage L' analyse de variance réalisée sur la distance du point de passage de la trajectoire réalisée par les agents observateurs par rapport à la cible , révèle un effet de la condition d' observation , L' analyse de variance réalisée sur la distance du point de passage de la trajectoire réalisée par les agents observateurs par rapport à la cible , révèle un effet de la condition d' observation , F ( 4 , 80 ) = 2.50 , ( 4 , 80 ) = 2.50 , p < . 05 . D' après le graphique 19 , la distance moyenne au point cible semble diminuer avec l' augmentation du nombre d' observations ( < . 05 . D' après le graphique 19 , la distance moyenne au point cible semble diminuer avec l' augmentation du nombre d' observations ( M = 6.02 , 6.02 , M = 5.39 , 5.39 , M = 4.13 , 4.13 , M = 3.80 et 3.80 et M = 1.88 respectivement pour les conditions d' observations c 1 à c 5 ) . Nous testons spécifiquement si une tendance linéaire apparaît sur le 1.88 respectivement pour les conditions d' observations c 1 à c 5 ) . Nous testons spécifiquement si une tendance linéaire apparaît sur le pattern de données . Cette analyse révèle un effet significatif de la tendance linéaire , de données . Cette analyse révèle un effet significatif de la tendance linéaire , F ( 1 , 80 ) = 9.48 , ( 1 , 80 ) = 9.48 , p < . 01 , et < . 01 , et Frés ( 3 , 80 ) < 1 , NS . Cela indique que la distance de passage de la trajectoire par rapport au point cible diminue à mesure que le nombre d' observations augmente , donc que la réussite à la tâche augmente avec l' augmentation du nombre d' observations . rés ( 3 , 80 ) < 1 , NS . Cela indique que la distance de passage de la trajectoire par rapport au point cible diminue à mesure que le nombre d' observations augmente , donc que la réussite à la tâche augmente avec l' augmentation du nombre d' observations . Graphique 19 : Moyenne de la distance de passage de la trajectoire par rapport au point cible selon les conditions d' observations Qualité générale mesurée par la distance entre les trajectoires produite et observée L' analyse de variance réalisée sur les données indique un effet de la condition d' observation sur la distance entre les trajectoires observée et produite , L' analyse de variance réalisée sur les données indique un effet de la condition d' observation sur la distance entre les trajectoires observée et produite , F ( 4 , 80 ) = 2.82 , ( 4 , 80 ) = 2.82 , p < . 05 . Comme présenté dans le tableau 10 ( page suivante ) , la distance diminue à mesure que le nombre d' observations augmente , indiquant que la qualité générale s' améliore avec l' augmentation du nombre d' essais en phase d' acquisition . L' analyse de tendance permet de mettre en évidence une distribution linéaire des moyennes de distance , < . 05 . Comme présenté dans le tableau 10 ( page suivante ) , la distance diminue à mesure que le nombre d' observations augmente , indiquant que la qualité générale s' améliore avec l' augmentation du nombre d' essais en phase d' acquisition . L' analyse de tendance permet de mettre en évidence une distribution linéaire des moyennes de distance , F ( 1 , 80 ) = 11.11 , ( 1 , 80 ) = 11.11 , p < . 01 et < . 01 et Frés ( 3 , 80 ) < 1 , NS. rés ( 3 , 80 ) < 1 , NS . Tableau 10 : Moyenne des distances entre les trajectoires produite et observée selon le nombre d' observations Qualité spécifique mesurée par la similarité chronologique des actions L' analyse de la similarité des actions ( réalisées à mesure de la trajectoire produite par les agents en fonction de celles émises par l' agent démonstrateur ) indique un effet significatif de la condition d' observation , L' analyse de la similarité des actions ( réalisées à mesure de la trajectoire produite par les agents en fonction de celles émises par l' agent démonstrateur ) indique un effet significatif de la condition d' observation , F ( 4 , 80 ) = 4.13 , ( 4 , 80 ) = 4.13 , p < . 01 . Comme indiqué dans le tableau 11 , il semble que la similarité augmente linéairement avec l' augmentation du nombre d' observations . L' analyse de tendance réalisée sur les données , indique effectivement une tendance linéaire , < . 01 . Comme indiqué dans le tableau 11 , il semble que la similarité augmente linéairement avec l' augmentation du nombre d' observations . L' analyse de tendance réalisée sur les données , indique effectivement une tendance linéaire , F ( 1 , 80 ) = 16.12 , ( 1 , 80 ) = 16.12 , p < . 01 , < . 01 , Frés ( 3 , 80 ) < 1 , NS.rés ( 3 , 80 ) < 1 , NS . Tableau 11 : Moyenne de similarité des actions selon le nombre d' observations Prédictions d' OLEANNet Les résultats obtenus en simulation nous permettent de poser l' hypothèse d' un effet de la condition d' observation sur la réussite à la tâche et sur les qualités générale et spécifique de la trajectoire produite . Plus spécifiquement , nous attendons chez les sujets : une diminution linéaire de la distance de passage de la trajectoire produite par rapport au point cible ; une diminution linéaire de la distance entre les trajectoires produite et observée ; et une augmentation de la similarité entre la trajectoire produite et la trajectoire observée . 3.2 . Expérience Afin de mettre à l' épreuve les prédictions du modèle OLEANNet , nous créons un dispositif expérimental similaire à celui utilisé dans cette simulation et testé auprès de sujets humains . Nous attendons que l' effet de la condition expérimentale se manifeste par une amélioration de la performance avec l' augmentation du nombre d' essais alloués à la phase d' acquisition . En regard des limites constatées lors de l' expérience précédente , nous améliorons le dispositif utilisé afin d' inhiber l' utilisation d' une stratégie impliquant la détection d' une valeur particulière de compteur pour réaliser la tâche d' atteinte de cible . Nous testerons dans un second temps l' hypothèse alternative selon laquelle la représentation est rendue fonctionnelle par la quantité d' observations ou par la quantité de pratiques . Méthode Participants Soixante quinze sujets tous étudiants en Psychologie ( tous niveaux d' études ) à l' Université de Savoie ont participé volontairement à l' expérience . Tous sont droitiers et aucun ne présente de trouble visuel . Matériel Le matériel utilisé pour cette étude était strictement équivalent à celui de l' étude précédente . Les participants étaient placés face à un ordinateur portable ( iBook ) auquel était relié une souris externe . Le dispositif affiché à l' écran présentait deux compteurs sous lesquels quatre flèches orientées étaient disposées en étoile . Les compteurs présentaient des valeurs calculées automatiquement à chaque action de la souris sur l' une des flèches . De la même façon que précédemment , le programme sous-jacent à l' utilisation du dispositif permettait de déplacer fictivement grâce aux actions sur les flèches un pion Le matériel utilisé pour cette étude était strictement équivalent à celui de l' étude précédente . Les participants étaient placés face à un ordinateur portable ( iBook ) auquel était relié une souris externe . Le dispositif affiché à l' écran présentait deux compteurs sous lesquels quatre flèches orientées étaient disposées en étoile . Les compteurs présentaient des valeurs calculées automatiquement à chaque action de la souris sur l' une des flèches . De la même façon que précédemment , le programme sous-jacent à l' utilisation du dispositif permettait de déplacer fictivement grâce aux actions sur les flèches un pion orienté dans un espace orthonormé . La valeur présentée sur le compteur gauche correspondait à la distance entre le pion et le point d' arrivée de référence . Le compteur droit indiquait l' angle entre le pion orienté et le point d' arrivée de référence . dans un espace orthonormé . La valeur présentée sur le compteur gauche correspondait à la distance entre le pion et le point d' arrivée de référence . Le compteur droit indiquait l' angle entre le pion orienté et le point d' arrivée de référence . Tâche et procédure Les participants étaient testés individuellement , ils étaient affectés aléatoirement à l' une des 5 conditions expérimentales . La tâche des participants consistait à obtenir des valeurs de compteurs particulières en actionnant les flèches après avoir observer une démonstration de la manipulation du dispositif . Les valeurs devant être obtenues sont de 11 pour le compteur gauche et 45 pour le compteur droit à partir des valeurs ( 34 , 45 ) . Ces valeurs étaient obtenues en plaçant le point de départ en coordonnées ( 1 , 1 ) et le point de référence pour le calcul des distances et des angles en ( 25 , 25 ) . La cible , correspondant aux valeurs des compteurs à atteindre , était placée en Cela empêche l' utilisation de la stratégie d' utilisation de la valeur 90 puisque celle -ci n' apparaît plus et aucune autre valeur n' est aussi saillante . Pour autant , la trajectoire demeure totalement identique à celle utilisée pour la démonstration illustrative de l' étude 1 , seul le point de référence du calcul de l' angle et de la distance diverge . La procédure d' apprentissage par observation des sujets était équivalente à celle présentée pour le pré-test . Après avoir présenté le dispositif au sujet , il lui était demandé d' observer attentivement une démonstration de la façon de se comporter dans cet environnement pour atteindre une cible particulière ( définie par les valeurs 11 , 45 ) à partir d' une position de départ fixe ( définie par 34 , 45 ) . Avant de commencer la démonstration , il lui était indiqué qu' il devrait ensuite faire de même . Ensuite , il était invité à reproduire la séquence observée en utilisant la souris . Il lui était précisé qu' il disposerait de plusieurs essais et que la fin de chaque essai lui serait indiquée au fur et à mesure . Suite à la passation , nous avons demandé au sujet d' imaginer que le dispositif qu' il avait utilisé lui permettait de déplacer un pion orienté dans un espace en deux dimensions . Nous lui avons proposé de dessiner la trajectoire qu' il pensait avoir fait faire à ce pion en actionnant les flèches , ceci sur une feuille de format A4 . Descriptif de la trajectoire utilisée pour la démonstration La démonstration consistait en une séquence de 41 actions de la souris dont 5 actions sur la flèche droite et 5 actions sur la flèche gauche . Cette trajectoire est illustrative de l' utilisation de la règle de l' angle ( cf. graphique 20 , ci-après ) . Graphique 20 : Trajectoire illustrative de la règle utilisée en démonstration Conditions d' observation Pour chaque groupe expérimental , le nombre d' observations était manipulé . Cette manipulation consistait en un nombre différent d' observations de la démonstration : de 1 essai d' observation en phase d' acquisition à 5 essais d' observation . Quel qu' était le nombre de démonstrations observé , chaque participant réalisait 4 essais de pratique en phase de production . Parmi ces 4 essais , les trois premiers étaient considérés comme des essais d' acquisition et le quatrième comme essai test . Quarante huit actions de souris sont autorisées pour chaque essai . Le choix de 48 actions n' est pas arbitraire , cette valeur correspond au nombre d' actions réalisées lorsque la règle de l' angle est appliquée à chaque pas . Mesure Les mesures étaient relevées sur l' essai test et étaient identiques à celles utilisées pour la simulation présentée dans cette étude . A savoir , une mesure de la réussite à la tâche évaluée par la distance du point de passage le plus proche de la cible au cours de la trajectoire réalisée par le sujet , une mesure de la qualité générale évaluée par la distance euclidienne entre trajectoire produite et trajectoire observée , et une mesure de la qualité spécifique évaluée par la similarité chronologique des actions . Résultats L' analyse des données permet de tester les hypothèses issues des résultats obtenus par les agents de type OLEANNet pour chacune des variables dépendantes selon les conditions d' observations . Les données correspondant à deux des participants de la condition 5 ne sont pas prises en compte du fait qu' ils aient mémorisé explicitement la séquence d' action ( rappel correct à 100 % de la séquence en débriefing ) . Réussite à la tâche mesurée par la distance du point de passage sur l' essai test OLEANNet prédisait un effet de la condition d' observation sur la distance de passage au point cible et plus particulièrement une diminution linéaire de la moyenne de distance de passage avec l' augmentation du nombre d' observations . Les résultats obtenus par les sujets vont dans ce sens , l' analyse indique un effet principal de la condition d' observation sur la distance de passage , OLEANNet prédisait un effet de la condition d' observation sur la distance de passage au point cible et plus particulièrement une diminution linéaire de la moyenne de distance de passage avec l' augmentation du nombre d' observations . Les résultats obtenus par les sujets vont dans ce sens , l' analyse indique un effet principal de la condition d' observation sur la distance de passage , F ( 4 , 68 ) = 3.275 , ( 4 , 68 ) = 3.275 , p < . 05 . Plus spécifiquement , nous testons l' hypothèse d' une tendance linéaire des moyennes de la distance de passage . Comme présentée dans le tableau 12 , la distance de passage diminue avec l' augmentation du nombre d' observations , < . 05 . Plus spécifiquement , nous testons l' hypothèse d' une tendance linéaire des moyennes de la distance de passage . Comme présentée dans le tableau 12 , la distance de passage diminue avec l' augmentation du nombre d' observations , F ( 1 , 68 ) = 10.91 , ( 1 , 68 ) = 10.91 , p < . 01 et < . 01 et Frés ( 3 , 68 ) < 1 , NS . Cela indique que plus les sujets ont observé la démonstration , plus ils sont à même de proposer une trajectoire approchant de la cible . rés ( 3 , 68 ) < 1 , NS . Cela indique que plus les sujets ont observé la démonstration , plus ils sont à même de proposer une trajectoire approchant de la cible . Tableau 12 : Moyenne de la distance de passage au point cible pour chaque condition d' observation Comme le présente le graphique 21 , les moyennes des sujets pour chaque condition suivent la distribution prédite par OLEANNet . Graphique 21 : Distribution des moyennes des sujets et des agents selon les conditions d' observations Qualité générale mesurée par la distance entre les trajectoires produite et observée Selon les prédictions d' OLEANNet , la qualité générale de la trajectoire produite est positivement influencée par l' augmentation du nombre d' observations et cette influence se manifeste par une tendance linéaire . Comme attendu , les résultats de l' analyse révèlent un effet de la condition d' observations sur la distance entre les trajectoires produite et observée , Selon les prédictions d' OLEANNet , la qualité générale de la trajectoire produite est positivement influencée par l' augmentation du nombre d' observations et cette influence se manifeste par une tendance linéaire . Comme attendu , les résultats de l' analyse révèlent un effet de la condition d' observations sur la distance entre les trajectoires produite et observée , F ( 4 , 68 ) = 5.97 , ( 4 , 68 ) = 5.97 , p < . 01 . Comme le montre les moyennes présentées dans le tableau 13 , la distance entre les trajectoires semble diminuer à mesure de l' augmentation du nombre d' observation. < . 01 . Comme le montre les moyennes présentées dans le tableau 13 , la distance entre les trajectoires semble diminuer à mesure de l' augmentation du nombre d' observation . Tableau 13 : Moyenne de la distance entre les trajectoires produite et observée selon le nombre d' observations L' analyse de tendance met en évidence une distribution linéaire des moyennes , L' analyse de tendance met en évidence une distribution linéaire des moyennes , F ( 1 , 68 ) = 20.32 , ( 1 , 68 ) = 20.32 , p < . 01 et < . 01 et Frés ( 3 , 68 ) = 1.19 , NS . La distance entre la trajectoire produite et celle observée diminue lorsque le nombre d' observations augmente . Comme illustrés sur le graphique 22 , ces résultats n' infirment pas l' hypothèse issue d' OLEANNet prédisant une diminution linéaire de la distance à mesure que le nombre d' observation augmente . rés ( 3 , 68 ) = 1.19 , NS . La distance entre la trajectoire produite et celle observée diminue lorsque le nombre d' observations augmente . Comme illustrés sur le graphique 22 , ces résultats n' infirment pas l' hypothèse issue d' OLEANNet prédisant une diminution linéaire de la distance à mesure que le nombre d' observation augmente . Graphique 22 : Distance moyenne entre trajectoires produite et observée en fonction du type de participant et des conditions d' observation Qualité spécifique mesurée par la similarité chronologique des actions Au-delà de la qualité générale de la reproduction , l' analyse de la similarité chronologique des actions réalisées sur les données des agents , nous a conduit à poser l' hypothèse d' une augmentation linéaire de la similarité avec la quantité d' observations . Nous traitons les données de l' essai test par une analyse de variance indiquant un effet de la condition d' observation , Nous traitons les données de l' essai test par une analyse de variance indiquant un effet de la condition d' observation , F ( 4 , 68 ) = 6.15 , ( 4 , 68 ) = 6.15 , p < . 01 . D' après les résultats présentés dans le tableau 14 ( page suivante ) , la moyenne de similarité semble augmenter progressivement . L' analyse de tendance met en évidence une augmentation linéaire de la similarité à mesure que le nombre d' observation augmente , < . 01 . D' après les résultats présentés dans le tableau 14 ( page suivante ) , la moyenne de similarité semble augmenter progressivement . L' analyse de tendance met en évidence une augmentation linéaire de la similarité à mesure que le nombre d' observation augmente , F ( 1 , 68 ) = 18.10 , ( 1 , 68 ) = 18.10 , p < . 01 et < . 01 et Frés ( 3 , 68 ) = 1.76 , NS.rés ( 3 , 68 ) = 1.76 , NS . Tableau 14 : Moyenne de la similarité des actions selon le nombre d' observations Ces résultats répondent favorablement aux hypothèses issues d' OLEANNet qui prédisait une augmentation linéaire de la similarité entre les trajectoires produite et observée en fonction de la quantité d' observations ( cf. graphique 23 ) . Graphique 23 : Similarité moyenne obtenue par les agents et les sujets en fonction de la quantité d' observations Comparaison des données agents et sujets : l' analyse peut -elle dissocier les données relevant des agents de celles relevant des sujets ? Afin de compléter les analyses comparatives précédentes , nous réalisons une analyse sur le plan 2 ( type de participant ) * 5 ( conditions d' observation ) en utilisant les données centrées réduites pour chacun des groupes de sujets et d' agents toutes conditions confondues . L' analyse de variance ne met pas en évidence d' effet significatif de la variable type de participant que ce soit sur la distance de passage au point cible , ou sur la distance entre les trajectoires observée et produite , ou encore sur la similarité , Afin de compléter les analyses comparatives précédentes , nous réalisons une analyse sur le plan 2 ( type de participant ) * 5 ( conditions d' observation ) en utilisant les données centrées réduites pour chacun des groupes de sujets et d' agents toutes conditions confondues . L' analyse de variance ne met pas en évidence d' effet significatif de la variable type de participant que ce soit sur la distance de passage au point cible , ou sur la distance entre les trajectoires observée et produite , ou encore sur la similarité , F ( 1 , 154 ) < 1 , NS ( voir annexe 4 p. 21 pour le détail de chacune des mesures ) . L' effet de la condition d' observation est cependant maintenu pour l' ensemble des variables dépendantes et aucun effet d' interaction entre ces variables n' apparaît suite à l' analyse . De plus , cette analyse nous permet de mettre en évidence que la variable type de participant n' a pas d' influence sur les mesures , c' est-à-dire qu' il n' est pas possible de différencier les mesures selon cette variable . En outre , aucun effet d' interaction n' est observé . Il est possible de dire qu' en l' absence de ces deux effets , les résultats obtenus chez les sujets humains suivent le même ( 1 , 154 ) < 1 , NS ( voir annexe 4 p. 21 pour le détail de chacune des mesures ) . L' effet de la condition d' observation est cependant maintenu pour l' ensemble des variables dépendantes et aucun effet d' interaction entre ces variables n' apparaît suite à l' analyse . De plus , cette analyse nous permet de mettre en évidence que la variable type de participant n' a pas d' influence sur les mesures , c' est-à-dire qu' il n' est pas possible de différencier les mesures selon cette variable . En outre , aucun effet d' interaction n' est observé . Il est possible de dire qu' en l' absence de ces deux effets , les résultats obtenus chez les sujets humains suivent le même pattern que ceux obtenus chez les agents . que ceux obtenus chez les agents . Les graphiques 24 , 25 et 26 présentés ci-après permettent d' illustrer plus précisément ces propos . Graphique 24 : Distance de passage centrée réduite , effet de la condition F ( 4 , 148 ) = 5.29 , p < . 01 Graphique 25 : Distance entre trajectoires produite et observée centrée réduite , effet de la condition F ( 4 , 148 ) = 7.84 , p < . 01 Graphique 26 : Similarité entre actions centrée réduite , effet de la condition F ( 4 , 148 ) = 8.98 , p < . 01 . Résultats des sujets concernant la fonctionnalité de la représentation Le second objectif de cette expérience consistait à déterminer si la fonctionnalité de la représentation était dépendante de la phase de production ou bien de la phase d' acquisition . Nous cherchons donc à évaluer si la représentation élaborée au cours de la phase d' acquisition est rendue fonctionnelle par la pratique ou si cette fonctionnalité dépend de la qualité de la représentation construite au terme de la phase d' acquisition . Fonctionnalité et pratique Pour tester l' hypothèse d' une fonctionnalité rendue effective par la pratique , nous analysons , pour chaque condition d' observation , l' évolution de la performance au cours des 4 essais de pratique . Si un effet de l' essai apparaît , indépendamment de la condition d' observation , cela impliquera que la pratique est nécessaire pour rendre la représentation fonctionnelle . A l' inverse si aucun effet n' apparaît alors la pratique n' est pas en elle-même nécessaire . L' analyse de variance réalisée pour chacune des conditions d' observation sur la mesure répétée ( essai * 4 ) , n' indique aucun effet significatif de l' essai que ce soit sur la distance de passage de la trajectoire produite par rapport à la cible ( cf. graphique 27 ) , ou sur la distance entre les trajectoires observé et produite ( cf. graphique 28 ) , ou sur la similarité entre actions observées et produites ( cf. graphique 29 ) . Graphique 27 : Evolution de la distance de passage au cours des essais selon les conditions d' observation Graphique 28 : Evolution de la distance entre les trajectoire produite et observée à mesure des essais de pratique selon les conditions d' observation Graphique 29 : Evolution de la similarité des actions à mesure des essais de pratique selon les conditions d' observation Aucun des indicateurs de performance ne met en évidence d' effet de la pratique sur la fonctionnalité de la représentation . La pratique ne s' avère pas être un élément déterminant dans l' efficacité de l' apprentissage par observation de ce type de tâche . L' hypothèse d' une représentation rendue fonctionnelle par la pratique est infirmée . Fonctionnalité et observation Pour tester l' hypothèse d' une fonctionnalité rendue effective par l' observation , nous analysons l' évolution de la performance sur le premier essai de pratique selon les conditions d' observation . Si un effet de la condition d' observation apparaît sur la performance au premier essai , cela impliquera que la quantité d' observation est un élément déterminant dans la fonctionnalité de la représentation . A l' inverse , si aucun effet n' est mis en évidence alors la quantité d' observation ne pourra être considérée comme intervenant sur la performance dans ce type de tâche . Réussite à la tâche L' analyse de variance réalisée selon le plan à un critère de classification ( condition d' observation ) est conduite sur la performance des sujets au premier essai de pratique . La condition d' observation a un effet sur la distance de passage de la trajectoire par rapport à la cible , L' analyse de variance réalisée selon le plan à un critère de classification ( condition d' observation ) est conduite sur la performance des sujets au premier essai de pratique . La condition d' observation a un effet sur la distance de passage de la trajectoire par rapport à la cible , F ( 4 , 68 ) = 4.04 , ( 4 , 68 ) = 4.04 , p < . 01 Comme l' indiquent les moyennes présentées dans le tableau 15 , la distance de passage diminue de la condition de 1 observation à la condition de 4 observations pour augmenter à la condition de 5 observations. < . 01 Comme l' indiquent les moyennes présentées dans le tableau 15 , la distance de passage diminue de la condition de 1 observation à la condition de 4 observations pour augmenter à la condition de 5 observations . Tableau 15 : Moyenne de la distance de passage du premier essai par condition d' observation Qualité générale et spécifique de la trajectoire produite Concernant la qualité de la reproduction , la condition d' observation à un effet sur la qualité générale , Concernant la qualité de la reproduction , la condition d' observation à un effet sur la qualité générale , F ( 4 , 68 ) = 4.34 , ( 4 , 68 ) = 4.34 , p < . 01 , qui se traduit par une diminution de la distance entre les trajectoires produite et observée de la condition 1 à la condition 4 et une augmentation pour la condition 5 . < . 01 , qui se traduit par une diminution de la distance entre les trajectoires produite et observée de la condition 1 à la condition 4 et une augmentation pour la condition 5 . De même , pour la qualité spécifique , la condition d' observation influence la similarité entre les actions observées et produites , De même , pour la qualité spécifique , la condition d' observation influence la similarité entre les actions observées et produites , F ( 4 , 68 ) = 8.49 , ( 4 , 68 ) = 8.49 , p < . 01 , comme le présente le tableau 16 , plus les sujets ont observé la démonstration plus la trajectoire produite est similaire. < . 01 , comme le présente le tableau 16 , plus les sujets ont observé la démonstration plus la trajectoire produite est similaire . Tableau 16 : Moyenne des évaluations de qualité générale et spécifique de la trajectoire réalisée au premier essai selon les conditions d' observations Les résultats obtenus sur l' ensemble des indicateurs de performance indiquent que la quantité d' observations préalables au premier essai de pratique est déterminante pour réactiver une représentation adaptée ( de qualité ) pour la phase de production . Ainsi , l' hypothèse d' une fonctionnalité de la représentation dépendante de la phase d' acquisition peut être retenue . Discussion Le test de l' hypothèse générale d' une amélioration de la performance avec l' augmentation du nombre d' observation issue des résultats obtenus sur les agents a été confronté aux données recueillies pour une tâche similaire auprès des sujets . Nous avons pu constater que sur l' ensemble des mesures , les résultats des sujets sont compatibles avec ceux prédits par OLEANNet . Ainsi , les résultats obtenus auprès des sujets mettent en évidence une amélioration de la performance tant du point de vue de la réussite à la tâche que du point de vue de la qualité de la production , avec l' augmentation du nombre d' observations . Ces données suggèrent que l' apprentissage par observation nécessite un nombre suffisant d' observations pour la construction d' une représentation efficace pour guider le comportement en phase de production . L' architecture d' OLEANNet permet de mieux comprendre les processus impliqués dans chacune des phases . Plus précisément , la façon dont se construit la représentation en phase d' acquisition et comment cette dernière est utilisée en phase de production pour induire une reproduction efficace . Ainsi , pendant les premières observations de la phase d' acquisition , l' écart ( erreur ) relevé entre les sorties cognitives ( action proposée par OLEANNet ) et les actions de l' agent modèle est important . L' adaptation de la matrice de poids doit considérer l' ensemble de ces écarts ce qui implique une approximation intégrant , dans un premier temps , un nombre conséquent d' informations . La représentation distribuée élaborée est alors fortement contrainte par des valeurs d' erreurs élevées . Pour prendre en compte l' ensemble de ces valeurs , les poids de connexions sont adaptés de façon souple , c' est-à-dire qu' ils varient de façon à satisfaire l' ensemble des contraintes . Avec les observations suivantes , l' adaptation des poids s' affine , impliquant la construction d' une représentation distribuée plus fine qui intègre des informations dont la qualité est meilleure . Si la phase de production intervient après peu d' observations , l' approximation du comportement en reproduction est régulée par une représentation peu informative . La contrainte d' ajustement étant alors peu exigeante , le comportement reproduit est relativement général et considère l' atteinte de la cible en prenant peu en compte la trajectoire observée . Cela se traduit par une qualité de la reproduction peu élevée pendant la phase de reproduction . A contrario , lorsque la phase de production intervient suite à un nombre suffisant d' observations , l' ajustement du comportement à reproduire est fonction d' une représentation plus fine intégrant des informations de meilleure qualité . Dès lors , l' approximation du comportement est plus efficace et de meilleure qualité , et ce , même si la diminution de la qualité due aux approximations successives en phase d' acquisition et en phase production est toujours observée . Les résultats obtenus auprès des sujets vont dans le sens de cette interprétation , puisque qu' il semble que la représentation construite en phase d' acquisition intègre dans un premier temps un comportement général , c' est-à-dire que le sujet est capable d' approximer une séquence d' actions pour approcher la cible . Cependant , la distance de passage de la trajectoire réalisée demeure faible en deçà d' un nombre suffisant d' observations . A partir d' un nombre suffisant d' observations , la représentation construite en phase d' observation intègre suffisamment d' informations pour approcher la cible de façon efficace en phase de production . Cela se traduit par une diminution progressive de la distance de passage à mesure de l' augmentation du nombre d' observations . Par ailleurs , nous avions demandé aux sujets de dessiner la trajectoire qu' ils pensaient avoir fait faire à un pion en actionnant les flèches . Par là , nous souhaitions voir comment les sujets se représentaient symboliquement la séquence d' action sur les flèches . Suite à l' étude des trajectoires dessinées par les sujets , il s' avère que la plupart d' entre eux donne une signification équivalente des actions sur les flèches . La flèche du haut est symboliquement évaluée comme faisant avancer le pion vers le haut ; celle de droite comme le faisant se déplacer sur la droite ; celle de gauche comme faisant se déplacer le pion sur la gauche ; et enfin celle du bas comme faisant se déplacer le pion vers le bas . Les sujets intègrent donc la signification des flèches en regard du symbole qu' elles présentent , et dessinent des trajectoires en ligne droite intégrant des déplacements à droite et à gauche . Ces trajectoires sont incorrectes du point de vue de la réalisation de la tâche , à savoir atteindre la cible placée en haut à gauche de l' espace orthonormé . Cependant , les sujets sont à même de réaliser correctement la tâche . Il s' avère donc qu' en obligeant les sujets à utiliser une représentation symbolique des actions sur les flèches , ils proposent une représentation incorrecte tout en étant capables de réaliser efficacement la tâche sans utiliser ce type de symbolisme langagier . Suite à la seconde étude , nous avions émis deux hypothèses quant à la fonctionnalité de la représentation . Nous souhaitions déterminer si la représentation élaborée au cours de la phase d' acquisition était rendue fonctionnelle par la pratique ou si cette fonctionnalité dépendait de la qualité de la représentation construite au terme de la phase d' acquisition . Les analyses réalisées nous ont permis de relever que la pratique ne semblait pas être un élément déterminant de la fonctionnalité de la représentation pour le type de tâche utilisée , dans laquelle la représentation symbolique incorrecte ne semble pas engendrer de déficit de la performance . Cependant , il s' avère que la quantité d' observations est un élément essentiel de la réussite à la tâche , cela sous-tend l' idée qu' à mesure des observations , la représentation construite intègre des informations de plus en plus pertinentes , ce qui se traduit par une qualité grandissante du comportement reproduit . Contrairement aux suggestions de Deakin et Proteau ( 2002 ) , il s' avère que la tâche utilisée ici n' implique pas une fonctionnalité rendue effective par la pratique , mais plutôt une fonctionnalité rendue effective par la construction d' une représentation pertinente pendant la phase d' acquisition . 4 . Etude 3 L' objectif de cette étude était de déterminer dans quelle mesure une démonstration , illustrant plus ou moins une règle de déplacement , pouvait influencer la qualité de la reproduction . La simulation de validation 2 , nous a conduit à identifier l' émission de comportements différents par des agents observateurs ayant été soumis soit à une démonstration illustrative soit à une démonstration peu illustrative de la règle de l' angle . Les résultats indiquaient que le type de démonstration observé n' avait pas d' influence sur la qualité générale entre les trajectoires produite et observée . Néanmoins , le nombre d' actions de changement de direction utilisé était plus fréquent pour les agents soumis à la démonstration illustrative . Ces résultats suggéraient que la manifestation de l' influence de la démonstration ne transparaissait pas au niveau d' un critère global d' évaluation de la distance entre les trajectoires produite et observée ( distance euclidienne ) , mais apparaissait dans l' utilisation que les agents faisaient des actions de changement de direction . L' influence de la démonstration était donc manifeste à un niveau d' évaluation de la performance plus spécifique . Notons , cependant , que l' analyse ne portait que sur les données des agents ayant réussi à atteindre la cible , ce qui limite considérablement la généralisation de ces résultats . Nous proposons dans cette dernière étude de considérer l' ensemble de la population des agents pour émettre les prédictions sur les données humaines . Par ailleurs , nous avons relevé dans l' étude 2 que les trajectoires proposées en démonstration lors de la passation avec les sujets ne semblaient pas équivalentes du point de vue de leur difficulté à être apprises . Nous avons constaté , malgré les précautions de construction de ces trajectoires quant à leur point de départ et d' arrivée , qu' elles n' engendraient , par conséquent , pas le même nombre d' actions à mémoriser . La démonstration peu illustrative contenait 38 actions et la démonstration illustrative 41 actions . Cela laissait supposer que la démonstration peu illustrative était plus facilement mémorisable car elle contenait moins d' actions . L' effet constaté du type de démonstration sur la similarité des actions tendait d' ailleurs à soutenir cette hypothèse . Nous proposons dans cette nouvelle étude d' éviter ce problème en proposant aux sujets des trajectoires contenant le même nombre d' actions . En regard de ces éléments , nous proposons de conduire une simulation dont l' analyse portera sur l' ensemble des données des agents ce qui nous conduira à proposer des prédictions plus vraisemblables , et une expérience pour laquelle les démonstrations seront équivalentes quant à la quantité d' informations à mémoriser . 4.1 . Simulation Dans cette simulation , l' ensemble de la population des agents a été considéré comme base pour la prédiction des résultats des sujets sur l' influence du type de démonstration observé . Lors des simulations de validation d' OLEANNet , seules les données des agents ayant réussi à atteindre la cible ont été prises en compte , ce qui restreint considérablement les prédictions puisque nous ne devrions considérer que les données des sujets ayant réussit la tâche . En regard des résultats obtenus en simulation 2 , nous proposons que l' influence d la démonstration devrait se manifester à un niveau d' évaluation de la performance spécifique . Méthode Participants Trente quatre agents , générés à partir de dix sept agents de type OLEANNet , ont été utilisés pour la simulation . Ils peuvent être utilisés de façon concurrentielle dans plusieurs conditions expérimentales ( pas d' influence d' un apprentissage sur un autre ) puisque l' apprentissage intervient sur les matrices de poids de départ . Tâche et procédure La tâche des agents consistait à observer une démonstration puis à la reproduire . La procédure d' apprentissage par observation utilisée était identique à celle validée dans la simulation 1 . Les agents étaient d' abord soumis à une première phase d' apprentissage ( phase d' acquisition ) pendant laquelle ils observaient et mémorisaient 25 fois la démonstration de l' agent démonstrateur , la seconde ( phase de production ) consistait à reproduire 25 fois la trajectoire mémorisée en utilisant la représentation distribuée construite pendant la première phase comme guide d' ajustement du comportement . Chaque agent était testé selon deux conditions expérimentales opérationnalisant deux types de démonstrations . La première condition proposait une démonstration peu illustrative de la règle de déplacement , la seconde une démonstration illustrative de la règle . La démonstration peu illustrative présentée sur le graphique 30 proposait 6 changements de direction et 18 actions avance . La démonstration illustrative proposait 9 changements de direction et 18 actions avance ( cf. graphique 31 ) . Graphique 30 : Trajectoire peu illustrative de la règle de l' angle proposée en démonstration par l' agent démonstrateur Graphique 31 : Trajectoire illustrative de la règle de l' angle proposée en démonstration par l' agent démonstrateur Mesure Les variables retenues pour cette étude permettaient de mesurer la réussite à la tâche , la qualité de la reproduction ainsi que la fréquence des changements de direction . Indicateur de réussite : - distance du point de passage le plus proche de la cible au cours de la trajectoire réalisée par le participant Indicateur de qualité de la trajectoire réalisée - similarité chronologique des actions Indicateur de la fréquence des changements de direction - nombre moyen de changements de direction réalisés sur la trajectoire Résultats Nous traitons les données recueillies auprès des agents par un test de Student . Réussite à la tâche mesurée par la distance de passage de la trajectoire par rapport à la cible Le test de Student ne met pas en évidence d' effet du type de démonstration sur la distance de passage , t ( 1 , 32 ) = 1.87 , NS . La distance de passage pour les agents soumis à la démonstration peu illustrative ( Le test de Student ne met pas en évidence d' effet du type de démonstration sur la distance de passage , t ( 1 , 32 ) = 1.87 , NS . La distance de passage pour les agents soumis à la démonstration peu illustrative ( M = . 45 ) est équivalente à celle obtenue par les agents soumis à la démonstration illustrative ( . 45 ) est équivalente à celle obtenue par les agents soumis à la démonstration illustrative ( M = 1.79 ) . 1.79 ) . Qualité spécifique mesurée par la similarité chronologique des actions Afin de déterminer l' influence du type de démonstration sur la qualité spécifique , nous nous intéresserons à la similarité entre les actions proposées à mesure de la trajectoire par les agents par rapport à celles réalisées par les agents modèles . Le test de Student indique un effet de la démonstration sur la similarité , t ( 32 ) = 4.32 , Afin de déterminer l' influence du type de démonstration sur la qualité spécifique , nous nous intéresserons à la similarité entre les actions proposées à mesure de la trajectoire par les agents par rapport à celles réalisées par les agents modèles . Le test de Student indique un effet de la démonstration sur la similarité , t ( 32 ) = 4.32 , p < . 01 . Nous observons que la similarité est plus importante lorsque les agents observent une démonstration peu illustrative ( < . 01 . Nous observons que la similarité est plus importante lorsque les agents observent une démonstration peu illustrative ( M = . 48 ) , qu' elle ne l' est pour la démonstration illustrative ( . 48 ) , qu' elle ne l' est pour la démonstration illustrative ( M = . 35 ) .. 35 ) . Fréquence des changements de direction Le test de Student réalisé sur les données indique un effet du type de la démonstration sur la fréquence des changements de direction réalisés au cours du déplacement , t ( 32 ) = 2.24 , Le test de Student réalisé sur les données indique un effet du type de la démonstration sur la fréquence des changements de direction réalisés au cours du déplacement , t ( 32 ) = 2.24 , p < . 05 . La fréquence des changements de direction observée pour les agents soumis à la démonstration peu illustrative est plus faible ( < . 05 . La fréquence des changements de direction observée pour les agents soumis à la démonstration peu illustrative est plus faible ( M = . 36 ) que celle obtenue par les agents soumis à la démonstration illustrative ( . 36 ) que celle obtenue par les agents soumis à la démonstration illustrative ( M = . 49 ) .. 49 ) . Prédiction d' OLEANNet Comme attendu , les résultats mettent en évidence un effet de la démonstration observée à un niveau spécifique d' évaluation de la performance . Nous posons l' hypothèse d' une influence de l' illustrativité de la démonstration se manifestant à un niveau spécifique d' évaluation , mais ne se traduisant pas à un niveau général . Plus spécifiquement , nous nous attendons à ce que les sujets présentent une similarité des actions entre les trajectoires produite et observée qui soit plus importante pour la démonstration peu illustrative que pour la démonstration illustrative . De plus , les sujets soumis à une démonstration peu illustrative devraient produire une trajectoire comportant moins de changements de direction que ceux observant une démonstration illustrative . 4.2 . Expérience Afin de confronter les prédictions OLEANNet , nous opérationnalisons les mêmes conditions expérimentales que celles utilisées en simulation et nous postulons que l' effet du type de démonstration se manifestera à un niveau spécifique d' évaluation de la performance . En regard de l' incertitude relevée dans l' étude 1 , concernant l' influence du nombre d' actions observées , nous améliorons les démonstrations afin qu' elles soient équivalentes du point de vue de la quantité d' information fournie . Méthode Participants Trente quatre étudiants en Psychologie ( tous niveaux d' études ) de l' Université de Savoie ont participé volontairement à l' expérience . Ils étaient droitiers et aucun ne présentait de trouble visuel . Matériel Le matériel utilisé pour cette expérience était strictement identique à celui utilisé dans les précédentes expériences et le dispositif était totalement équivalent . Tâche et procédure Les sujets étaient testés individuellement . Leur tâche consistait à obtenir des valeurs de compteurs spécifiques en produisant à l' aide d' une souris des actions sur les flèches du dispositif présenté à l' écran de l' ordinateur . Pour cela , ils étaient invités à observer quatre fois une démonstration de façon à utiliser le dispositif pour se déplacer dans un environnement virtuel afin d' atteindre une cible particulière , puis à reproduire quatre fois la séquence d' actions observée . La procédure expérimentale utilisée était identique à celle utilisée précédemment . A savoir une première phase de présentation et d' explication du dispositif . Une seconde phase où il était demandé au sujet d' observer attentivement une démonstration . Enfin , une dernière phase où le sujet utilisait le dispositif pour reproduire la séquence observée . Afin de tester l' hypothèse d' une influence de l' illustrativité de la démonstration nous générons deux types de démonstrations . Chacune de ces démonstrations reflétait une séquence contenant 42 actions de la souris sur les flèches . Pour la première condition expérimentale , la démonstration était peu illustrative de l' utilisation de la règle . Elle contenait 6 actions de changements de direction réparties en 3 actions gauche , 3 actions droite et 36 actions avance ( cf. graphique 32 ) . Le point de départ de cette trajectoire était identifié par des valeurs de compteur de 34 et 45 , le point cible était défini par des valeurs de 9 et 54 . Le point de référence du calcul de la distance et de l' angle était , comme précédemment , placé en Graphique 32 : Trajectoire du pion reflétant l' utilisation du dispositif selon une démonstration peu illustrative La seconde condition se caractérisait par une démonstration illustrative de la règle ( cf. graphique 33 , page ci-après ) . Elle comportait 10 actions de changement de direction réparties en 5 actions gauche et 5 actions droite , et 32 actions avance . Le point de départ était identifié par des valeurs aux compteurs de 34 et 45 et des valeurs de 11 et 45 pour le point cible à atteindre . Le point de référence du calcul des valeurs de compteurs était placé en ( 25 , 25 ) . Graphique 33 : Trajectoire du pion reflétant l' utilisation du dispositif selon une démonstration illustrative Résultats Les données de deux sujets sont exclues de l' analyse statistique du fait qu' ils ont mémorisé explicitement la séquence d' actions observée . Réussite à la tâche mesurée par la distance de passage Le test de Student ne fait apparaître aucun effet de la démonstration observée , t ( 29 ) = . 45 , NS . La moyenne des distance de passage obtenue dans la condition d' observation de la démonstration peu illustrative ( Le test de Student ne fait apparaître aucun effet de la démonstration observée , t ( 29 ) = . 45 , NS . La moyenne des distance de passage obtenue dans la condition d' observation de la démonstration peu illustrative ( M = 5.25 ) ne diffère pas de celle obtenue pour la condition d' observation de la démonstration illustrative ( 5.25 ) ne diffère pas de celle obtenue pour la condition d' observation de la démonstration illustrative ( M = 6.44 ) . OLEANNet ne prédisait aucun effet de la démonstration sur cet indicateur général d' évaluation de la performance . Néanmoins , nous pouvons relever que les moyennes pour chaque groupe de participants vont dans le même sens ( cf. graphique 34 , page suivante ) . 6.44 ) . OLEANNet ne prédisait aucun effet de la démonstration sur cet indicateur général d' évaluation de la performance . Néanmoins , nous pouvons relever que les moyennes pour chaque groupe de participants vont dans le même sens ( cf. graphique 34 , page suivante ) . Graphique 34 : Moyenne de distance de passage obtenue chez les agents et les sujets selon la démonstration observée . Qualité spécifique mesurée par la similarité chronologique des actions Nous relevons un effet du type de démonstration observé sur l' indicateur de similarité , t ( 29 ) = 3.27 , Nous relevons un effet du type de démonstration observé sur l' indicateur de similarité , t ( 29 ) = 3.27 , p < . 01 . La similarité obtenue en condition de démonstration peu illustrative ( < . 01 . La similarité obtenue en condition de démonstration peu illustrative ( M = . 79 ) est supérieure à celle obtenue suite à la démonstration illustrative ( . 79 ) est supérieure à celle obtenue suite à la démonstration illustrative ( M = . 58 ) . Ce résultat va dans le sens des prédictions d' OLEANNet qui proposait une similarité moyenne pour la démonstration peu illustrative supérieure à celle pour la démonstration illustrative . Le . 58 ) . Ce résultat va dans le sens des prédictions d' OLEANNet qui proposait une similarité moyenne pour la démonstration peu illustrative supérieure à celle pour la démonstration illustrative . Le pattern de données obtenu auprès des sujets suit celui des agents , indiquant une diminution de la similarité avec l' augmentation de l' illustrativité de la démonstration ( cf. graphique 35 ) . de données obtenu auprès des sujets suit celui des agents , indiquant une diminution de la similarité avec l' augmentation de l' illustrativité de la démonstration ( cf. graphique 35 ) . Graphique 35 : Moyenne de similarité entre actions observées et produites en fonction de la nature des participants et du type de démonstration Fréquence des changements de direction Comme le met en évidence le test de Student , le type de démonstration a un effet sur la fréquence des changements de direction , t ( 29 ) = 2.31 , Comme le met en évidence le test de Student , le type de démonstration a un effet sur la fréquence des changements de direction , t ( 29 ) = 2.31 , p < . 05 . Les sujets réalisent moins de changements de direction après observation d' une démonstration peu illustrative ( < . 05 . Les sujets réalisent moins de changements de direction après observation d' une démonstration peu illustrative ( M = . 23 ) que ceux ayant observé une démonstration illustrative ( . 23 ) que ceux ayant observé une démonstration illustrative ( M = . 35 ) . Comme présenté sur le graphique 36 , ces résultats vont dans le sens de ceux prédits par OLEANNet .. 35 ) . Comme présenté sur le graphique 36 , ces résultats vont dans le sens de ceux prédits par OLEANNet . Graphique 36 : Changement de direction moyen selon les participants et le type de démonstration Comparaison des données agents et sujets : l' analyse peut -elle dissocier les données relevant des agents de celles relevant des sujets ? Afin de compléter les analyses comparatives précédentes , nous réalisons une ANOVA sur le plan 2 ( type de participant ) * 2 ( type de démonstration observé ) en utilisant les données centrées réduites pour chacun des groupes de sujets et d' agents toutes conditions confondues . Cette analyse ne fait apparaître aucun effet de la nature des participants sur les indicateurs utilisés . Cependant , les effets de la démonstration observée relevés chez les agents et les sujets sont maintenus . Concernant la distance de passage , aucun effet de l' illustrativité de la démonstration n' apparaît sur les moyennes de données centrées réduites ( cf. graphique 37 ) . Concernant la similarité , un effet de la démonstration est de nouveau observé pour l' ensemble des participants , F ( 1 , 61 ) = 28.48 , p < . 01 et les moyennes de données centrées réduites suivent le même pattern entre les agents et les sujets ( cf. graphique 38 ) . Concernant l' influence du type de démonstration sur la fréquence des changements de directions , l' effet de la démonstration est de nouveau mis en évidence par l' analyse de variance , F ( 1 , 61 ) = 10.35 , p < . 01 . Comme illustré dans le graphique 39 , les moyennes obtenues par les sujets suivent le même pattern que celles obtenues par les agents . Graphique 37 : Distance de passage au point cible centrée réduite selon les participants en fonction de la démonstration observée Graphique 38 : Similarité moyenne par groupe de participants et par démonstration Graphique 39 : Moyenne des changement de direction chez les agents et le sujets selon la démonstration observée Discussion L' objectif de cette dernière étude était de confronter les prédictions d' OLEANNet aux données recueillies auprès de sujets humains quant à l' incidence du type de démonstration observé . L' hypothèse principale suggérée par OLEANNet considérait que l' influence de la démonstration se manifesterait à un niveau spécifique d' évaluation de la performance mais n' apparaîtrait pas à un niveau général . Aucun effet de la démonstration sur la réussite à la tâche n' a pu être mis en évidence que ce soit à partir des données relevées en simulation ou à partir de celles obtenues en expérimentation . Par ailleurs , OLEANNet indiquait que la similarité entre les actions observée et les actions produites à mesure de la trajectoire serait plus importante lorsque les sujets observaient une démonstration peu illustrative . L' analyse indique que les résultats des sujets vont dans le sens de ces prédictions . De plus , OLEANNet prédisait que plus la démonstration était illustrative de la règle plus les sujets auraient tendance à utiliser ce type de déplacement ( action droite et action gauche ) au cours de leur trajectoire . Comme le prévoyait OLEANNet , les résultats de l' expérience indiquent que plus les sujets ont observé de changements de direction plus ils sont à même d' utiliser ce comportement particulier . Au vue de la conformité des données des sujets avec celles des agents , nous pouvons considérer les conditions expérimentales comme équivalentes du point de vue de la difficulté de mémorisation de la tâche . En effet , nous avions relevé dans l' étude 2 une non équivalence du nombre d' informations présentées pour chaque trajectoire , et nous avions supposé que cela rendait peut être la tâche plus difficile à mémoriser pour les sujets . Ce biais ayant été levé dans cette étude , nous pouvons attester que la réussite à la tâche n' est pas influencée par le type de démonstration lorsque la condition d' apprentissage implique une quantité d' observation suffisante à l' élaboration d' une représentation efficace pour atteindre la cible . L' influence de la démonstration se manifeste au niveau de la qualité spécifique de la trajectoire produite ( à savoir une meilleure qualité ) lorsque la démonstration était peu illustrative , et au niveau de l' utilisation des changements de directions plus important suite à l' observation d' une démonstration illustrative . Il s' avère que l' observation d' une trajectoire proposant beaucoup de changements de direction induit l' utilisation de ce type d' actions de façon plus fréquente tant chez les agents que chez les sujets , et que la similarité des actions est plus élevée pour la démonstration peu illustrative . La réflexion autour de l' architecture d' OLEANNet nous incite à proposer que cet effet reflète une prise en considération différentielle de ces actions lors de l' élaboration de la représentation au cours de la phase d' acquisition . D' une part , nous avons constaté dans la simulation de validation 2 que la trajectoire mémorisée était plus proche de celle observée lorsque les agents étaient soumis à la démonstration illustrative , et que les changements de direction y étaient plus fréquents . Aucun effet n' avait été relevé au niveau de la trajectoire produite concernant la qualité générale , mais les actions de changements de directions étaient plus fréquentes pour les agents soumis à la démonstration illustrative . D' autre part , nous avons montré dans la simulation de cette dernière étude que l' observation de la démonstration illustrative faisait augmenter la fréquence de changement de direction en production et que la démonstration peu illustrative faisait augmenter la similarité . Ces résultats indiquent que lors de la phase d' acquisition , la mémorisation d' une trajectoire présentant peu de changements de direction implique l' ajustement de la matrice de poids selon une erreur évaluée entre sorties cognitives et actions de l' agent démonstrateur qui est peu élevée . C' est-à-dire que l' erreur calculée pour une action donnée est peu différente de celle calculée pour l' action précédente donc l' erreur rétropropagée est faible . Cela permet d' obtenir une représentation dont la caractéristique principale est d' intégrer des connaissances générales , puisqu' elle nécessite une intégration faible en terme de changements de direction . A contrario , lorsque la représentation doit intégrer un grand nombre de changements de direction , l' erreur calculée est importante d' une action à l' autre , donc l' erreur rétropropagée est importante à chaque action . Cependant , pour minimiser toutes ces erreurs de façon globale , seule une légère erreur est rétropropagée Cela contraint l' élaboration de la représentation dans le sens d' une prise en compte plus importante des changements de direction , donc l' intégration de caractéristiques spécifiques relatives à ce type d' action . Il s' avère que plus le nombre d' exemplaires de changements de directions est proposé en apprentissage plus la représentation élaborée en contient . La phase de production intervenant suite à l' acquisition des démonstrations ( peu illustrative ou illustrative ) , permet d' adapter les actions produites en fonction de celles réactivées en sortie cognitive . La matrice de poids est donc contrainte par la représentation qui induit , pour la démonstration peu illustrative , une erreur faible , évaluée par la boucle de rétroaction entre sortie cognitive et sortie motrice . Cette erreur étant faible à chaque action , l' erreur globale est elle-même faible et facilement satisfaite par les changements des valeurs de poids , ceci conduit à une similarité forte . Pour la démonstration illustrative , la contrainte est forte puisqu' elle doit intégrer un nombre élevé de changements de direction . Cela induit une erreur détectée à chaque action élevée , cependant , pour minimiser toutes ces erreurs de façon globale seule une légère erreur est rétropropagée . Cela se traduit par une plus faible similarité de la trajectoire produite , mais contenant un nombre important de changements de direction puisque ceux -ci sont pris en compte dans la boucle de rétroaction entre sortie cognitive et sortie motrice . Le déplacement effectivement produit par les agents contient donc plus d' actions lorsqu' elles ont été mémorisées en plus grand nombre . Ramenons ce raisonnement à l' explication des performances obtenues chez les sujets . Lorsqu' ils sont soumis à une trajectoire peu illustrative de la règle , ils disposent de peu d' exemples des actions de changements de direction , donc la représentation qu' ils construisent en contient peu . En utilisant cette représentation comme guide de leur comportement en phase de production , l' ajustement est faiblement contraint par les actions gauche et droite . Ils proposent peu d' actions de ce type , mais cela leur permet de proposer une trajectoire plus similaire à celle observée , puisqu' ils utilisent de façon plus efficace les changements de direction . A contrario , les exemples de changements de direction proposés dans la démonstration illustrative nécessitent que les sujets intègrent ce type d' action à la représentation construite . En réactivant la représentation , ils se souviennent devoir produire ce type d' actions , ce qui les conduit à les utiliser plus fréquemment . Mais ce qui les conduit aussi à s' éloigner de la trajectoire observée . En fait , les sujets utilisent davantage ce type d' actions , mais ils les utilisent à des moments du déplacement non adaptés . Nous pensons que le niveau d' illustration de la tâche peut être rapproché du niveau de compétence exhibé par l' individu modèle . En effet , un individu novice dans la réalisation d' une tâche émettra de nombreuses erreurs au cours de la démonstration , alors qu' un expert présentera une démonstration en contenant peu . Les trajectoires que nous avons proposées renvoient aux mêmes notions en ce sens que la trajectoire illustrative présente plus d' exemples d' application de la règle que n' en présente la trajectoire peu illustrative , ce qui revient à les considérer comme pouvant refléter un niveau de compétence . Dans ce cas , il s' avère que l' influence d' un modèle expert ou novice se manifesterait à un niveau de critère spécifique d' évaluation de la performance et non en terme de réussite à la tâche . DISCUSSION GENERALE Le travail que nous avons exposé , tout au long de ce manuscrit , nous amène à évaluer les apports du modèle connexioniste écologique OLEANNet comme une évolution tangible de la théorie de l' apprentissage par observation . Comme nous l' avons déjà exposé , la psychologie sociale trouve dans le formalisme connexioniste un intérêt tout particulier pour concevoir des modèles répliquant le fonctionnement cognitif de l' individu au cours d' une situation sociale . En concevant le traitement de l' information comme réalisé en parallèle sur une structure d' unités simples , ce type de modèle permet d' envisager la façon dont les individus intègrent et utilisent les informations sans que celles -ci ne soient codées sous forme symbolique . Ceci contribue à la compréhension des activités cognitives mises en jeu lors des interactions sociales , et permet d' envisager la réunification de mécanismes différenciés proposés jusqu'alors comme explicatifs de différents phénomènes . Néanmoins , les modèles actuellement développés se heurtent à une contrainte d' utilisation forte . En effet , le réseau de neurones implémentant le phénomène étudié nécessite une phase préalable de définition des informations dont il doit disposer pour être en mesure d' émettre des réponses appropriées . Dès lors , cela implique de définir au préalable le type d' exemplaires devant être appris par le réseau de neurones pour répliquer un phénomène existant , et de créer une seconde base d' exemplaires sur laquelle le réseau de neurones pourra être testé . Nous avons donc proposé d' utiliser l' idée du formalisme écologique développé en vie artificielle pour développer un modèle dont les contraintes d' apprentissage seraient définies par l' environnement social et/ou physique . Afin de rendre compte de l' intérêt d' introduire ce nouveau formalisme en psychologique sociale , nous avons choisi d' implémenter une théorie impliquant par essence la présence de plusieurs individus : la théorie de l' apprentissage par observation . Le champ d' application de cette dernière étant vaste , nous avons limité notre cadre de recherche à l' apprentissage par observation des habiletés motrices . L' objectif général de ce travail était donc de proposer un modèle connexioniste écologique fiable et prédictif de l' apprentissage par observation des habiletés motrices . Nous proposons , dans ce dernier chapitre , de discuter de la contribution d' un tel modèle autour de trois points . Le premier considère l' hypothèse d' un apprentissage par observation sans construction de représentation symbolique . Le deuxième expose l' intérêt d' une implémentation écologique de ce type de situation . Le dernier renvoie à la valeur prédictive de notre modèle OLEANNet . Hypothèse d' un apprentissage par observation médiatisée par une représentation distribuée Dans le cadre de l' apprentissage par observation des habiletés motrices , nous avons constaté que les auteurs s' accordent sur le bénéfice du codage symbolique dans la production ultérieure des comportements ( Abravanel & Fergusson , 1998 ; Bandura , 1986 ; Carroll Berger Dans le cadre de l' apprentissage par observation des habiletés motrices , nous avons constaté que les auteurs s' accordent sur le bénéfice du codage symbolique dans la production ultérieure des comportements ( Abravanel Bandura , 1986 ; Carroll Berger et al. , 1979 ; Meltzoff , 1988 ; Williams , 1987 ) . Cependant , nous avons indiqué que peu d' éléments ne contribuaient à soutenir l' hypothèse d' un tel codage et que celui -ci relevait plus de l' apprentissage de l' association entre symboles et gestes . Bien que les tests de reconnaissance de gestes aient soutenu l' idée de l' existence d' un tel codage puisque les sujets reconnaissaient l' agencement des actions composant le geste ( Carroll & Bandura , 1982 , 1990 ) , il nous semble que ce résultat contribue plutôt à considérer que le codage symbolique facilite la mémorisation temporelle des actions . Cela n' implique pas pour autant que les actions soient elles-mêmes codées symboliquement . Dès lors , d' autres formes de codage pourraient être envisagées comme tout aussi efficace et nous avons proposé de considérer que l' apprentissage par observation pouvait émerger à partir d' un codage distribué des actions observées. , 1979 ; Meltzoff , 1988 ; Williams , 1987 ) . Cependant , nous avons indiqué que peu d' éléments ne contribuaient à soutenir l' hypothèse d' un tel codage et que celui -ci relevait plus de l' apprentissage de l' association entre symboles et gestes . Bien que les tests de reconnaissance de gestes aient soutenu l' idée de l' existence d' un tel codage puisque les sujets reconnaissaient l' agencement des actions composant le geste ( Carroll & Bandura , 1982 , 1990 ) , il nous semble que ce résultat contribue plutôt à considérer que le codage symbolique facilite la mémorisation temporelle des actions . Cela n' implique pas pour autant que les actions soient elles-mêmes codées symboliquement . Dès lors , d' autres formes de codage pourraient être envisagées comme tout aussi efficace et nous avons proposé de considérer que l' apprentissage par observation pouvait émerger à partir d' un codage distribué des actions observées . Afin de rendre compte de l' apprentissage par observation sans construction de représentation symbolique , nous avons conçu le modèle OLEANNet dont le fonctionnement est similaire au déroulement de l' apprentissage par observation défini par Bandura ( 1977 ) . Selon cet auteur , pendant la phase d' acquisition , l' individu focalise son attention sur le comportement émis par autrui et mémorise ce comportement sous forme d' une représentation symbolique . Pendant la phase de production , la réactivation de la représentation induit , grâce au processus de Afin de rendre compte de l' apprentissage par observation sans construction de représentation symbolique , nous avons conçu le modèle OLEANNet dont le fonctionnement est similaire au déroulement de l' apprentissage par observation défini par Bandura ( 1977 ) . Selon cet auteur , pendant la phase d' acquisition , l' individu focalise son attention sur le comportement émis par autrui et mémorise ce comportement sous forme d' une représentation symbolique . Pendant la phase de production , la réactivation de la représentation induit , grâce au processus de conception-matching , la production du comportement et son ajustement en regard des informations réactivées . La conception d' OLEANNet n' était pas conduite par une remise en cause de la nécessité de ces phases , mais cherchait à tester l' hypothèse d' un apprentissage par observation médiatisé par une représentation distribuée du comportement observé conduisant l' individu à acquérir de façon équivalente un nouveau comportement . C' est la raison pour laquelle le déroulement de l' apprentissage dans OLEANNet se subdivise en deux phases . La première , répliquant la phase d' acquisition , considère que l' observation d' une séquence comportementale induit la construction d' une représentation distribuée des actions observées . L' élaboration de cette représentation est contrainte par les actions émises en démonstration . Pendant la seconde phase , la production du comportement est auto-régulée par les connaissances mémorisées lors de l' observation . Ainsi , la production motrice est contrainte par la réactivation des actions mémorisées ( sous forme de représentation distribuée ) qui induisent l' ajustement de l' exécution . Nous voyons qu' en dehors de la nature de la représentation utilisée dans la théorie de Bandura et dans OLEANNet , les autres éléments sont maintenus aussi équivalents que possible . La seule différence réside bien dans l' utilisation ou non de symbole lors du codage du comportement observé . la production du comportement et son ajustement en regard des informations réactivées . La conception d' OLEANNet n' était pas conduite par une remise en cause de la nécessité de ces phases , mais cherchait à tester l' hypothèse d' un apprentissage par observation médiatisé par une représentation distribuée du comportement observé conduisant l' individu à acquérir de façon équivalente un nouveau comportement . C' est la raison pour laquelle le déroulement de l' apprentissage dans OLEANNet se subdivise en deux phases . La première , répliquant la phase d' acquisition , considère que l' observation d' une séquence comportementale induit la construction d' une représentation distribuée des actions observées . L' élaboration de cette représentation est contrainte par les actions émises en démonstration . Pendant la seconde phase , la production du comportement est auto-régulée par les connaissances mémorisées lors de l' observation . Ainsi , la production motrice est contrainte par la réactivation des actions mémorisées ( sous forme de représentation distribuée ) qui induisent l' ajustement de l' exécution . Nous voyons qu' en dehors de la nature de la représentation utilisée dans la théorie de Bandura et dans OLEANNet , les autres éléments sont maintenus aussi équivalents que possible . La seule différence réside bien dans l' utilisation ou non de symbole lors du codage du comportement observé . La première simulation de validation nous a conduit à considérer que le fonctionnement défini La première simulation de validation nous a conduit à considérer que le fonctionnement défini a priori pour OLEANNet correspond effectivement aux phases d' acquisition et de production proposées par Bandura ( 1977 ) . En effet , la seule phase d' acquisition n' était pas suffisante à une reproduction correcte . De plus , ceci va dans le sens des résultats obtenus par Deakin et Proteau ( 2000 ) , indiquant que la représentation construite au cours de l' acquisition ne peut être utilisée comme moteur du comportement de façon directe . Ces auteurs ont suggéré qu' elle est rendue fonctionnelle par le biais de la phase de production qui considère la réactivation de la représentation et son utilisation comme guide au comportement . OLEANNet renvoie effectivement à la nécessité d' une seconde phase de mise en action , puisque sans celle -ci les agents observateurs sont incapables de produire un déplacement efficace . La phase de production à laquelle est soumise l' agent observateur permet dès lors de rendre la représentation fonctionnelle et de générer un déplacement efficace de l' observateur jusqu'à la cible . Nous ne développerons pas ici les autres éléments considérant que l' apprentissage par observation peut être répliqué par médiatisation d' une représentation distribuée , car il nous semble important de considérer le modèle OLEANNet dans son ensemble . Nous proposons de revenir sur la représentation distribuée dans le cadre du formalisme écologique que nous avons adopté au cours de notre recherche . pour OLEANNet correspond effectivement aux phases d' acquisition et de production proposées par Bandura ( 1977 ) . En effet , la seule phase d' acquisition n' était pas suffisante à une reproduction correcte . De plus , ceci va dans le sens des résultats obtenus par Deakin et Proteau ( 2000 ) , indiquant que la représentation construite au cours de l' acquisition ne peut être utilisée comme moteur du comportement de façon directe . Ces auteurs ont suggéré qu' elle est rendue fonctionnelle par le biais de la phase de production qui considère la réactivation de la représentation et son utilisation comme guide au comportement . OLEANNet renvoie effectivement à la nécessité d' une seconde phase de mise en action , puisque sans celle -ci les agents observateurs sont incapables de produire un déplacement efficace . La phase de production à laquelle est soumise l' agent observateur permet dès lors de rendre la représentation fonctionnelle et de générer un déplacement efficace de l' observateur jusqu'à la cible . Nous ne développerons pas ici les autres éléments considérant que l' apprentissage par observation peut être répliqué par médiatisation d' une représentation distribuée , car il nous semble important de considérer le modèle OLEANNet dans son ensemble . Nous proposons de revenir sur la représentation distribuée dans le cadre du formalisme écologique que nous avons adopté au cours de notre recherche . Intérêt d' une implémentation écologique de l' apprentissage par observation Si les propriétés inhérentes aux modèles connexionistes demeurent tout aussi importantes dans OLEANNet , nous envisagions néanmoins d' aller plus loin en tenant compte des interactions que ce modèle partage avec l' environnement . Les travaux développés en vie artificielle sur le formalisme des réseaux de neurones écologiques nous ont servi de base de réflexion sur la façon d' intégrer ces interactions ( Cecconi , Parisi & Nolfi , 1990 ) . Dans cette perspective , le modèle connexioniste n' est plus envisagé comme un outil statique de réception d' informations prédéfinies au préalable , mais comme un outil dynamique d' intégration d' informations provenant de l' environnement . Le réseau de neurones est considéré comme un agent actif pour lequel les conditions d' apprentissage résultent de l' interaction de l' agent avec l' environnement et non d' une base d' informations prédéfinies . L' originalité réside ici dans la conception d' agents considérés comme acteurs de leur perception et de leur apprentissage puisqu' ils bénéficient de leur interaction avec l' environnement . Ainsi , la simulation d' une situation classique d' apprentissage par observation mettant en présence deux individus devient plausible . En effet , dans le contexte du formalisme écologique , il est possible de mettre en présence deux agents dans un même environnement . Pour implémenter cette situation nous avons créé un premier agent démonstrateur qui se déplace d' un point de départ jusqu'à une cible dans un environnement en deux dimensions . Comme dans une situation réelle où l' étude des conditions d' apprentissage par observation nécessite la participation d' un individu modèle , c' est-à-dire un individu réalisant une démonstration du comportement devant un individu apprenant , l' agent démonstrateur doit être vu comme participant à la situation d' apprentissage par observation . Cet agent fournit à l' agent observateur les informations nécessaires au déroulement de l' apprentissage par observation , il ne participe donc pas à la compréhension des processus impliqués chez l' individu apprenant par observation , mais contribue à la simulation du phénomène . OLEANNet : apport d' un réseau de neurones écologique à la compréhension de l' apprentissage par observation Les simulations de validation ont montré qu' en utilisant une version d' OLEANNet adaptée , il était possible de simuler une situation sociale au cours de laquelle un agent observateur apprenait à réaliser un déplacement sur la base des informations extraites d' une démonstration . Comme nous l' avons déjà abordé , le fonctionnement d' OLEANNet réplique le déroulement de l' apprentissage par observation , et la première simulation a permis de rendre compte de la nécessité des phases d' apprentissage implémentées dans OLEANNet . Pendant la phase d' acquisition , l' agent observateur bénéficie du comportement émis par l' agent démonstrateur , en ce sens qu' il perçoit les informations sur la configuration spatiale entre les deux agents et le point cible tout au long de la démonstration . Il apprend dès lors pour chacune des configurations à répondre par une action particulière correspondant à celle produite par l' agent démonstrateur . Ceci conduit à l' élaboration d' une représentation distribuée du déplacement observé . Néanmoins , cette représentation ne consiste qu' en une approximation de la trajectoire réellement émise par l' agent démonstrateur . Nous sommes bien ici dans la prise en compte de l' interaction entre deux agents qui nous amène à considérer que la mémorisation du déplacement n' est pas une réplique parfaite du comportement observé , mais une approximation de ce comportement . D' après le fonctionnement que nous avons défini , la seule phase d' acquisition n' était pas suffisante à une reproduction correcte et la phase de production était indispensable . Cette dernière induit l' utilisation de la représentation approximative mémorisée pour produire et ajusté le comportement de déplacement effectif . Les résultats indiquent qu' effectivement suite à la phase de production les agents sont en mesure de produire un déplacement efficace leur permettant d' atteindre la cible . Au-delà de ce constat d' adéquation du fonctionnement d' OLEANNet avec les phases de l' apprentissage par observation , il convient de considérer plus avant l' auto régulation du comportement produit par le comportement mémorisé . Cette auto-régulation relève de l' implémentation du processus de Au-delà de ce constat d' adéquation du fonctionnement d' OLEANNet avec les phases de l' apprentissage par observation , il convient de considérer plus avant l' auto régulation du comportement produit par le comportement mémorisé . Cette auto-régulation relève de l' implémentation du processus de conception-matching définit par Bandura ( 1986 ) , mais la boucle de rétro action que nous avons implémentée considère d' autres aspects . Lorsque l' agent est en phase de production , il répond aux informations perceptives ( configurations spatiales ) en réactivant la représentation distribuée qui induit le rappel de l' action mémorisée dans la même situation . Néanmoins , nous avons identifié que la représentation était une approximation du déplacement observé , si bien que l' action rappelée n' était pas forcément exacte . Par exemple , l' action rappelée peut correspondre à avancer alors que l' agent observateur avait observé une action gauche . L' ajustement de l' action produite est contraint par cette action erronée , et l' agent se déplace en fonction de celle -ci . Dans ce cas , il se retrouve dans une position où la configuration spatiale perçue en entrée n' est pas en correspondance avec l' une de celle observée , cependant , en réactivant la représentation distribuée , il accède au rappel d' une action qui ne l' éloigne pourtant pas davantage . Suite à cet exemple généralisable sur les autres situations rencontrées par l' agent observateur , nous proposons de relever deux éléments particulièrement intéressants de l' utilisation d' un modèle connexioniste écologique . D' une part , la capacité de l' agent à répondre de façon adaptée dans une situation inconnue , d' autre part , la possibilité d' envisager cette situation inconnue comme résultant du comportement dynamique émis par l' agent . définit par Bandura ( 1986 ) , mais la boucle de rétro action que nous avons implémentée considère d' autres aspects . Lorsque l' agent est en phase de production , il répond aux informations perceptives ( configurations spatiales ) en réactivant la représentation distribuée qui induit le rappel de l' action mémorisée dans la même situation . Néanmoins , nous avons identifié que la représentation était une approximation du déplacement observé , si bien que l' action rappelée n' était pas forcément exacte . Par exemple , l' action rappelée peut correspondre à avancer alors que l' agent observateur avait observé une action gauche . L' ajustement de l' action produite est contraint par cette action erronée , et l' agent se déplace en fonction de celle -ci . Dans ce cas , il se retrouve dans une position où la configuration spatiale perçue en entrée n' est pas en correspondance avec l' une de celle observée , cependant , en réactivant la représentation distribuée , il accède au rappel d' une action qui ne l' éloigne pourtant pas davantage . Suite à cet exemple généralisable sur les autres situations rencontrées par l' agent observateur , nous proposons de relever deux éléments particulièrement intéressants de l' utilisation d' un modèle connexioniste écologique . D' une part , la capacité de l' agent à répondre de façon adaptée dans une situation inconnue , d' autre part , la possibilité d' envisager cette situation inconnue comme résultant du comportement dynamique émis par l' agent . Nous avons indiqué qu' OLEANNet disposait des mêmes propriétés que les modèles connexionistes classiques , notamment la propriété d' émergence . Cette propriété implique qu' après l' apprentissage , le réseau est capable de répondre de façon efficace à un stimulus inconnu ( généralisation ) , puisqu' il utilise la représentation distribuée pour répondre . Cette réponse adaptée émerge des acquisitions antérieures , puisqu' elle intègre tous les éléments d' apprentissage . Il y a donc généralisation de l' apprentissage d' exemples à des situations inconnues . D' après le fonctionnement des réseaux de neurones , suite à l' apprentissage , la structure de poids reflète toutes les situations apprises . Lors de la présentation d' une situation inconnue , l' activation correspondante est propagée au travers des poids adaptés ce qui induit l' émergence d' une réponse adaptée . Cela se traduit pour l' agent observateur , par l' intégration d' un ensemble d' exemplaires de situations configuration-action dans une seule et même structure au cours de la phase d' acquisition . Dès lors , une réponse adaptée est émise pour chaque présentation d' une configuration inconnue que l' agent rencontre en phase de production et par extension au cours de la simulation . Pour aller encore plus loin , nous avançons qu' au-delà de l' apprentissage des couples de configuration-action , l' agent observateur intègre , pour partie tout au moins , la règle de l' angle sous-jacente à l' apprentissage de l' agent démonstrateur . Ainsi , en phase de production , lorsque l' agent perçoit une configuration inconnue , la réponse émise en sortie cognitive est adaptée puisqu' elle résulte de l' activation de la représentation distribuée du déplacement observé . Le comportement est alors ajusté en fonction de cette réponse adaptée . L' intérêt d' OLEANNet est de proposer que malgré une mémorisation approximative du déplacement pendant la phase d' acquisition , le comportement effectivement produit est adapté à la situation puisque ce comportement résulte de l' utilisation d' une représentation intégrant toutes les situations rencontrées . Ceci nous conduit à amorcer le second intérêt de l' utilisation d' un modèle connexioniste écologique , à savoir le dynamisme de la relation entre agent et environnement . Si nous constatons que la présence d' erreur dans la représentation mémorisée n' implique pas une absence d' efficacité du comportement produit , c' est grâce à la combinaison d' une implémentation spécifique de la boucle d' auto-régulation ( du comportement produit par la représentation mémorisée ) , et l' utilisation du formalisme écologique ( permettant d' envisager l' agent comme acteur de sa perception et de ses actions ) . Nous pensons que la boucle d' auto-régulation implémente correctement le processus de Ceci nous conduit à amorcer le second intérêt de l' utilisation d' un modèle connexioniste écologique , à savoir le dynamisme de la relation entre agent et environnement . Si nous constatons que la présence d' erreur dans la représentation mémorisée n' implique pas une absence d' efficacité du comportement produit , c' est grâce à la combinaison d' une implémentation spécifique de la boucle d' auto-régulation ( du comportement produit par la représentation mémorisée ) , et l' utilisation du formalisme écologique ( permettant d' envisager l' agent comme acteur de sa perception et de ses actions ) . Nous pensons que la boucle d' auto-régulation implémente correctement le processus de conception-matching ( Bandura , 1987 ) . De plus , selon cet auteur , le comportement d' un individu peut affecter la façon dont il expérimente son environnement puisque ce sont les actions des agents qui régulent à la fois la perception de leur environnement et leur apprentissage . Cet aspect dynamique de la relation de l' agent dans son expérience de l' environnement ne peut émerger que par l' utilisation du formalisme écologique . De plus , chacune des situations inconnues rencontrées par l' agent résulte d' un comportement effectivement produit par l' agent . Ce comportement étant lui-même une réponse à une situation définie par l' environnement . Nous pensons que cela reflète un dynamisme plausible de l' interaction entre l' agent et son environnement . Nous retrouvons dans la relation de l' agent observateur avec son environnement les aspects de modifications de l' environnement auxquelles il est exposé ainsi que les aspects de modifications des perceptions résultantes de cette nouvelle exposition . Ceci réfère au dynamisme réciproque entre comportement et environnement proposé par Bandura ( 1986 ) . En effet , selon cet auteur l' individu est le produit et le producteur de son environnement . Ainsi , le comportement d' un individu détermine les aspects de l' environnement auxquels il est exposé . En retour , l' environnement induit des modifications comportementales . Si nous n' avions pas utilisé le formalisme écologique , nous n' aurions pas pu obtenir ce type de situation , étant donné que le test des situations inconnues aurait été prédéfini . ( Bandura , 1987 ) . De plus , selon cet auteur , le comportement d' un individu peut affecter la façon dont il expérimente son environnement puisque ce sont les actions des agents qui régulent à la fois la perception de leur environnement et leur apprentissage . Cet aspect dynamique de la relation de l' agent dans son expérience de l' environnement ne peut émerger que par l' utilisation du formalisme écologique . De plus , chacune des situations inconnues rencontrées par l' agent résulte d' un comportement effectivement produit par l' agent . Ce comportement étant lui-même une réponse à une situation définie par l' environnement . Nous pensons que cela reflète un dynamisme plausible de l' interaction entre l' agent et son environnement . Nous retrouvons dans la relation de l' agent observateur avec son environnement les aspects de modifications de l' environnement auxquelles il est exposé ainsi que les aspects de modifications des perceptions résultantes de cette nouvelle exposition . Ceci réfère au dynamisme réciproque entre comportement et environnement proposé par Bandura ( 1986 ) . En effet , selon cet auteur l' individu est le produit et le producteur de son environnement . Ainsi , le comportement d' un individu détermine les aspects de l' environnement auxquels il est exposé . En retour , l' environnement induit des modifications comportementales . Si nous n' avions pas utilisé le formalisme écologique , nous n' aurions pas pu obtenir ce type de situation , étant donné que le test des situations inconnues aurait été prédéfini . Selon Bandura ( 1986 ) , le déterminisme réciproque intervient aussi entre les facteurs personnels et l' environnement , en ce sens que ce dernier propose des réponses que l' individu doit intégrer à son système de pensée . Nous proposons d' envisager la façon dont les agents intègrent les informations proposées en démonstration , en fonction des capacités de bases dont ils disposent , comme une possibilité d' implémentation de l' influence entre les facteurs personnels et l' environnement . Si OLEANNet n' était qu' un simple outil mathématique de résolution de la tâche , les agents auraient tous présentés des performances équivalentes même si chacun d' eux disposait d' un répertoire comportemental de base différent ( matrices de poids de départ différentes ) . Nous avons observés dans la simulation 2 que ce n' est pas le cas . Ainsi , les agents présentaient des différences dans la trajectoire qu' ils produisaient suite à l' apprentissage par observation de la même démonstration , et des performances différentes selon la démonstration observée . Cela implique que la construction de la représentation dépend du répertoire comportemental de base et du type de démonstration observée . Suite à la vérification du fonctionnement d' OLEANNet et de sa capacité à produire des comportements différenciés , nous avons souhaité confronter notre modèle aux résultats existants afin de vérifier une seconde fois sa fiabilité . Les résultats obtenus dans la troisième simulation ont montré une détérioration de la performance entre ce qui était appris et ce qui était reproduit , répliquant le Suite à la vérification du fonctionnement d' OLEANNet et de sa capacité à produire des comportements différenciés , nous avons souhaité confronter notre modèle aux résultats existants afin de vérifier une seconde fois sa fiabilité . Les résultats obtenus dans la troisième simulation ont montré une détérioration de la performance entre ce qui était appris et ce qui était reproduit , répliquant le pattern de données relevées par Bandura et Jeffery ( 1973 ) . En considérant le fonctionnement d' OLEANNet , il est alors possible de proposer une explication de cette détérioration . Selon OLEANNet , la dégradation de la performance résulte des approximations successives qui interviennent en phase d' acquisition , puis en phase de production . Nous avons constaté qu' au cours de l' apprentissage , l' agent observateur réalisait une première approximation de la tâche pendant la phase d' acquisition . Cette approximation traduisant le codage qui s' opère sur les informations saillantes du comportement observé . Comme nous l' avons déjà mentionné , lorsque l' agent est en phase de production , il répond aux informations perceptives par une action adaptée , mais qui n' est pas forcément équivalente à celle observée , en réactivant la représentation distribuée . Au cours de cette phase , l' agent réalise de la même façon une seconde approximation à partir de l' approximation précédente . Dès lors que l' agent peut se retrouver dans une situation ne correspondant pas à une situation rencontrée en phase d' apprentissage , l' utilisation d' une action adaptée le conduit à réaliser de façon efficace , mais non équivalente , son déplacement . C' est la raison pour laquelle la réalisation effective de la tâche est plus éloignée de la démonstration que ne l' est la représentation construite au cours de l' observation . En d' autres termes , OLEANNet réplique une effective dégradation de la performance entre rappel et production et il nous permet aussi d' en apporter une explication . Nous proposons de la même façon , que l' individu , par des approximations successives , émet un comportement qui lui permet de réaliser efficacement la tâche , sans pour autant en avoir construit une représentation totalement équivalente . de données relevées par Bandura et Jeffery ( 1973 ) . En considérant le fonctionnement d' OLEANNet , il est alors possible de proposer une explication de cette détérioration . Selon OLEANNet , la dégradation de la performance résulte des approximations successives qui interviennent en phase d' acquisition , puis en phase de production . Nous avons constaté qu' au cours de l' apprentissage , l' agent observateur réalisait une première approximation de la tâche pendant la phase d' acquisition . Cette approximation traduisant le codage qui s' opère sur les informations saillantes du comportement observé . Comme nous l' avons déjà mentionné , lorsque l' agent est en phase de production , il répond aux informations perceptives par une action adaptée , mais qui n' est pas forcément équivalente à celle observée , en réactivant la représentation distribuée . Au cours de cette phase , l' agent réalise de la même façon une seconde approximation à partir de l' approximation précédente . Dès lors que l' agent peut se retrouver dans une situation ne correspondant pas à une situation rencontrée en phase d' apprentissage , l' utilisation d' une action adaptée le conduit à réaliser de façon efficace , mais non équivalente , son déplacement . C' est la raison pour laquelle la réalisation effective de la tâche est plus éloignée de la démonstration que ne l' est la représentation construite au cours de l' observation . En d' autres termes , OLEANNet réplique une effective dégradation de la performance entre rappel et production et il nous permet aussi d' en apporter une explication . Nous proposons de la même façon , que l' individu , par des approximations successives , émet un comportement qui lui permet de réaliser efficacement la tâche , sans pour autant en avoir construit une représentation totalement équivalente . Les résultats de la dernière simulation ont montré qu' au-delà d' une simple réplication des résultats quant à une tâche de transfert , OLEANNet possède la capacité de généraliser un comportement appris à de nouvelles situations . Cette propriété inhérente au modèle connexioniste , nous autorise à considérer la performance en tâche de transfert , comme dépendante du type de démonstration observé . Les résultats obtenus en tâche de transfert indiquent que les agents observateurs réalisaient efficacement la tâche , et un effet facilitateur de l' observation d' une trajectoire peu illustrative a pu être constaté . Ces résultats vont dans le sens de ceux obtenus par Shea Les résultats de la dernière simulation ont montré qu' au-delà d' une simple réplication des résultats quant à une tâche de transfert , OLEANNet possède la capacité de généraliser un comportement appris à de nouvelles situations . Cette propriété inhérente au modèle connexioniste , nous autorise à considérer la performance en tâche de transfert , comme dépendante du type de démonstration observé . Les résultats obtenus en tâche de transfert indiquent que les agents observateurs réalisaient efficacement la tâche , et un effet facilitateur de l' observation d' une trajectoire peu illustrative a pu être constaté . Ces résultats vont dans le sens de ceux obtenus par Shea et al. ( 2000 ) , puisque les agents sont plus à même de transférer des connaissances dont l' acquisition est peu contrainte ( peu d' éléments spécifiques ) . En fonction de l' illustrativité de la tâche , la représentation construite intègre plus ou moins d' éléments spécifiques . Plus la trajectoire observée est illustrative , plus l' apprentissage est contraignant car il doit intégrer des informations particulières sur les changements de direction . En revanche , l' observation d' une trajectoire peu illustrative induit une contrainte d' apprentissage moindre , par conséquent , la représentation intègre des informations plus générales d' atteinte de cible . Au cours de la phase de production , le comportement émis est contraint par la représentation , de ce fait , plus la représentation contient d' informations spécifiques plus son utilisation en tant que guide de la production va induire de contraintes . Cela s' est traduit en tâche de transfert par une capacité à généraliser de façon performante les connaissances acquises lorsque celles -ci sont peu spécifiques à la tâche . ( 2000 ) , puisque les agents sont plus à même de transférer des connaissances dont l' acquisition est peu contrainte ( peu d' éléments spécifiques ) . En fonction de l' illustrativité de la tâche , la représentation construite intègre plus ou moins d' éléments spécifiques . Plus la trajectoire observée est illustrative , plus l' apprentissage est contraignant car il doit intégrer des informations particulières sur les changements de direction . En revanche , l' observation d' une trajectoire peu illustrative induit une contrainte d' apprentissage moindre , par conséquent , la représentation intègre des informations plus générales d' atteinte de cible . Au cours de la phase de production , le comportement émis est contraint par la représentation , de ce fait , plus la représentation contient d' informations spécifiques plus son utilisation en tant que guide de la production va induire de contraintes . Cela s' est traduit en tâche de transfert par une capacité à généraliser de façon performante les connaissances acquises lorsque celles -ci sont peu spécifiques à la tâche . Prédictivité du modèle OLEANNet Concernant la prédictivité d' OLEANNet , nous avons créé une tâche équivalente à celle utilisée en simulation . Cette tâche consistait pour les sujets à observer l' utilisation d' un dispositif permettant de déplacer fictivement un pion dans un espace en deux dimensions pour l' amener à une position particulière . Les sujets ne disposaient que de deux informations concernant ce déplacement : la distance et l' angle entre le pion orienté et la position cible . Après avoir vérifier que l' apprentissage de cette tâche était amélioré par une phase préalable d' observation , nous avons confronté les prédictions d' OLEANNet aux données obtenues par les sujets humains dans les mêmes conditions . Nous avions relevé un biais d' opérationnalisation des effets de la pratique dans les expériences cherchant à déterminer si la performance dépendait de la qualité de l' ajustement du comportement au cours de l' exécution motrice . Dans les simulations que nous avons réalisées avec OLEANNet , nous avons cherché à dissocier les effets de la phase d' acquisition de ceux de la phase de production . Dans ce but , nous avons utilisé des critères d' évaluation de la performance plus spécifiques , notamment en terme de qualité de la reproduction . Les simulations réalisées avec OLEANNet nous ont permis de prédire que la performance serait améliorée avec l' augmentation du nombre d' observations . D' après les résultats obtenus avec OLEANNet , cette amélioration est due à la qualité de la représentation construite pendant la phase d' acquisition . Selon les propriétés d' apprentissage des réseaux de neurones , pendant les premières observations de la phase d' acquisition , la représentation construite intègre des informations générales sur la tâche . En effet , la quantité d' informations à mémoriser étant importante , la construction d' une représentation distribuée ne peut que considérer une solution souple à l' approximation de la tâche . Cette représentation réactivée lors de la production étant peu informative , elle ne contraint que faiblement l' exécution motrice qui est adaptée en fonction des informations générales mémorisées . Lors du test de la performance chez les sujets , cela se manifeste par une qualité de la reproduction peu élevée suite à peu d' essais d' observations . Avec les essais d' observation supplémentaires , l' adaptation de la représentation distribuée s' affine intégrant des informations de meilleure qualité . Dès lors , le test de la performance indique qu' après un nombre suffisant d' observations , l' approximation du comportement est plus efficace et de meilleure qualité . Par ailleurs , nous avons cherché à déterminer , auprès des sujets humains , si la représentation élaborée au cours de la phase d' acquisition était rendue fonctionnelle par la pratique ou par la qualité de la représentation construite au terme de la phase d' acquisition . Il s' avère que l' élément déterminant de l' apprentissage de la tâche que nous avons utilisée est la quantité d' observation autorisée . Cela va dans le sens des résultats relevés avec OLEANNet puisqu' à mesure des observations , la représentation construite intègre des informations de plus en plus pertinentes , ce qui se traduit par une qualité grandissante du comportement reproduit . Contrairement aux suggestions de Deakin et Proteau ( 2002 ) , la tâche utilisée ici n' implique pas une fonctionnalité rendue effective par la pratique mais plutôt par la construction d' une représentation pertinente pendant la phase d' acquisition . Bien que le niveau de compétence ( ou d' expertise ) n' ait pas été manipulé de façon classique , nous pensons qu' il peut être rapproché du niveau d' illustrativité des démonstrations . En effet , nombre d' études s' intéressant à ce facteur proposent qu' un individu novice émet des erreurs d' exécution alors que les erreurs produites par un expert sont peu nombreuses ( Blandin , Lhuisset & Proteau , 1999 ; Bien que le niveau de compétence ( ou d' expertise ) n' ait pas été manipulé de façon classique , nous pensons qu' il peut être rapproché du niveau d' illustrativité des démonstrations . En effet , nombre d' études s' intéressant à ce facteur proposent qu' un individu novice émet des erreurs d' exécution alors que les erreurs produites par un expert sont peu nombreuses ( Blandin , Lhuisset Braaksma , Rijlaarsdam Riolo , 1997 ) . Néanmoins , nous avons relevé dans la littérature des résultats contradictoires de l' influence de chacun des modèles . Nous pensons que ces différences pourraient être expliquées en terme de difficulté à dissocier le niveau de compétence des caractéristiques personnelles ( statut , sexe ) . C' est pourquoi , nous avons défini deux niveaux de démonstration tout en maintenant caractéristiques personnelles du modèle constantes ( le même individu exécutait soit l' une ou l' autre des démonstrations ) . Les trajectoires que nous avons élaborées semblent répondre aux critères de fréquence d' erreurs dans la mesure où la démonstration illustrative satisfait plus fréquemment la règle de déplacement que la démonstration peu illustrative . Ainsi , la démonstration peu illustrative correspond à un comportement impliquant de nombreuses erreurs . Si pour certains , l' observation d' un modèle novice est plus efficace , c' est que l' observateur détecte en cours d' observation des erreurs qu' il corrige de lui-même . Nous ne tentons pas ici de départager un débat longuement éprouvé dans la littérature , mais d' apporter un autre point de vue . D' après les résultats obtenus avec OLEANNet , l' influence de la démonstration , par extension de la compétence , se manifesterait à un niveau spécifique d' évaluation de la performance mais n' apparaîtrait pas à un niveau général . Comme attendu , les sujets n' ont pas présenté de différence de performance à un niveau général d' évaluation de la réussite à la tâche . Néanmoins , les résultats indiquent une effective différenciation des performances , en fonction de la démonstration observée , sur les critères de qualité spécifiques : changements de direction et similarité des actions utilisées au cours de la trajectoire produite . Néanmoins , nous avons relevé dans la littérature des résultats contradictoires de l' influence de chacun des modèles . Nous pensons que ces différences pourraient être expliquées en terme de difficulté à dissocier le niveau de compétence des caractéristiques personnelles ( statut , sexe ) . C' est pourquoi , nous avons défini deux niveaux de démonstration tout en maintenant caractéristiques personnelles du modèle constantes ( le même individu exécutait soit l' une ou l' autre des démonstrations ) . Les trajectoires que nous avons élaborées semblent répondre aux critères de fréquence d' erreurs dans la mesure où la démonstration illustrative satisfait plus fréquemment la règle de déplacement que la démonstration peu illustrative . Ainsi , la démonstration peu illustrative correspond à un comportement impliquant de nombreuses erreurs . Si pour certains , l' observation d' un modèle novice est plus efficace , c' est que l' observateur détecte en cours d' observation des erreurs qu' il corrige de lui-même . Nous ne tentons pas ici de départager un débat longuement éprouvé dans la littérature , mais d' apporter un autre point de vue . D' après les résultats obtenus avec OLEANNet , l' influence de la démonstration , par extension de la compétence , se manifesterait à un niveau spécifique d' évaluation de la performance mais n' apparaîtrait pas à un niveau général . Comme attendu , les sujets n' ont pas présenté de différence de performance à un niveau général d' évaluation de la réussite à la tâche . Néanmoins , les résultats indiquent une effective différenciation des performances , en fonction de la démonstration observée , sur les critères de qualité spécifiques : changements de direction et similarité des actions utilisées au cours de la trajectoire produite . D' après le fonctionnement d' OLEANNet , ces différences traduisent une intégration spécifique des informations de changements de direction au cours de l' élaboration de la représentation . Lorsque la démonstration présente peu de changements de direction , la représentation construite intègre des informations générales sur la réalisation de la tâche . Comme peu d' exemples de ce type de comportement n' ont été observé , ils sont peu utilisés en phase de production . A contrario , la représentation d' une trajectoire intégrant de nombreux changements de direction nécessite de prendre en considération ce type de comportement . Cependant , en l' absence de possibilité pour le sujet d' agencer de façon efficace ce type d' action dans la séquence , il les utilise , certes de façon plus fréquente mais pas à bon escient . Dès lors que la fréquence des exemplaires augmente , la représentation en considère davantage . Cependant , la temporalité des actions de la séquence mémorisée ne correspond pas à celle observée . Pour conclure , nous pensons qu' OLEANNet est un modèle prédictif dans la mesure où les données des sujets suivent des Pour conclure , nous pensons qu' OLEANNet est un modèle prédictif dans la mesure où les données des sujets suivent des patterns équivalents à ceux émergeants de notre modèle . Cependant , nous tenons à aborder le problème lié à la non congruence des résultats obtenus dans la première étude . Nous pensons , en effet , que cela peut être envisagé comme un apport supplémentaire de la modélisation connexioniste car ces résultats nous ont conduit à reconsidérer de façon plus spécifique certains aspects de l' opérationnalisation , et ce , en fonction des axes de réflexion induits par le fonctionnement d' OLEANNet . Cela contribue à lever certaines ambiguïtés d' opérationnalisation et ainsi améliorer l' équivalence entre les conditions expérimentales proposées aux sujets ( études 2 et 3 ) . Nous pensons que ceci est un autre point fort de la modélisation connexioniste car elle permet la réflexion et le dynamisme de la recherche à partir d' une base concrète de données obtenues par la simulation . s équivalents à ceux émergeants de notre modèle . Cependant , nous tenons à aborder le problème lié à la non congruence des résultats obtenus dans la première étude . Nous pensons , en effet , que cela peut être envisagé comme un apport supplémentaire de la modélisation connexioniste car ces résultats nous ont conduit à reconsidérer de façon plus spécifique certains aspects de l' opérationnalisation , et ce , en fonction des axes de réflexion induits par le fonctionnement d' OLEANNet . Cela contribue à lever certaines ambiguïtés d' opérationnalisation et ainsi améliorer l' équivalence entre les conditions expérimentales proposées aux sujets ( études 2 et 3 ) . Nous pensons que ceci est un autre point fort de la modélisation connexioniste car elle permet la réflexion et le dynamisme de la recherche à partir d' une base concrète de données obtenues par la simulation . Conclusion Le modèle connexioniste écologique que nous avons exposé semble permettre de considérer , sur la base d' un réseau de neurones écologique , l' intégration dynamique de l' information proposée par l' environnement . L' intérêt du formalisme écologique est double : d' une part , il intègre les propriétés du formalisme classique puisqu' il utilise le réseau de neurone comme fondement ; d' autre part , il permet de considérer ce réseau comme acteur de ses perceptions , de ses apprentissages et producteur de ses comportements . Cela rend plus plausible la simulation des phénomènes sociaux qui nécessitent par essence l' interaction entre l' individu et son environnement physique et social . Concernant l' implémentation actuelle d' OLEANNet certaines limites apparaissent . Par exemple , nous pouvons nous interrogé sur l' accessibilité du comportement observé . Il serait intéressant , dans le développement futur de notre modèle , d' intégrer un module de perception des actions . En effet , le fonctionnement actuel d' OLEANNet propose , en phase d' acquisition , de contraindre l' apprentissage par les actions émises par le démonstrateur . Ainsi , pour une configuration spatiale donnée , l' agent démonstrateur émet une action servant de cible à la rétropropagation sur les sorties cognitives . Néanmoins , cette action n' est pas effectivement perçue en entrée par l' agent observateur . Cette limite du système perceptif ne remet pas en cause l' architecture générale du modèle et pourrait être un point d' ancrage en vue d' améliorer OLEANNet . Trois développements de ce modèle pourraient en effet être envisagés . Le premier consisterait à ajouter un module traitant spécifiquement le comportement du démonstrateur et fournissant , en phase d' acquisition , la cible des sorties cognitives d' OLEANNet . Ce module de perception pourrait coder en entrée les actions émises par l' agent démonstrateur et associer cette même action en sortie cognitive . Le deuxième développement possible serait d' implémenter un modèle interne de l' environnement ( Jordan & Rumelhart , 1992 ) . A partir de la construction d' un modèle interne , le système devient capable de prédire la résultante sensorielle d' une action et ainsi de déterminer l' action la plus efficace pour chaque état . Ceci nous permettrait d' éviter une phase d' acquisition supervisée par l' action du démonstrateur puisque celle -ci serait approximée par le système moteur en fonction du lien entre l' état actuel et l' état suivant . Enfin , un troisième développement pourrait porter sur l' implémentation d' un module supplémentaire consistant à intégrer les réponses de l' environnement . Lorsque l' individu est en situation de reproduction d' un comportement observé , il utilise la représentation mémorisée comme standard d' ajustement de son comportement , mais il utilise également les réponses fournies par l' environnement ( Adams , 1987 ) . En effet , le standard d' ajustement mémorisé peut être déficient quant à sa qualité par rapport à la réalisation idéale de la tâche , cela peut par exemple survenir lorsque le démonstrateur n' est pas un expert . L' individu s' auto-corrige alors en fonction des informations fournies par l' environnement afin d' adapter son comportement de façon efficace . Un module complémentaire permettrait de proposer au niveau des sorties motrices un choix de réponses correctes entre feedback interne et feedback externe . Ce module impliquerait un choix décisionnel entre deux types de réponses possibles en fonction de la plus adaptée pour la situation . Les différentes améliorations envisagées ici pourrait permettre non seulement de tester OLEANNet dans des situations d' apprentissage par observation plus complexes mais aussi de prendre en compte plus efficacement la relation de l' agent avec son environnement . Par ailleurs , nous pensons qu' il conviendra par la suite de simuler des situations pour lesquelles plusieurs modèles sont impliqués . L' intérêt du formalisme écologique consistera alors à proposer une nouvelle façon de concevoir l' intégration des informations émises par chacun dans la construction des connaissances . BIBLIOGRAPHIE Abdi , H. ( 1994 ) . Abdi , H. ( 1994 ) . Les réseaux de neurones . Sciences et technologies de la connaissance . . Sciences et technologies de la connaissance . Grenoble , PUG . Abravanel , E . , & Fergusson , S. ( 1998 ) . Observational learning and the use of retrieval information during the second and third years . Journal of Genetic Psychology , 159 ( 4 ) , 455 - 476 . Adams , J. ( 1987 ) . Historical review and appraisal of research on the learning retention , and transfert of human motor skills . Psychological Bulletin , 101 ( 1 ) , 41 - 74 . Adams , J. ( 1971 ) . A closed-loop theory of motor learning . Journal of Motor Behavior , 3 , 111 - 150 . Akamatsu , T. , & Thelen , M. ( 1974 ) . A review of the literature on observer characteristics and imitation . Develomental Psychology , 10 , 38 - 47 . Al-Abood , S. , Keith , D . , & Bennet , S. ( 2001 ) . Specificity of task constraints and effects of visual demonstration and verbal instructions in directing learners'search during skill acquisition . Journal of Motor Behavior , 33 ( 3 ) , 295 - 306 . 33 ( 3 ) , 295 - 306 . Amy , B . ( 1996 ) . La place des réseaux neuronaux dans l' IA . In Rialle , V. , & Fisette , D . ( Eds ) , Amy , B . ( 1996 ) . La place des réseaux neuronaux dans l' IA . In Rialle , V. , & Fisette , D . ( Eds ) , Penser l' esprit : des sciences de la cognition à une philosophie cognitive ( 43 - 69 ) . ( 43 - 69 ) . Grenoble , PUG . Anderson , J. , & Hinton , G. ( 1981 ) . Models of information processing in the brain . In Anderson , J. , & Hinton , G. ( Eds ) , Parallel Models of Associative Memory ( 9 - 48 ) . Lawrence Erlbaum Associates , Hillsdale , NJ . Ans , B & Rousset , S. ( 1997 ) . Avoiding catastrophic forgetting by coupling two reverberating neural networks . Académie des Sciences de la Vie , 320 , 989 - 997 . , 320 , 989 - 997 . Bandura , A , & Jeffery , R. ( 1973 ) . Bandura , A , & Jeffery , R . ( 1973 ) . Role of symbolic coding and rehearsal processes in observational learning . Journal of Personnality and Social Psychology . 26 , 1 , 122 - 130 . Bandura , A . ( 1977 ) . Social learning theory . Oxford : Practice Hall . England . Bandura , A . ( 1986 ) . L' apprentissage social . Eds Pierre Mardaga . . Eds Pierre Mardaga . Bruxelles . Bandura , A . , ( 1989 ) . Regulation of cognitive processes through perceived self-efficacy , Developmental psychology , 25 ( 5 ) , 729 - 735 Bandura , A . , Ross , D . , & Ross , S. ( 1961 ) . Transmission of agression through imitation of agressive models . Journal of Abnormal and Social Psychology , 63 , 575 - 582 Bekkering , H. , Wolschlager , A . , & Gattis , M. ( 2000 ) . Imitation of gestures in children is goal directed . The Quaterly Journal Of Experimental Psychology , 53 ( 1 ) , 153 - 164 . Berger , S. , Carli , K. , Hammersla , K. , Karshmer , J. , & Sanchez , E . ( 1979 ) . Motoric and symbolic mediation in observational learning . Journal of Personality and Social Psychology , 37 , 735 - 746 . Blandin , Y. ( 2002 ) . L' apprentissage par observation d' habiletés motrices : un processus d' apprentissage spécifique ? Blandin , Y. ( 2002 ) . L' apprentissage par observation d' habiletés motrices : un processus d' apprentissage spécifique ? Année Psychologique , 102 , 523 - 554 Blandin , Y. , & Proteau , L. ( 2000 ) . On the cognitive basis of observational learning : development of mechanisms for the detection and correction of errors . The Quaterly Journal Of Experimental Psychology , 53 ( 3 ) , 846 - 867 . 53 ( 3 ) , 846 - 867 . Blandin , Y. Proteau , L. , & Alain , C . ( 1993 ) . Apprentissage par observation d' une tâche d' anticipation-coïncidence . Blandin , Y. Proteau , L. , & Alain , C . ( 1993 ) . Apprentissage par observation d' une tâche d' anticipation-coïncidence . Science et Motricité , 20 , 35 - 42 . Blandin , Y. , Lhuisset , L. , & Proteau , L. ( 1999 ) . Cognitive processes underlying observational learning of motor skills . The Quaterly Journal Of Experimental Psychology , 52 ( 4 ) , 957 - 979 . Bollon , T. , Pansu , P. , Paignon , A . , & Mermillod , M. ( 2003 ) . Modélisation connexioniste de l' apprentissage de la norme d' inetrnalité : les réseaux de neurones formels comme outil de simulation et de prédiction . Colloque bi-disciplianire international , sociologie et psychologie sociale " Normes Sociales et processus cognitif " . Organisé par SAvoirs , COgnition et rapports sociaux ( SACO ) , Université de Poitiers , 18 - 20 juin 2003 , Poitiers Bourret , P. , Reggia , J. , & Samuelides , M. ( 1991 ) . Bourret , P. , Reggia , J. , & Samuelides , M. ( 1991 ) . Réseaux neuronaux : une approche connexioniste de l' intelligence artificielle . . Eds Teknea . Toulouse Braaksma , M. , Rijlaarsdam , G. , & van den Bergh , H. ( 2002 ) . Observational Learning and the Effects of Model-Observer Similarity . Journal of Educational Psychology , 94 , 405 - 415 . Brass , M. , Bekkering , H. , & Prinz , W. ( 2001 ) . Movement observation affects movement execution in a simple response task . Acta Psychologica , 106 , 3 - 22 . Brewer , K. , & Wann , D . ( 1998 ) . Observational learning effectiveness as a function of model characteristics : investigating the importance of social power . Social Behavior and Personality : An International Journal , 26 , 1 - 11 . Byrne , R & Russon , A ( 1998 ) . Learning by imitation : a hierarchical approach . Behavioral and Brain Sciences , 21 , 667 - 721 . Capodi , M. , & Chatillon , J-F. ( 1995 ) . Representation and performance : reproduction of form and quality of movement in dance by eight- and 11 - years old novices . British Journal of Psychology , 96 ( 2 ) , 217 - 226 Capodi , M. , & Winnykamen , F . ( 2002 ) . Peer tutoring in a physical education setting : influence of tutor skill level on novice learners'motivation and performance Journal of Teaching in Physical Education , 22 , 105 - 123 . Carpenter , G. , & Grossberg , S. ( 1988 ) . The ART of adaptative pattern recognition by a self-organizing neural network . Computer , 21 , 77 - 88 . Carroll , W. , & Bandura , A . ( 1990 ) . Representational guidance of action production in observational learning : a causal analysis . Journal of Motor Behavior , 22 , 85 - 97 . Carroll , W. , & Bandura , A . ( 1987 ) . Translating cognition into action : the role of visual guidance in observational learning . Journal of Motor Behavior , 19 , 3 , 385 - 398 . Carroll , W. , & Bandura , A . ( 1985 ) . Role of timing of visual monitoring and motor rehearsal in obserational learning of action patterns . Journal of Motor Behavior , 17 , 269 - 281 . Carroll , W. , & Bandura , A . ( 1982 ) . The role of visual monitoring in observational learning of actions patterns : making the unobservable observable . Journal of Motor Behavior , 14 , 153 - 167 . Cecconi , F . , & Parisi , D . ( 1998 ) . Individual versus social survival strategies . Journal of Artificial Societies and Social Simulation , 1 . http Corriss , D . , & Kose , G. ( 1998 ) . Action and imagination in the formation of images . Perceptual and Motor Skills , 87 , 3 , 979 - 983 . D' Arripe-Longueville , F . , Gernigon , C . , Huet , ML. , Cadopi , M. , & Winnykamen , F . ( 2002 ) . Peer Tutoring in a Physical Education Setting : Influence of Tutor Skill Level on Novice Learners'Motivation and Performance . Journal of Teaching in Physical Education , 22 , 105 - 124 . Deakin , J. , & Proteau , L. ( 2000 ) . The role of scheduling in learning through observation . Journal of Motor Behavior , 32 ( 3 ) , 268 - 276 . Decker , P. ( 1982 ) . The enhancement of behavior modeling training of supervisory skills by the inclusion of retention processes . Personnal Psychology , 35 , 323 - 332 . 35 , 323 - 332 . Decety , J. , & Nadel , J. ( 2003 ) . Decety , J. , & Nadel , J. ( 2003 ) . Imiter pour découvrir l' Humain . Psychologie , Neurobiologie , Robotique Philosophie de l' Esprit . Editions Psychologie et sciences de la pensée . Paris , PUF . Psychologie , Neurobiologie , Robotique Philosophie de l' Esprit . Editions Psychologie et sciences de la pensée . Paris , PUF . Decety , J. , Chaminade , T. , Grèzes J. , and Meltzoff , A . ( 2002 ) . Decety , J. , Chaminade , T. , Grèzes J. , and Meltzoff , A . ( 2002 ) . A PET exploration of the neural mechanisms involved in reciprocal imitation . NeuroImage , 15 , 265 - 272 . Decety , J. Grezes , J. , Costes , N. , Perani , D . , Jeannerod , M. , Procyk , E . , Grassi , F . , & Fazio , F . ( 1997 ) . Brain activity during observation of actions : Influence of action content and subject's strategy . Brain , 120 , 1763 - 1777 . Egmont-Petersen , M. , Talmon , J. , Hasman , A . , & Ambergen , A . ( 1998 ) . Assessing the importance of features for multi-layer perceptrons . Neural Networks , 11 , 623 - 635 . Erbaugh , S. ( 1985 ) . Role of visual feedback in observational motor learning of primary-grade children . Perceptual and Motor Skills , 60 , 755 - 762 . Feltz , D . ( 1982 ) . The effects of age and number of demonstrations on modeling of form and performance . Research Quarterly for Exercise and Sport , 53 , 291 - 296 . Ferrari , M. ( 1996 ) . Observing the observer : self-regulation in the observational learning of motor skills . Developmental Review , 16 , 203 - 240 . Fisher , J. , & Harris , M. ( 1976 ) . The effect of three model characteristics on imitation learning . Journal of Social Psychology , 98 183 - 199 . Fogassi L. , Gallese V. , Buccino G. , Craighero L. , Fadiga L. , & Rizzolatti G. ( 2001 ) . Cortical mechanisms for the visual guidance of hand grasping movements in the monkey : a reversible inactivation study . Brain , 124 , 571 - 586 . Freeman , J. , & Skapura , D . ( 1992 ) . Neural networks : algorithms , applications , and programming techniques . Computation and Neural systems series . Addison-Wesley Publishing Company . French , R. M . , Ans , B . , & Rousset , S. ( 2001 ) . Pseudopatterns and dual-network memory models : Advantages and shortcomings . In French , R. , & Sougné , J. ( Eds ) , Connectionist Models of Learning , Development and Evolution . ( . ) . London : Springer , 13 - 22 . French , R. ( 1997 ) . Catastrophic forgetting forgetting in connectionist networks . Trends in Cognitive Sciences , 9 , 353 - 379 . Gallese V. , Fadiga L. , Fogassi L. , & Rizzolatti G. ( 1996 ) . Action recognition in the premotor cortex . Brain 119 : 593 - 609 . Gallese V. , Fadiga L. , Fogassi L. , & Rizzolatti G. ( 2002 ) . Action representation and the inferior parietal lobule . In Prinz , W. , and Hommel , B . ( Eds . ) , Common Mechanisms in Perception and Action : Attention and Performance , Vol . XIX . Oxford : Oxford University Press , 247 - 26 . Gerst , M. ( 1971 ) . Symbolic coding processes in observational learning . Journal of Personality & Social Psychology , 19 , 7 - 17 . Gleissner , B . , & Meltzoff , A . ( 2000 ) . Children's coding of human action : cognitive factors influencing imitation in 3- year-olds . Developmental Science , 3 , 405 - 415 . Golderg , D . ( 1994 ) . Algorithmes génétiques , Addisson-Wesley . Goldstone , R. L . ( 1998 ) . Perceptual learning . Annual Review of Psychology , 49 585 - 612 . Goschke , T. , & Koppelberg , D . ( 1991 ) . The concept of representation and the representation of concept in connectionist models . In W. Ramsey , S . Stich and D. Rumelhart ( Eds . ) , Philosophy and connectionist theory ( pp . 129 - 162 ) . Hillsdale , NJ : Erlbaum . Grainger , J. , & Jacob , A . ( 1998 ) . Localist connectionism fits the bill . Psycholoquy , 9 , 10 , Connectionist explanation , 7 , ISSN 1055 - 01473 : WEB http Greenfeld , N. , & Kuznicki , J. ( 1975 ) . Implied competence , task complexity and imitative behavior . Journal of Social Psychology , 95 251 - 261 Grezes , J. , & Decety , J. ( 2001 ) . Functionnal anatomy of execution , mental simulation , observation , and verb generation action : a meta analysis . Human Brain Mapping , 12 , 1 - 19 . Grussec , J. ( 1992 ) . Social learning theory and developmental psychology : the legacies of Robert Sears and Albert Bandura . Developmental Psychology , 28 , 5 , 776 - 786 . Guadagnoli , M. , & Khol , R. ( 2001 ) . Knowledge of results for motor learning : relationship between error estimation and knowledge of results frequency . Journal of Motor Behavior , 33 ( 2 ) , 217 - 224 Hatfield , G. ( 1991 ) . Representation in perception and cognition : connectionnist affordances . In Ramsey , W. , Stich , S. and Rumelhart , D . ( Eds . ) , Philosophy and connectionist theory ( 163 - 195 ) . Hillsdale , NJ : Erlbaum . Heyes , C . , & Galef , B . ( 1996 ) . Social Learning in Animals : The Roots of Culture . New York : Academic Press . Heyes , C . , & Foster , C . ( 2002 ) . Motor learning by observation : Evidence from a serial reaction time task . Quarterly Journal of Experimental Psychology : Human Experimental Psychology , 55 , 593 - 607 . Hinton , G. , McClelland , J. , & Rumelhart , D . ( 1986 ) . Distributed representations . In Rumelhart , D . , McClelleand , J. , & The PDP Research Group ( Eds . ) , Parallel distributed processing ( Vol . 1 , 77 - 109 ) . Cambridge , MA : MIT Press . Honavar , V . ( 1994 ) . Symbolic artificial intelligence and numeric artificial neural networks : toward a resolution of the dichotomy . In Sun , R. and Bookman , L. ( Eds ) , In Computational Architectures Integrating Symbolic and Neural Processes ( 351 - 388 ) . New York : Kluwer . Horner , S. ( 2001 ) . The effects of observational learning on preschoolers'book related behaviors and alphabet . Child Study Journal , 31 ( 1 ) , 1 - 11 . Iacoboni , M. , & Woods , R. ( 1999 ) . Cortical mechanisms of human imitation . Science , 286 ( 549 ) , 2526 - 2528 . Ingvaldsen , R. , & Whiting , H. ( 1997 ) . Moderns views on motor skill learning are not " representative " ! Human Movement Science , 16 , 705 - 732 . 16 , 705 - 732 . Jodouin , J-F. ( 1994a ) . Jodouin , J-F. ( 1994a ) . Les réseaux de neurones : principes et définition . Ed . Hermès .. Ed . Hermès . Jodouin , J-F. ( 1994b ) . Jodouin , J-F. ( 1994b ) . Les réseaux neuromimétiques : modèles et méthodes . . Ed . Hermès . Kashima , Y. , & Lewis , V. ( 1998 ) . Where does the behavior come from in attitude-behavior relations ? In Read , S. , & Miller , L. ( Eds . ) , Connectionist models of social reasoning and social behavior . Hillsdale , NJ : Erlbaum . Kashima , Y. Woolcock , J. , & Kashima , E . ( 2000 ) . Group impressions as dynamic configurations : the tensor product model of group impression formation and change . Psychological Review , 107 ( 4 ) , 914 - 942 Kashima , Y. , & Kerekes , A . ( 1994 ) . A distributed memory of averaging phenomena in person impression formation . Journal of Personality and Social Psychology , 63 , 534 - 544 . Kashima , Y. , Woolcock , J. , & King , D . ( 1998 ) . The dynamics of group impression formation : the tensor product model of exemplar-based social category learning . In Read , S. , & Miller , L. ( Eds . ) , Connectionist models of social reasoning and social behavior . Hillsdale , NJ : Erlbaum . Kelley , H. ( 1971 ) . Causal schemata and the attribution process . In Jones , E . , . Kanouse , D . , Kelley , H. , Nisbett , N. , Valins , S. , & Weiner , B . ( Eds . ) , Attribution : Perceiving the causes of behavior ( 151 - 174 ) . Morristown , NJ : General Learning Press . Kelly , S. , & Burton , M. ( 2001 ) . Learning complex sequences : no role for observation ? Psychological Research , 65 , 15 - 23 . Khan , K. , & Cangemi , J. ( 1979 ) . Social learning theory : the role of imitation and modeling in learning socially desirable behavior . Education , 100 ( 1 ) , 41 - 46 . Kohl , R. , & Shea , C . ( 1992 ) . Observational learning : influences on temporal response organization . Human Performance , 5 ( 3 ) , 235 - 244 . Kohonen , T. ( 2001 ) . Self-organizing maps . Springer Series in Information Sciences , Vol . 30 , Springer , Berlin , Heidelberg , New York , 1995 , 1997 , 2001 . Third Extended Edition . Kunda , Z. , & Thagard , P. ( 1996 ) . Forming impressions from stereotypes , traits , and behaviors : a parallel-constraint-satisfaction theory . Psychological Review , 103 ( 2 ) , 284 - 308 . Kuznicki , J. , & Greenfeld , N. ( 1977 ) . Vicarious and direct reinforcement : and experimental evaluation . Journal of Social Psychology , 101 , 103 - 111 . Labiouse , C . , & French , R. M . ( 2001 ) . A Connectionist Model of Person Perception and Stereotype Formation . In French , R. , & Sougné , J. ( Eds ) , Connectionist Models of Learning , Development and Evolution ( 209 - 218 ) . London : Springer . Lee , T. , & White , M. ( 1990 ) . Influence of an unskilled model's practice schedule on observational motor learning . Human Movement Science , 9 , Special Issue : The learning , memory and perception of perceptual-motor skills , 349 - 367 . Lippman , L. , & Rees , R. ( 1997 ) . Consequences of error production in a perceptual-motor task . Journal of General Psychology , 124 ( 2 ) , 133 - 142 McClelland , J. , McNaughton , B . , & O'Reilly , R. ( 1995 ) . Why are complementary learning systems in the hippocampus and neocortex : insights from the successes and failures of connectionist models of learning and memory . Psychological Review , 102 ( 3 ) , 419 - 457 . McClelland , J. , Rumelhart , D . , & Hinton , G. ( 1986 ) . The appeal of parallel distributed processing . In Rumelhart , D . , McClelleand , J. , & The PDP Research Group ( Eds . ) , Parallel distributed processing ( Vol . 1 , 3 - 44 ) . Cambridge , MA : MIT Press . McClelland , J. , & Rumelhart , D . ( 1981 ) . An interactive activation of context effects in letter perception : Part 1 . An account of basic findings . Psychological Review , 88 , 375 - 107 . McCullagh , P. , & Little , W. ( 1990 ) . Demonstrations and knowledge of results in motor skill acquisition . Perceptual and Motor Skills , 71 , 735 - 742 . McCullagh , P. , & Caird , J. ( 1990 ) . Correct and learning models an the use of model knowledge of results in the acquisition and retention of motor skill . Journal of Human Movement Studies , 18 , 107 - 116 McCullagh , P. ( 1986 ) . Model status as a determinant of observational learning and performance . Journal of Sport Psychology , 8 , 319 - 331 . Meltzoff , A . & Moore , M. ( 1989 ) . Imitation in Newborn Infants : Exploring the Range of Gestures Imitated and the Underlying Mechanisms . Developmental Psychology , 25 , 954 - 962 . Meltzoff , A . ( 1988 ) . Infant imitation after a 1- week delay : long-term memory for a novel acts and multiple stimuli . Developmental Psychology , 24 ( 4 ) , 470 - 476 . Miller , N. , Dollard , J. ( 1941 ) . Social learning and imitation . London : Oxford University Press . Minsky , M. , & Papert , R. ( 1988 ) . Perceptrons . MIT press , Cambridge , MA ( extended 1979 ) . Newell , A . ( 1980 ) . Physical symbol systems . Cognitive Science , 4 , 135 - 183 . Newell , K. ( 1991 ) . Motor skill acquisition . Annual Review of Psychology , 42 , 213 - 237 . Nolfi , S. , & Parisi , D . ( 1994 ) . Good teaching inputs do not correspond to desired responses in ecological neural networks . Neural Processing Letters , 1 , 1 - 4 . Nolfi , S. , Elman , J. , & Parisi , D . ( 1994 ) . Learning and evolution in neural networks . Adaptative Behavior , 3 , 5 - 28 . Ohnogi , H. ( 1986 ) . Four-year-old children's visual attention in direct and observational learning . Perceptual and Motor Skills , 62 , 783 - 788 . Paignon , A , Desrichard , O. & Bollon , T. ( sous presse ) . " Modélisation connexioniste de l' apprentissage social : Le cas de l' apprentissage par observation d' une tâche simple " . Canadian Journal Os Experimental Psychology . Parisi , D . ( 1997 ) . Artificial life and higher level cognition . Brain and cognition , 34 , 160 - 184 . Parisi , D . , Cecconi , F . , & Nolfi , S. ( 1990 ) . Econets : neural networks that learn in an environment . Network , 1 , 149 - 168 . Perry , D . , & Perry , L. ( 1975 ) . Observational learning in children : Effects of sex of model and subject's sex-role behavior . Journal of Personality and Social Psychology , 31 , 1083 - 1088 . Pollock , B . , & Lee , T. ( 1992 ) . Effects of the model's skill level on observational motor learning . Research Quaterly for Exercice and Sport , 63 , 25 - 29 . Prinz , W. ( 1997 ) . Perception and action planning . European Journal of Cognitive Psychology , 9 ( 2 ) , 129 - 154 . Queller , S. , & Smith , E . ( 2002 ) . Subtyping versus bookkeeping in stereotype learning and change : connectionist simulations and empirical findings . Journal of Personality and Social Psychology , 82 ( 3 ) , 300 - 313 Read , S. , & Miller , L. ( 1998 ) . On the dynamic construction of meaning : an interactive activation and competition model of social perception . In Read , S. , & Miller , L. ( Eds . ) , Connectionist models of social reasoning and social behavior ( 27 - 70 ) . Hillsdale , NJ : Erlbaum . Read , S. , & Marcus-Newhall , A . ( 1993 ) . Explanatory coherence in social explanations : a parallel distributed processing account Journal of Personality and Social Psychology , 65 ( 3 ) , 429 - 447 . Read , S. , & Montoya , J. ( 1999 ) . An autoassociative model of causal reasoning and causal learning : reply to van Overwalle's ( 1998 ) critique of Read and Marcus-Newhall ( 1993 ) . Journal of Personality and Social Psychology , 76 ( 5 ) , 728 - 742 . 76 ( 5 ) , 728 - 742 . Renders , J-M. ( 1994 ) . Algorithmes génétiques et réseaux de neurones : applications à la commande de processus . Renders , J-M. ( 1994 ) . Algorithmes génétiques et réseaux de neurones : applications à la commande de processus . Ed . Hermès . Riolo , L. ( 1997 ) . Effects of modeling errors on the acquisition and retention of sterile hand washing task . Perceptual and Motor Skills , 84 , 19 - 26 . Rizzolatti G. , Fogassi L. , & Gallese V . ( 2001 ) . Neurophysiological mechanisms underlying the understanding and imitation of action . Nature Reviews Neuroscience , 2 , 661 - 670 , 2 , 661 - 670 . Rizzolatti G. , Fagida , L. , Gallese , V. , & Fogassi , L. ( 1996 ) . Rizzolatti G. , Fagida , L. , Gallese , V. , & Fogassi , L. ( 1996 ) . Premotor cortex and the recognition of motor action . Cognitive Brain Research , 3 , 131 - 141 . , 3 , 131 - 141 . Robert , M. ( 1970 ) . Apprentissage vicariant chez l' animal et chez l' humain . Robert , M. ( 1970 ) . Apprentissage vicariant chez l' animal et chez l' humain . Année Psychologique , 70 , 505 - 542 . Romero , K. , & Silvestri , L. ( 1990 ) . The role of mental practice in the acquisition and performance of motor skills . Journal of Instructional Psychology , 17 , 218 - 221 . Rotter , J. B . ( 1954 ) . Social learning and clinical psychology . New York : Prentice-Hall Rumelhart , D . & McClelland , J. ( 1986 ) . PDP models and general issues in cognitive science . In Rumelhart , D . , McClelleand , J. , & The PDP Research Group ( Eds . ) , Parallel distributed processing ( Vol . 1 , 110 - 145 ) . Cambridge , MA : MIT Press . Rumelhart , D . , Hinton , G. , & McClelland , J. ( 1986 ) . A general framework for parallel distributed processing . In Rumelhart , D . , McClelleand , J. , & The PDP Research Group ( Eds . ) , Parallel distributed processing ( Vol . 1 , 45 - 76 ) . Cambridge , MA : MIT Press . Schmidt , R. ( 1975 ) . A schema theory of discrete motor skill learning . Psychological Review , 82 , 225 - 260 . Shea , C . Wright , D . , Wulf , G. , & Whitacre C. ( 2000 ) . Physical and observational practice afford unique learning opportunities . Journal of Motor Behavior , 32 ( 1 ) , 27 - 37 . Shea , C . , Lai , Q. , Wright , D . , Imminck , M. , & Black , C . ( 2001 ) . Consistent and variable practice conditions : effects on relative timing and absolute timing . Journal of Motor Behavior , 33 ( 2 ) , 139 - 152 Shea , C . , Wulf , G. , Park , J. , & Gaunt , B . ( 2001 ) . Effects of an auditory model on the learning of relative and absolute timing . Journal of Motor Behavior , 33 ( 2 ) , 127 - 138 . Shettleworth , S. ( 1998 ) . Cognition , evolution and behavior . Oxford University Press . Shultz , T. , & Lepper , M. ( 1996 ) . Cognitive dissonance reduction as constraint satisfaction . Psychological Review , 103 ( 2 ) , 219 - 240 Smith , E & DeCoster , J. ( 2000 ) . Dual-process models in social and cognitive psychology : conceptual integration and links to undelying memory systems . Personality and Social Psychology Review , 4 ( 2 ) , 108 - 131 . Smith , E . ( 1996 ) . What do connectionism and social psychology offer each other ? Journal of Personality and Social Psychology , 70 , 893 - 912 . Smith , E . , & DeCoster , J. ( 1998a ) . Person perception and stereotyping simulation using distributed representations in a recurrent connectionist network . In Read , S. , & Miller , L. ( Eds . ) , Connectionist models of social reasoning and social behavior ( 111 - 142 ) . Hillsdale , NJ : Erlbaum . Smith , E . , & DeCoster , J. ( 1998b ) . Knowledge acquisition , accessibility , and use in person perception and stereotyping : simulation with a reccurent connectionit network Journal of Personality and Social Psychology , 74 ( 1 ) , 21 - 35 Soucy , M-C & Proteau , L. ( 2001 ) . Soucy , M-C & Proteau , L. ( 2001 ) . Development of multiple movement representations with practice : specifity versus flexibility . Journal of Motor Behavior , 33 ( 3 ) , 243 - 254 Stroeve , S. ( 1998 ) . An analysis of learning control by backpropagation through time . Neural Networks , 11 , 709 - 721 . Sturmer , B . Aschersleben , G. , & Prinz , W. ( 2000 ) . Correspondence effects with manual gestures and postures : a study of imitation . Journal of Experimental Psychology : Human Perception and Performance , 26 ( 6 ) , 1746 - 1759 . Thomas , J. , Due , E . , & Wigger , D . ( 1987 ) . Effetcs of the competence and sex peer models on children's imitative behavior . Journal of Genetic Psychology , 148 ( 3 ) , 325 - 332 . 148 ( 3 ) , 325 - 332 . Touzet , C . ( 1992 ) . Touzet , C . ( 1992 ) . Réseaux de neurones artificiels : introduction au connexionisme . Nanterre , 1992 Nanterre , 1992 . scico / annuaire / Touzet Claude / publications . html . Van Gelder , T. ( 1998 ) The roles of philosophy in cognitive science . Philosophical Psychology , 11 , 117 - 136 . Van Gelder , T. ( 1998 ) Cognitive architecture : What choice do we have ? In Z. Pylyshyn ( Eds . ) , Constraining Cognitive Theories : Issues and Options ( 191 - 204 ) . Stamford CT : Ablex . Van Gelder , T. ( 1991 ) . What is the " D " in PDP ? A survey of the concept of distribution . In Ramsey , W. , Stich , S. , & Rumelhart , D . ( Eds . ) , Philosophy and connectionist theory ( 33 - 60 ) . Hillsdale , NJ : Erlbaum . Van Gelder , T. ( 1990 ) . Why Distributed Representation is Inherently Non-Symbolic . In Dorffner , G. ( Eds . ) , Konnektionismus in Artificial Intelligence und Kognitionsforschung . Berlin : Springer-Verlag , 1990 ; 58 - 66 . http Van Overwalle , F . ( 1998 ) . Causal explanation as constraint satisfaction : a critique and a feedforward connectionist alternative Journal of personality and social psychology , 74 ( 2 ) , 312 - 328 . Van Overwalle , F . , & van Rooy , D . ( 1998 ) . A connectionnist approach to causal attribution . In Read , S. , & Miller , L. ( Eds . ) , Connectionist models of social reasoning and social behavior ( 143 - 174 ) . Hillsdale , NJ : Erlbaum . Van Overwalle , F . , & van Rooy , D . ( 2001 ) . How one cause discounts or augments another : a connectionist account of causal competition . Personality and Social Psychology Bulletin , 27 ( 12 ) , 1613 - 1626 . Van Overwalle , F . , & Jordens , K . ( 2002 ) . An adaptative connectionist model of cognitive dissonance . Personality and Social Psychology Review , 6 ( 3 ) , 204 - 231 Van Overwalle , F . , & Labiouse , C . ( 2003 ) . A recurrent connectionist model of person impression formation . Personality and Social Psychology Review , in press . Van Rooy , D , Van Overwalle , F . , Vanhoomissen , T. , Labiouse , C & French , R. ( 2003 ) . A recurrent connectionist model of group biases . Psychological Review , 110 , 536 - 563 . Vogt , S. ( 1995 ) . On relations between perceiving , imagining and performing in the learning of cyclical movement sequences . British Journal of Psychology , 86 ( 2 ) , 191 - 217 . Weeks , D . , & Anderson , P. ( 2000 ) . The interaction of observational learning with overt practice : effect on motor skill learning . Acta Psychologica , 104 , 259 - 271 . Weeks , D . , & Hall , A . ( 1998 ) . A comparison of imitation strategies in observational learning of action patterns . Journal of Motor Behavior , 28 ( 4 ) , 348 - 358 . Weir , P. , & Leavitt , J. ( 1990 ) . Effects of model's skill level and model's knowledge of results on the performance of a dart throwing task . Human Movement Science , 9 , Special Issue : The learning , memory and perception of perceptual-motor skills , 369 - 383 . Weiss , H. , Suckow , K. , & Rakestraw , T. ( 1999 ) . Influence of modeling on self-set goals : direct and mediated effects . Human Performance , 12 ( 2 ) , 89 - 114 . Werner , G. , & Dyer , M. ( 1992 ) Evolution of Communication in Artificial Organisms ( 659 - 687 ) . In Langton , C . , Taylor , C . , Farmer , J. , & Rasmussen , S. ( Eds . ) , Artificial Life II . MA : Addison-Wesley . Williams , J. ( 1987 ) . Visual demonstration and movement production : effects of motoric mediation during observation of a model . Perceptual and Motor Skills , 65 ( 3 ) , 825 - 825 . Willingham , D . ( 1998 ) . A neuropsychological theory of motor learning . Psychological Review , 105 , 558 - 584 . Willingham , D . ( 1999 ) . The neural basis of motor skill learning . Psychological Science , 8 ( 6 ) , 178 - 182 . Yao , X. , ( 1993 ) . A Review of Evolutionary Artificial Neural Networks . International Journal of Intelligent System , 8 , 539 - 567 Zajonc , B . ( 1969 ) . Psychologie sociale expérimentale . Paris : Dunod . Table des illustrations [ 1 ] Nous utiliserons préférentiellement le terme « pattern » plus fréquemment utilisé dans la littérature en remplacement de celui « d' état d' activation particulier » . [ 2 ] Nous utiliserons le terme agent plutôt que celui d' organisme traduit de Parisi , Cecconi & Nolfi ( 1990 ) [ 3 ] Grussec ( 1992 ) propose une revue détaillée des apports de Sears à la théorie de l' apprentissage social . [ 4 ] Le terme " apprentissage vicariant " réfère en réalité à apprentissage par renforcement vicariant , ces termes sont employés de façon équivalente dans la littérature et nous ferons de même . [ 5 ] Nous ne développerons ici que l' apprentissage par observation chez l' être humain , sachant que cette forme d' apprentissage est largement étudiée chez les animaux qui ne présentent pas les mêmes mécanismes , voir pour illustration Heyes et Galef ( 1996 ) , Byrne et Russon ( 1998 ) , Shettleworth ( 1998 ) , Robert ( 1970 ) pour une revue comparative . [ 6 ] Cette première phase apparaît dans la littérature sous les expressions équivalentes de " phase d' acquisition " ou " phase d' observation " . Nous emploierons préférentiellement phase d' acquisition , mais utiliserons phase d' observation , lorsque cette expression facilitera la compréhension . [ 7 ] Pour ces auteurs , la représentation cognitive élaborée par l' individu est de nature symbolique . Nous emploierons donc représentation cognitive ou symbolique de façon équivalente . [ 8 ] Afin de ne pas alourdir le texte , ce terme sera toujours employé sous sa dénomination anglaise , nous n' en proposons pas de traduction française puisqu' il perdrait tout son sens . Il est défini comme processus générateur du comportement ( « conception » ) et il permet de comparer le comportement émis avec la représentation afin de les faire coïncider au plus ( « matching » ) . [ 9 ] OLEANNet : Observational Learning and Ecological Neural Network [ 10 ] Nous emploierons le terme d' agent plutôt que celui d' organisme en traduction de « organism » proposé par Parisi , Nolfi et Cecconi , 1994 . [ 11 ] L' intégralité des algorithmes programmés sous Matlab , relevant de cette modélisation est présentée annexe 3 p . 5 . [ 12 ] Nous distinguerons le comportement de ses composantes comportementales . Le comportement étant une séquence complète permettant l' atteinte d' un objectif . Il est composé de composantes comportementales [ 13 ] L' action de " quart de tour à gauche " induit un changement de l' orientation de l' agent . Cela se traduit en terme de changement d' angle par rapport à la cible ( l' angle perd 90 ° ) , mais n' induit pas de changement en terme de distance . Cela correspond à un pivotement de l' agent sur sa position . [ 14 ] L' action de " quart de tour à droite " est inverse à l' action de quart de tour à gauche , elle induit un gain de 90 ° sur l' angle mais aucun changement en terme de distance [ 15 ] Le détail de l' apprentissage de l' agent démonstrateur ayant déjà été exposé , nous ne le détaillerons pas ici , mais si besoin renvoyons au paragraphe 2.2.1 . p . 98 . [ 16 ] Rappelons que suite à l' apprentissage , la simulation permet de « voir ce qui a été appris » , cela en plaçant l' agent dans l' environnement et en le laissant se déplacer . [ 17 ] Une trajectoire correspond au déplacement spécifique de l' agent entre le point de départ et la cible . [ 18 ] Le détail de l' apprentissage de l' agent démonstrateur ayant déjà été exposé , nous ne le détaillerons pas ici , mais si besoin renvoyons au paragraphe 2.2.1 . p 99 . [ 19 ] Le fait de reconduire les mêmes agents dans une simulation équivalente permet de vérifier que la procédure d' apprentissage ne présente pas de biais , nous nous attendons à ce qu' ils présentent les même performances que précédemment . [ 20 ] Ceci réfère aux notions de minima locaux et globaux . Un réseau peut glisser en bas de la surface de l' erreur dans un ensemble de poids qui ne résout pas le problème sur quoi il est formé . Si cet ensemble de poids est un minima local , le réseau n' arrivera jamais à l' ensemble optimal de poids qui résolvent le problème . [ 21 ] Il s' agit d' un agent observateur ayant appris par observation selon une trajectoire illustrative de l' utilisation de la règle . En effet , cet agent n' atteint pas la cible , alors qu' il l' atteint pour les deux autres types d' apprentissage . Sa performance ne pouvant être prise en compte dans l' analyse , il est retiré de chacun des groupes d' apprentissage . [ 22 ] Comme dans les simulations du chapitre précédent , nous emploierons action gauche et action droite à l' instar de pivotement de quart de tour à droite ou à gauche . [ 23 ] Pour décrire la démonstration , nous utiliserons la trajectoire que les actions proposées en démonstration induisent . Le sujet voit la variation des valeurs de compteurs résultant du déplacement du pion dans l' espace en deux dimensions qu' il ne voit pas . [ 24 ] Afin de maintenir le rythme de la séquence strictement équivalent pour chaque démonstration , l' expérimentateur simule les actions sur les flèches . En réalité celles -ci s' allument automatiquement selon un algorithme . [ 25 ] Suite à une première analyse de variance , nous avons relevé une hétérogénéité des variances , afin de minimiser les biais liés à cela , nous avons retiré aléatoirement des sujets dans chacun des groupes afin d' obtenir un effectif équivalent . Nous avons pris la précaution de vérifier que ce tirage aléatoire n' affectait pas les résultats de l' ANOVA . L' analyse n' étant pas modifiée après le retrait des sujets , les résultats obtenus sur les données complètes ne semblent pas dus à l' hétérogénéité des variances . [ 26 ] Nous distinguerons deux types de participants : les agents pour parler des participants des simulations et les sujets pour parler des participants aux expériences [ 27 ] Le programme 1 correspond à 4 observations suivies de 4 pratique , le programme 2 à 6 observations et 2 pratiques , le 3 à 7 observations et 1 pratique . La démonstration 1 correspond à la trajectoire peu illustrative , la démonstration 2 à la trajectoire illustrative .