Accueil / Psychologie Scientifique / Récompenses et punitions en psychologie comportementale

Récompenses et punitions en psychologie comportementale

Publié en ligne le 22 février 2026 - Psychologie -

La psychologie peut se définir comme un ensemble d’observations et d’explications de comportements. Des théories sont apparues depuis l’Antiquité sous forme de sens commun et de philosophies. La psychologie scientifique, soucieuse d’observations précises et de vérifications objectives, est née en Allemagne au XIX^e siècle. Elle a été alors définie comme la « science de l’âme » (Seelenkunde), l’étude d’une entité immatérielle dont les expressions sont des comportements observables. La méthode était l’introspection, définie comme l’auto-observation d’états de conscience provoqués par diverses situations [1].

Vers 1910, des psychologues – principalement américains – ont développé une façon de faire de la psychologie appelée behaviorism (comportementalisme). Son leitmotiv est d’étudier le comportement observé, et non l’âme ou l’esprit. Cette approche se caractérise par le refus de pseudo-explications « mentalistes », des explications à portée de main par des « besoins », des « instincts », des « pulsions », ou bien encore un « inconscient ». Ces explications par des entités internes invisibles arrêtent les investigations. Expliquer l’agressivité par une « pulsion d’agression » ne mène pas loin. En fait, tout comportement – agressif ou autre – résulte toujours de plusieurs facteurs. Pour l’expliquer, il convient d’examiner la situation dans laquelle il s’est produit, la manière dont la personne perçoit et interprète cette situation, les affects qui découlent de l’état physiologique et de processus cognitifs générés, le répertoire des actions de la personne, l’anticipation d’effets de conduites possibles, les conditionnements subis par le passé (les modèles observés, les punitions et les récompenses qui ont suivi des actions).

Le principal représentant du comportementalisme est Burrhus Skinner (1904-1990), professeur à l’université Harvard. Contrairement aux premiers behavioristes, il a étudié des comportements entendus au sens large : toute forme d’activité, directement ou indirectement observable, présentant une composante cognitive, affective et motrice [2]. Des collaborateurs ont utilisé ses observations pour développer l’Applied Behavior Analysis (ABA), l’Analyse appliquée du comportement (AAC), dont les applications les plus marquantes sont l’éducation dans des institutions et l’éducation des personnes avec autisme. Les principes s’appliquent toutefois dans de nombreux domaines, notamment l’éducation en général [3].

Quatre types de conséquences du comportement

Skinner distinguait quatre types de conséquences : deux récompenses et deux punitions. Au terme « récompense », il a préféré « renforçateur », qui « fortifie » le comportement, c’està-dire rend sa répétition davantage probable dans une situation similaire. Des récompenses, par exemple des friandises non appréciées, n’ont pas cet effet.

Les renforcements positifs et négatifs
Le renforcement est appelé « positif » lorsqu’il se produit par l’apparition d’une stimulation agréable après le comportement. Le mot « positif » ne signifie pas ici bon ou utile. Conformément à l’étymologie latine – positus, posé –, il indique la présence de quelque chose, comme dans l’expression « le test VIH est positif », le virus est présent.

Le renforcement est dit « négatif » si une stimulation désagréable est réduite ou supprimée à la suite du comportement. De même, « négatif » ne signifie pas ici mauvais. Conformément à l’étymologie – negativus, nié, reconnu absent –, il indique l’absence de quelque chose, comme dans l’expression « la cuti est négative » pour dire que le bacille est absent.

Les animaux et les humains font beaucoup de choses pour éviter des situations pénibles. Ainsi, les addictions commencent généralement à la suite de renforçateurs positifs (on apprend à fumer pour faire partie d’un groupe, vivre un rite de passage, etc. ), mais une fois l’habitude prise et la dépendance à la nicotine installée, la personne fume moins par plaisir que pour éviter les pénibles sensations de l’état de manque. Au bout d’un certain temps, l’arrêt du tabagisme devient douloureux, très difficile.

Les punitions positives et négatives
Le mot « punition » désigne une stimulation désagréable ou pénible qui suit un comportement et qui réduit la fréquence de ce comportement ou le fait abandonner. Si un élève continue à perturber les cours après avoir dû recopier des textes, le recopiage n’a pas été une punition efficace au sens technique utilisé ici.

La punition est dite « positive » lorsqu’une situation désagréable ou pénible apparaît à la suite du comportement. La punition est appelée « négative » lorsqu’une ou des stimulations agréables sont réduites ou disparaissent suite au comportement.

Un exemple de punition négative est la « pénalisation » (response cost) : le retrait d’une chose obtenue, par exemple un jouet, un bon point, de l’argent de poche. Un autre exemple, qui a fait couler beaucoup d’encre récemment [4], est la « mise à l’écart » (time out) : la perte d’accès, pendant une période déterminée, à une situation ou des stimulus qui sont « renforçants ».

Pour les comportementalistes praticiens de l’AAC, la mise à l’écart peut s’appliquer à un enfant qui a une conduite perturbante (cris, colère, bouffonnerie pour capter l’attention du groupe), antisociale (pousser ou frapper un autre enfant) ou potentiellement dangereuse, pour lui ou pour d’autres. La procédure classique est le placement de l’enfant dans une autre pièce : un endroit « sûr », suffisamment chauffé et ventilé, non verrouillé. Il est exclu de placer l’enfant dans l’obscurité. En cas de colère, l’enfant peut y continuer sa colère, mais n’a plus l’attention qu’il obtenait. La mise à l’écart n’implique pas un changement de local. Par exemple, le parent interrompt une émission de télévision si l’enfant hurle ; durant un jeu collectif, l’enseignant envoie l’enfant s’asseoir sur un banc, éventuellement le dos tourné au jeu. La procédure n’est considérée comme efficace que si la fréquence du comportement qui la déclenche finit par diminuer. Des recommandations sur les durées de mise à l’écart sont précisées en fonction du contexte. Il importe de coupler la mise à l’écart avec le renforcement de comportements désirables. Par exemple, l’enfant est récompensé lorsqu’il est frustré mais ne se met pas en colère [3].

Priorité aux renforcements positifs

Dès 1938, Skinner a démontré le pouvoir de renforcements positifs bien « programmés ». Devant ses étudiants de Harvard, il faisait venir un pigeon qui n’avait guère été conditionné et lui faisait apprendre à se déplacer de façon inhabituelle, par exemple en décrivant des « 8 » sur le sol de la cage. Skinner disposait d’un appareil permettant de fournir de la nourriture au pigeon qui avait faim. Il ne pouvait attendre que le comportement visé survienne pour le renforcer. Dès lors, il renforçait tout comportement qui pouvait mener, si peu que ce soit, à la réaction souhaitée. Lorsque le pigeon adoptait l’ensemble des réactions, les unes après les autres, il était particulièrement renforcé. Le comportement cible intervenait alors rapidement. Cet apprentissage se réalisait le plus souvent en une dizaine de minutes [2].

Ce genre d’expérience montre qu’on ne peut pas affirmer l’incapacité de certains comportements si l’on ne précise pas les « programmes » essayés. Il existe évidemment des contraintes constitutives. Ainsi, il n’est pas possible d’apprendre à un pigeon à donner un coup de bec pour éviter un choc électrique. Sa réaction naturelle d’évitement comporte le rejet de la tête vers l’arrière [5].

Il y a bien sûr d’énormes différences de complexité dans les répertoires comportementaux des hommes et des animaux, mais il y a des lois d’apprentissage analogues, comme il y a des lois du fonctionnement physiologique comparables chez les humains et des animaux.

L’apprentissage que nous venons d’illustrer s’appelle « renforcement par approximations successives », « façonnement » (shaping) ou, plus simplement, « apprentissage par petits pas ». Il s’est avéré extrêmement utile pour l’éducation d’enfants atteints d’autisme [3]. Une illustration très émouvante a été donné par le témoignage de l’acteur Francis Perrin et sa femme dans le livre Louis, pas à pas [6]. À l’âge de trois ans, Louis avait été diagnostiqué autiste sévère. Un psychiatre avait tranché : « Vous devez faire le deuil de votre enfant. » Un autre avait expliqué : « Madame, vous êtes une mauvaise mère, Monsieur, vous êtes un père trop vieux ! » Gersende et Francis découvrent alors l’Analyse appliquée du comportement. Louis évolue dès les premiers jours grâce à des renforcements méthodiques de comportements. Il communique peu à peu avec ses frères et commence à acquérir une véritable autonomie. Ses progrès sont spectaculaires : il devient pas à pas « un enfant presque comme les autres ».

Inconvénients des punitions

Pour un parent, un enseignant ou un éducateur, il semble difficile, voire impossible, de se passer de punitions. Celles-ci peuvent faire apprendre à mieux reconnaître des conduites inadéquates, elles peuvent dissuader de conduites dangereuses, comme jouer avec des prises électriques, voler, agresser un autre enfant. Il importe toutefois qu’elles apparaissent justes (trop faibles, elles sont inefficaces ; disproportionnées, elles suscitent des réactions regrettables). Il est souhaitable qu’elles suivent rapidement le comportement indésirable et qu’elles portent sur les premiers éléments de la séquence comportementale [7].

La plupart des punitions présentent des inconvénients, surtout si l’on peut s’en passer grâce au renforcement de comportements alternatifs. C’est un fil rouge du comportementalisme. Dès son cours à Harvard en 1948, publié sous forme de livre en 1953, Skinner insistait sur les inconvénients des punitions : « À long terme, la punition – contrairement au renforcement – opère au détriment à la fois de l’individu puni et de l’agent de punition. Les stimuli aversifs, qui sont alors nécessaires, génèrent des émotions prédisposant à la fuite ou à la vengeance, ainsi que des anxiétés débilitantes » [8]. Deux ans avant sa mort, il répète : « Les stimuli aversifs ne se justifient que si aucune autre mesure ne peut être utilisée. Accepter trop facilement les mesures aversives, c’est entraver le progrès dans des voies meilleures » [9].

Les punitions suscitent peu de comportements élaborés. Par elles, il est impossible d’apprendre à un pigeon à se déplacer en décrivant des « 8 » sur le sol, pas plus qu’on ne peut apprendre à un enfant atteint d’autisme à acquérir un degré d’autonomie convenable. Les punitions induisent l’imitation : le punisseur sert de modèle pour la réduction de frustrations, il apprend au puni à réagir comme lui à l’égard d’autres personnes. De nombreuses recherches ont montré une nette corrélation entre les punitions physiques excessives infligées aux enfants et leurs conduites violentes [10].

L’importance de la proportion des renforcements et des punitions

Betty Hart et Todd Risley (université du Kansas) ont examiné le vocabulaire et le quotient intellectuel d’enfants à 3 ans, puis à 9-10 ans. Les enfants qui ont réalisé le plus de progrès dans ces deux domaines avaient des parents qui leur parlaient davantage et les félicitaient plus souvent. Le « ton de rétroaction » (feedback tone) parental qui a entraîné le plus de progrès était d’environ cinq félicitations ou approbations pour une critique ou réprimande [11].

À la même époque, John Gottman (University of Washington, Seattle), célèbre investigateur des facteurs de satisfaction et de séparation conjugales, a observé dans son « love lab » les échanges verbaux de plusieurs centaines de couples au cours de discussions sur leurs conflits. Résultat : chez les couples stables le rapport des interactions positives aux négatives était de 5/1 ; chez les couples qui divorceront, de 0, 8/1 [12].

Bien sûr, on ne retrouve pas toujours le même rapport, mais d’autres recherches montrent sans équivoque les bénéfices d’un nombre nettement plus élevé de remarques positives que de critiques [13, 14].

Des marques subtiles sont souvent suffisantes. Il importe par ailleurs de ne pas « saturer » les enfants d’éloges. Certains – en particulier des adolescents délinquants – réagissent négativement à l’abondance des renforçateurs [15]. Les renforçateurs additionnels sont évidemment inutiles si l’activité est intrinsèquement renforçante (par exemple si l’enfant trouve du plaisir à résoudre des problèmes).

La plupart des êtres humains critiquent spontanément. Ils punissent volontiers car cette réaction facile a souvent un effet immédiat ou à court terme sur le puni. Réagir d’une façon positive est moins évident, mais cela se développe. Il en résulte des relations plus heureuses et des conduites plus solides à long terme. Complimenter n’est pas compliqué, c’est efficace et gratuit.

Références

1 | Schwitzgebel E, “The rise of introspective psychology as a science”, Stanford Encyclopedia of Philosophy, 25 avril 2024. Sur plato. stanford. edu
2 | Skinner B, La Révolution scientifique de l’enseignement, Mardaga, 1968.
3 | Cooper JO et al. , Analyse appliquée du comportement, Éditions ABA Online SAS, 2022.
4 | Ramus F, « Pour ou contre le “time-out” ? Ce que disent les recherches scientifiques », 20 février 2023. Sur ramus-meninges. fr
5 | Smith RF et al. , “Incompatibility between the pigeon’s unconditioned response to shock and the conditioned key-peck response”, Journal of the Experimental Analysis of Behavior, 1972, 18 : 147-53.
6 | Perrin F, Perrin G, Louis, pas à pas, Lattès, 2012.
7 | Lerman D, Toole LM, “Developing function-based punishment procedures for problem behavior”, in Handbook of applied behavior analysis, Guilford, 2011, 348-69.
8 | Skinner BF, Science and human behavior, The Macmillan Company, 1953.
9 | Skinner BF, “The operant side of behavior therapy”, Journal of Behavior Therapy and Experimental Psychiatry, 1988, 19 : 171-9.
10 | Sprague JR, Walker H, “Early identification and intervention for youth with antisocial and violent behavior”, Exceptional Children, 2000, 66 : 367-79.
11 | Hart B, Risley TR, Meaningful differences in the everyday experience of young American children, Paul H Brookes, 1995.
12 | Gottman JM, What predicts divorce ? The relationship between marital processes and marital outcomes, Psychology Press, 1994.
13 | Sabey CV et al. , “The ‘magic’ positive-to-negative interaction ratio : benefits, applications, cautions, and recommendations”, Journal of Emotional and Behavioral Disorders, 2018, 27 : 154-64.
14 | Cook CR et al. , “Evaluating the impact of increasing general education teachers’ ratio of positive-to-negative interactions on students’ classroom behavior”, Journal of Positive Behavior Interventions, 2016, 19 : 67-77.
15 | Patterson G, “Behavioral techniques based upon social learning”, in Behavior therapy : appraisal and status, Mac GrawHill, 1969, 323-74.