Punitions : Psychologie et Savoir Faire

La Carotte et le Bâton

Le bon sens populaire associe depuis la nuit des temps l’apprentissage et la discipline au système de la carotte et du bâton. La carotte c’est un évènement plaisant qui va arriver si on fait les choses correctement, le bâton, inversement est un évènement déplaisant qu’on va subir si on ne fait pas les choses correctement.

La première question qui se pose, c’est pourquoi deux options ? Ne peut-on pas juste punir ceux qui ne font pas les choses bien pour les forcer à changer ou à l’inverse ne peut-on pas juste récompenser ceux qui font le choses bien pour pousser les autres à faire pareil ? Vous vous doutez bien que si c’était si simple, le système d’éducation “qui marche” serait connu et utilisé depuis longtemps.

Le Bâton

Commençons par nous intéresser à l’approche punitive. C’est une méthode qui semble très efficace sur la majorité (on parle toujours de majorité, jamais de totalité des gens dans ce genre de réflexion). Toute personne doté d’un minimum de bon sens va tenter de ne pas être punie. Mais encore faut-il être bien conscient des limitations du processus…

Ne pas faire une chose car on sait qu’on va être puni ne va sûrement pas conduire la personne à ne plus avoir envie de faire la chose en question. Elle va tenter de la faire en cachette ou elle va tenter de trouver un moyen de ne plus être potentiellement punie en changeant certaines données pour ne plus être “sous le contrôle direct” de celui qui peut la punir. C’est donc efficace à court terme uniquement.

L’exposition fréquente à des punitions peut aussi créer une instabilité émotionnelle chez les individus, car ils craignent alors de commettre des erreurs ou de faire face à des critiques et anticipent constamment les répercussions potentielles. Cette instabilité peut rapidement les conduire à la passivité, ce qui était sans doute le but voulu dans le cadre de l’esclavage mais certainement pas dans celui d’une éducation visant à améliorer l’individu concerné.

La peur et l’anxiété liées aux punitions peut casser psychologiquement l’individu qui va se soumettre passivement, mais elle peut aussi à l’inverse le renforcer dans sa position de refus et le conduire à une attitude de provocation voir de rébellion violente comme mécanisme d’adaptation. Et là on peut dire que la situation à l’arrivée est bien pire que celle du départ !

Il faut enfin tenir compte que celui qui ne fait pas les choses ‘bien’ n’en a peut-être tout simplement pas les capacités et à ce moment-là il parait évident que le punir ne va pas résoudre le problème.

Voilà pourquoi la solution du 100 % bâton ne fonctionne pas, même dans le cadre d’un dressage animal (Vous avez tous vu ces dresseurs qui ont un fouet à la main, ils ont aussi toujours des friandises…).

La carotte

En reconnaissant et en récompensant les individus pour leurs efforts, cette approche contribue à renforcer la confiance, renforce l'estime de soi et favorise un environnement d'apprentissage positif. En effet si l’ambiance est positive, les gens sont plus ouverts et à l’écoute alors qu’à l’inverse, il est inutile de vouloir discuter avec une personne énervée ou paniquée, il faut attendre qu’elle se calme si on ne veut pas perdre son temps.

Le souci, c’est que tout le monde n’aime pas les carottes et que vous sentez bien que vous n’allez pas pouvoir fournir à chacun le truc qui le motivera suffisamment pour avancer (Faut-il déjà le trouver). De plus certaine personnes vont préférer continuer de faire la chose qui pose problème plutôt que de cesser en échange de la carotte. Donc le 100 % carotte n’est pas non plus LA solution.

Premières conclusions :

1- Utiliser les deux ! : De nombreuses études psychologiques ont aboutis à des résultats très similaires. Les meilleurs résultats éducatifs sont obtenus avec un ratio de trois à cinq carottes pour un coup de bâton. C’est effectivement en conformité avec ce qu’on a dit précédemment. Une punition est beaucoup plus efficace dans une ambiance positive et trop de punition amène à l’aversion et non à la progression (Ceci est encore accentué par l’age, les adolescents étant bien plus prompts à l’aversion qu’à la progression).

Pourquoi pas un ratio de 1:1 ? Ceci vient d’un biais psychologique qui nous affecte tous, le biais de négativité. Grossièrement résumé on va dire qu’on remarque beaucoup plus les évènements négatifs que les positifs et donc pour avoir un sentiment d’équilibre, il faut plus de positif que de négatif car à égalité, on retiendra globalement que c’est négatif !

2- Penser à faire remarquer que les choses sont bien faites : Pour arriver à un ration de 3:1 à 5:1, il est important d’apprendre à remarquer ce qui est bien et surtout à en féliciter l’auteur. Ainsi quand vous donnerez un avis négatif, il en sera d’autant plus surpris et sera donc plus disposé à analyser la critique, tenter de la comprendre et voir ce qu’il peut corriger dans son attitude pour améliorer les choses. A l’inverse, trop de critiques amènent la personne à se dire que vous critiquez tout, tout le temps et que l’effort ne servirait donc à rien.

3- Les punitions ne vont jamais de soi : Il est déjà évident qu'on ne punit pas pour passer ses nerfs mais uniquement en cas de faute avérée. Et on doit toujours commencer par un avertissement, la punition n’intervenant qu’ensuite, si la faute est répétée une seconde fois. De plus la punition doit toujours être accompagnée d’une indication de ce qu’il aurait convenu de faire. C’est ce double aspect pédagogique de l’avertissement préalable ET de l’explication, brève, de ce qu’il convenait de faire qui permettra une pédagogie optimale.

Approche Comportementale

Dans les jeux de domination et soumission, il y a une fréquente utilisation des punitions. Comme ce sont des jeux volontaires, il faut bien croire que le soumis y trouve son compte, qu’il aime peut-être les punitions… Mais du coup, comment punit-on quelqu’un qui aime être puni ? Pour comprendre la subtilité de la chose, on doit s’intéresser à l’approche comportementale.

Vous connaissez tous le nom d’un des plus célèbres comportementalistes, un dénommé Ivan Pavlov. Son expérience la plus célèbre consistait à accompagner le fait de donner de la nourriture à des chiens avec divers stimuli (on parle toujours d’une sonnette, mais il y avait en réalité de nombreux signaux différents). À partir d’un certain temps, les stimuli déclenchaient la salivation même en l’absence de nourriture, ce qui prouvait que les réflexes conditionnels pouvaient être reprogrammés.

L’un des héritages majeurs des travaux de Pavlov et de sa théorie des réflexes conditionnels se retrouve dans les travaux d'un de ses disciples, le sociologue et microbiologiste germano-russe Serge Tchakhotine, qui reprit cette théorie du point de vue de la psychologie des masses. Il expose ses théories dans un ouvrage de référence, Le Viol des foules par la propagande politique (1939).

C’est le point de départ de l’approche comportementaliste. Grossièrement résumé, cette approche repose sur l’idée qu’on évolue dans notre comportement par rapport aux expériences bonnes ou mauvaises qu’on fait. Par exemple, vous goûtez un plat inconnu, vous trouvez ça bon, vous aurez tendance à souhaiter en manger à nouveau par la suite. Si vous trouvez ça infâme, il y a peu de chance que vous alliez en acheter plus tard.

L’idée est donc d’associer une action qu’on souhaite voir plus souvent se reproduire avec un stimulus agréable (la carotte). C’est ce que les comportementalistes appellent le ‘Renforcement’. À l’inverse, on va associer les actions qu’on souhaite éliminer à un stimulus désagréable (le bâton). On appelle ça la 'Punition'.

Attention dès à présent avec le langage, ne prenez pas les mots dans leur sens le plus commun ! Ici la punition est bien une action qui va avoir pour effet de faire diminuer ou de faire cesser un comportement, même si pour vous cette action n’est absolument pas une punition au sens commun du terme. Imaginez par exemple que votre chien n’aime pas trop les caresses. Si vous le caressez à chaque fois qu’il vous ramène la balle pour le féliciter, comme on a tous instinctivement tendance à le faire puisque la majorité des chiens aiment les caresses, immanquablement il va la ramener de moins en moins sans que vous ne compreniez pourquoi ! La punition n’est donc pas universelle (On en revient à mon exemple en introduction, le soumis, le plaisir dans la douleur, Leopold von Sacher-Masoch…). Il importe de ce fait de prendre le temps de comprendre l’autre si on ne veut pas se planter en beauté, qu’on ait pour but de le punir ou de le récompenser. Ça n’est pas parce que vous feriez n’importe quoi pour manger du chocolat qu’une autre personne ne va pas trouver ça infect.

Tout ceci s’applique bien sur tout autant au renforcement. Si un gosse vous énerve et que vous lui criez dessus, ça vous semble assez logique qu’il arrête mais parfois c’est l’inverse qui se passe. Pourquoi ? Parce qu’il cherche de l’attention et qu’il remarque qu’en vous énervant il obtient de l’attention ! Dans VOTRE perception, crier c’est une « punition » car dans VOTRE logique, vous n’aimez pas vous faire crier dessus, mais il se trouve qu’ici c’est un renforcement. Il faut donc bien se détacher de ses propres perceptions et analyser très froidement la situation. Si une action, quel qu’elle soit, conduit le sujet à moins faire ou à ne plus faire, c’est une Punition. Si ça conduit le sujet à faire plus souvent ou avec plus d’intensité, c’est un Renforcement ! Et ce qui peut être renforcement pour l’un peut être punition pour l’autre !

À partir des années 1970, le comportementalisme radical défendu par Skinner perd de son influence au profit du cognitivisme. L'essentiel des critiques du comportementalisme portent sur le fait qu'il limite trop l’apprentissage à l’association stimulus-réponse et considère le sujet comme une boîte noire (il ne prend pas en compte, par exemple, les connaissances préalables du sujet). Nous aborderons ce point dans la troisième partie du sujet.

Secondes conclusions :

1- Le renforcement est bien plus efficace que la punition si l’on veut un changement durable et profond de comportement. La punition est souvent plus efficace en termes de résultat à court terme mais nettement moins efficace sur le long terme, le comportement indésirable n’étant pas modifié mais caché pour éviter de futures punitions, ce qui peut même le rendre plus attractif qu’à l’origine.

2- Pour punir ou récompenser efficacement, il faut connaître la personne à qui on s’adresse. Faire « comme si c’était pour soi » est une erreur grossière.

3- Le jeu BDSM peut à priori sembler « à part » mais dans le fond les règles restent les mêmes, seul le référentiel change. Votre soumis aime bien avoir certaines « punitions » ? Eh bien vous les utiliserez dans l’histoire si son comportement général vous satisfait. À l’inverse, si vous n’êtes pas satisfait, vous pourrez lui donner de « vraies » punitions, de celles qui ne lui plaisent pas, voir vous ne le punirez absolument pas, ce qui sera pour lui une véritable punition qu’on appelle la frustration.

Pour ceux qui veulent aller plus loin

Les adeptes de cette méthode ajoutent à cette distinction Renforcement / Punition, un concept de Positif ou de Négatif. Alors comme précédemment, attention avec le sens de ces deux mots. Ils n’ont ici aucune valeur morale (c’est bien, c’est mal) ni aucune notion d’efficacité (Ça marche, ça ne marche pas), ils n’ont qu’un sens mathématique, celui d’ajouter ou de retirer un stimulus.

Par exemple donner un coup de cravache c’est ‘positif’ car on donne un stimulus supplémentaire à la personne (comme déjà mentionné plus haut ce coup de cravache, selon sa force, la personne qui le reçoit, la contexte, peut générer un stimulus plaisant (on aime) ou déplaisant (on n’aime pas) mais laissera rarement de marbre). A l’inverse, laisser quelqu’un tout seul, c’est ‘négatif’ car on retire un stimulus (celui de l’interaction) mais là encore selon les gens et les situations ça peut retirer un stimulus qui était plaisant (la personne aimait bien être avec vous) ou déplaisant (la personne préfère que vous ne soyez pas là).

On dénote donc 4 possibilités de modifier le comportement d’une personne (ou d’un animal). Elles ne sont pas du tout équivalentes en termes d’efficacité, loin de là. Je vous les donne donc ici de la plus à la moins efficace :

  • Renforcement Négatif : C’est l’action la plus efficace, celle qu’on retrouve souvent dans la nature. Par exemple vous êtes en plein soleil, vous avez trop chaud, vous vous mettez à l’ombre, ça va mieux. L’ombre a fait disparaître le stimulus déplaisant « j’ai trop chaud ». C’est la même chose avec « avoir faim / manger ». Un exemple non naturel : le collier étrangleur. Votre chien tire mais il s’étrangle en faisant ça. Il va vite se rendre compte qu’en arrêtant de tirer il fait disparaître le stimulus déplaisant « s’étrangler ». Si on peut directement relier un comportement à la disparition d’un stimulus déplaisant, ce nouveau comportement sera assez facile à faire adopter.
  • Renforcement Positif : Second conditionnement en termes d’efficacité, il s’agit à présent de relier l’action souhaiter à un stimulus positif. Ça peut être des félicitations, un objet offert, de la nourriture, un droit supplémentaire pour un certain temps...
  • Punition Négative : ici on va retirer un stimulus agréable quand le comportement indésirable apparaît. Cette méthode est moins efficace pour deux raisons, elle procure de la frustration ET il faut vraiment être certain que la personne fait le lien entre les deux choses (Pour un animal, c’est loin d’être évident même si ça l’est pour vous, et même avec des humains, il y a parfois de très gros problèmes de communication -Différence de langage, de culture, d’habitudes…- qui fait que ce qui parait évident à l’un ne l’est pas obligatoirement pour l’autre).
  • Punition positive : C’est la bonne vieille méthode de la rouste ou de la privation de nourriture, on va imposer un stimulus déplaisant. C’est de loin la moins efficace des quatre options et elle ne doit être envisagée qu’après l’échec des trois précédentes, et encore, en étant bien conscient de ses limites. Elle est très peu efficace pour plusieurs raisons. Déjà elle va bien entendu entraîner un fort ressentiment de colère et de peur qui peut très facilement conduire à une réaction violente de défense. La peur va de plus amener le sujet à tenter de minimiser les risques et son comportement nouveau ne sera souvent pas modifié pour s’améliorer mais pour éviter une possible future punition ce qui peut donner des fugues ou une volonté d’aller au conflit ouvert (certains préfèrent l’affrontement immédiat plutôt que de vivre dans la peur du moment où « ça va tomber »).