Accueil / Esprit critique / Mesurer notre aptitude à éviter des réponses intuitives incorrectes : le test de réflexion cognitive

Mesurer notre aptitude à éviter des réponses intuitives incorrectes : le test de réflexion cognitive

Publié en ligne le 13 juin 2023 - Cerveau et cognition -

Le psychologue et économiste Daniel Kahneman, fondateur de l’économie comportementale, proposait une modélisation de nos processus de décision fondée sur deux systèmes cognitifs (exposé au grand public dans un livre paru en 2011, traduit en français en 2013 [1]). Le premier, appelé « système 1 » (ou processus de type 1), est rapide, intuitif et presque automatique, mais plus facilement sujet à des erreurs. Le second, le « système 2 » (ou processus de type 2) est plus lent, plus logique, mais mobilise de l’attention, une ressource cognitive limitée. Si les processus de type 1 permettent d’agir vite et peuvent se révéler adaptés dans de nombreuses situations, il est des contextes où ils nous conduisent à des réponses ou des comportements sous-optimaux, voire inadaptés. Le recours aux processus de type 2 nécessite un effort de telle sorte que « beaucoup de gens sont trop sûrs d’eux, prompts à avoir une trop grande foi dans leurs intuitions. Manifestement, ils considèrent l’effort cognitif comme étant au mieux légèrement désagréable, et l’évitent autant que possible » [1].

Jeune Femme assise ou La Pensée, Pierre-Auguste Renoir (1841-1919)

Il serait alors bienvenu que les individus puissent identifier qu’une réponse de type 1 n’est pas satisfaisante et soient en mesure de mobiliser les ressources cognitives pour atteindre une réponse de type 2. Bien entendu, le système 2 n’apporte pas la garantie d’une bonne réponse, ni même forcément d’une meilleure réponse. Il met en œuvre un processus plus raisonné, reposant sur la logique et faisant appel à nos connaissances, sans pour autant éliminer tous nos biais cognitifs. Il nous offre aussi la possibilité de réfléchir à ce processus, voire de le remettre en cause.

Analytique ou intuitif ? Le test de réflexion cognitive

Cette motivation et cette capacité, variables selon les individus, à inhiber les réponses de type 1 et à mobiliser les processus de type 2 ont été synthétisées sous le concept de « réflexion cognitive » [2]. Shane Frederick, chercheur en science de la décision, a proposé un test appelé « test de réflexion cognitive » (CRT ou Cognitive Reflection Test) qui permet de distinguer deux styles cognitifs de raisonnement : un style intuitif et un style analytique.

Le test de réflexion cognitive


Il est composé de trois problèmes.

  • Premier problème
    Une batte et une balle coûtent au total 1 euros et 10 centimes. La batte coûte 1 euro de plus que la balle. Combien coûte la balle ?
  • Deuxième problème
    Si 5 machines produisent 5 articles en 5 minutes, combien de temps faudrait-il à 100 machines pour en fabriquer 100 ? (en minutes)
  • Troisième problème
    Un lac est recouvert de nénuphars dont l’étendue double chaque jour. Si les nénuphars mettent 48 jours à couvrir toute la surface du lac, en combien de temps en couvriraient-ils la moitié ?

Interprétation
Le score obtenu correspond au nombre de bonnes réponses.
Vous avez possiblement déjà entendu parler de ces problèmes qui rappellent des devinettes que bon nombre de personnes aiment proposer. Lorsque vous considérez le problème 1, il est très probable que la réponse « 10 centimes » vous vienne à l’esprit, qu’il s’agisse de votre réponse définitive ou non. Chose étrange, cette réponse arrive à l’esprit… même lorsque nous savons qu’elle est fausse. La réponse correcte est « 5 centimes » (car considérer la réponse « 10 centimes » comme bonne impliquerait que le total fasse 1 euros et 20 centimes et non 1 euro et 10 centimes comme indiqué dans l’énoncé).

Lorsque vous considérez le problème 2, il est également très probable que la première réponse qui vous vienne à l’esprit est 100 alors que la bonne réponse est 5.
Et lorsque vous considérez le problème 3, la réponse intuitive est 24 alors que la bonne réponse est 47.

Le test de réflexion cognitive mesure ici notre capacité à détecter que la réponse intuitive qui arrive vite à l’esprit est incorrecte (ici : 10 centimes, 100 minutes et 24 jours) et à l’inhiber pour calculer la réponse correcte (5 centimes, 5 minutes et 47 jours).

Cet outil va connaître un grand succès dans le monde entier car il permet de mesurer une dimension importante de nos processus de raisonnement : la capacité et la disposition à inhiber une réponse intuitive incorrecte. Cette notoriété s’explique sans doute en partie par le fait que ce test est simple à mettre en œuvre (la version initiale propose seulement trois courts problèmes à résoudre – voir l’encadré ci-dessus), rapide (répondre à ces problèmes ne demande que très peu de temps), et que son pouvoir prédictif est important et dépasse le seul champ du raisonnement.

Une portée plus générale

Le CRT caractérise un style cognitif de raisonnement, mais il permet également de prédire d’autres aptitudes ainsi que des attitudes vis-à-vis de certaines croyances. Ainsi, il a été montré que les individus qui réussissent le mieux à ce test, ceux qui ont un style de pensée plus analytique, sont aussi ceux qui feront de meilleurs choix dans des situations de la vie quotidienne au regard des normes en vigueur [3, 4] et, plus généralement, que « la propension à penser analytiquement a des conséquences majeures sur la psychologie individuelle » [5]. Nous donnons ici quelques exemples sans prétention à l’exhaustivité.

Croyances et engagement religieux
On constate que les individus qui ont des scores plus élevés au test, faisant écho à un style de raisonnement plus analytique, sont ceux qui adhèrent le moins aux nombreuses croyances dont la véracité n’est pas scientifiquement prouvée (les psychologues parlent de croyances « épistémiquement suspectes »). Par exemple, un faible résultat (style de raisonnement plus intuitif) est un bon indicateur des croyances religieuses et de l’engagement religieux [6] ou de la propension à adhérer aux théories de la création divine au détriment de l’évolution biologique [7].

Pseudo-sciences, croyances paranormales, fausses informations…
Ce pouvoir prédictif a également été montré dans diverses croyances dites paranormales, comme la croyance en la perception extrasensorielle (forme de perception indépendante des processus sensoriels connus dont seraient dotés les médiums), l’existence des fantômes, l’astrologie, et même les « croyances romantiques » (par exemple, la croyance que l’amour dure pour toujours) [8].

L’adhésion à certaines pseudo-sciences telles que les croyances en l’efficacité des médecines alternatives (par exemple l’homéopathie, les remèdes à base de plantes, ou les « thérapies énergétiques et corporelles » [9]) a aussi été mise en lien avec un style de raisonnement plus intuitif.

Allégorie de la Foi (détail), Johannes Vermeer (1632-1675)

Les résultats au CRT permettent également de prédire la tendance à trouver un sens profond à des énoncés qui en sont dénués (ce que les chercheurs anglophones qualifient de « pseudo-profound bullshit ») [10] ou encore la capacité des individus à ne pas détecter des « fake news » [11] et leur propension à les partager via les réseaux sociaux.

Enjeux de société
Des attitudes et croyances relatives à d’autres questions de société ont également été analysées, montrant là aussi un lien avec les résultats au test : adhésion à certaines théories du complot [12], climato-scepticisme [13] ou encore attitude face à la vaccination contre la Covid-19 [14, 15].

Jugements moraux
Au-delà des croyances évoquées ci-dessus, les réponses au test permettent également de prédire certains jugements moraux des individus, comme la propension à faire des jugements de type utilitariste dans des dilemmes moraux (c’est-à-dire qui visent à favoriser le plus grand nombre d’individus au détriment d’un plus petit nombre [16]). Dit autrement, des données suggèrent que les individus avec des scores élevés au test (style de pensée plus analytique) sont ceux qui acceptent plus facilement de sacrifier une personne pour en sauver un plus grand nombre dans des scénarios fictifs.

Également, les individus ayant les scores les plus élevés sont ceux qui blâment et punissent le moins les auteurs d’une transgression accidentelle (transgression ayant donné lieu à une conséquence dommageable pour une victime, en l’absence d’intention de nuire) [17].

Exemples d’autres tests


Raisonnement syllogistique avec biais de croyance [1]
(1) Aucune personne en bonne santé n’est malheureuse.
(2) Il existe des gens malheureux qui sont cosmonautes
Donc : Il existe des cosmonautes qui ne sont pas en bonne santé.

La conclusion est-elle logiquement valide ?
La conclusion est logiquement valide (réponse analytique correcte), bien qu’intuitivement nous aurions tendance à penser qu’on ne peut pas être cosmonaute et en mauvaise santé.

Tâche de négligence du taux de base (mauvaise compréhension des probabilités) [2]

Dans une étude, 200 personnes ont été interrogées. Parmi elles se trouvaient 5 ingénieurs et 195 avocats. Jack est un participant pris au hasard parmi les participants de cette étude. Il a 36 ans, n’est pas marié et est quelque peu introverti. Il aime passer son temps libre à lire de la science-fiction et à écrire des programmes informatiques.

Qu’est-ce qui est le plus probable, que Jack est avocat ou ingénieur ?
Le plus probable est que Jack est avocat (réponse analytique correcte) bien qu’intuitivement passer son temps libre à programmer, lire de la science-fiction et être introverti cadre plus avec l’idée que l’on peut se faire d’un ingénieur que d’un avocat.

Problème de conjonction [3]
Linda a 31 ans. Elle est célibataire, a du franc-parler et est très intelligente. Elle a une licence de philosophie. Étudiante, elle se sentait profondément concernée par des problèmes de discrimination et de justice sociale. Elle a participé à des manifestations anti-nucléaires.
(1) Linda est guichetière dans une banque.
(2) Linda est guichetière dans une banque et membre d’un mouvement féministe.

Quelle affirmation vous semble la plus probable ?

La réponse (1) est la plus probable (réponse analytique correcte). En effet, la réponse (2) est incluse dans la (1) : les personnes guichetières dans une banque et membre d’un mouvement féministe sont une sous-catégorie de la catégorie « personnes guichetières dans une banque ».

Références
1 | Evans J St B T, “On the conflict between logic and belief in syllogistic reasoning” Memory & Cognition, 1983, 11 :295-306.
2 | Kahneman D, Tversky A, “On the psychology of prediction”, Psychological Review, 1973, 80 :237-51.
3 | Tversky A, Kahneman D, “Extensional versus intuitive reasoning : The conjunction fallacy in probability judgment”, Psychological review, 1983, 90 :293.

Critiques et limites

Le CRT n’est pas le premier test visant à mesurer le style de réflexion cognitive. Les chercheurs travaillant sur les modes de raisonnement se sont très tôt intéressés aux méthodes permettant d’identifier la nature des processus mis en œuvre et ont conçu des tests pour cela, s’appuyant sur des tâches spécifiques à effectuer ou des problèmes à résoudre (voir encadré « Exemples d’autre tests »).

Version verbale du test de réflexion cognitive


Le vent souffle à l’ouest. Un train électrique roule vers l’est. Dans quelle direction la fumée de la locomotive se déplace-t-elle ?

La réponse intuitive (incorrecte) est « ouest ». Mais la réponse correcte (analytique) est qu’un train électrique ne fait pas de fumée.

Dans cet exemple, trouver la bonne réponse ne dépend aucunement de quelconques compétences en mathématiques.

Toutes ces tâches présentent un principe similaire qui sera repris dans le CRT : elles mettent chacune en avant une information attirante (traitée par les processus de type 1) mais incorrecte, qui rentre en conflit avec une information plus exigeante à traiter mais correcte (qui nécessite de mobiliser des processus de type 2).

Si ce test a connu un succès incomparable, c’est sans doute du fait de sa rapidité d’administration (quand les autres tâches, comme celles présentées en encadré, utilisent communément un plus grand nombre d’essais), la simplicité de ses consignes et son caractère ludique : pour beaucoup, il ressemble à des devinettes présentant un certain défi et est facilement communicable dans nos quotidiens.

Nécessité d’autres compétences ?
La résolution des trois items originaux du CRT nécessite d’inhiber une réponse intuitive incorrecte. Mais elle implique également d’autres compétences, comme quelques dispositions en arithmétique. Une version verbale a ainsi été proposée pour répondre à cette faiblesse [18] (voir encadré « Version verbale du test de réflexion cognitive »).

Exemple de test de mesure de capacités cognitives


À la loterie, les chances de gagner un prix de 10 euros sont de 1 %. Combien de personnes gagneraient un prix de 10 euros si 1 000 personnes achetaient chacune un ticket pour la loterie ?

Réponse correcte : 10 (réponse intuitive absente).

Dans ce problème, les processus de type 1 (nos intuitions) sont silencieux : ils n’ont aucune réponse rapide à apporter. Il n’y a pas de conflit entre différents processus de raisonnement, et donc pas de conflit entre différentes réponses. Finalement, la résolution du problème dépend uniquement de la capacité de l’individu à mobiliser correctement certaines capacités cognitives sous-tendues
par des processus de type 2.

Bien que le souci des compétences mathématiques soit ainsi réglé, le test nécessite toujours une opération mentale en plus de l’inhibition de la réponse intuitive incorrecte. Dans le problème de la batte et de la balle, arriver à la conclusion que la balle ne coûte pas 10 centimes n’implique pas nécessairement que nous soyons en mesure de donner la bonne réponse, 5 centimes. Ici les individus doivent avoir d’autres capacités cognitives pour atteindre la réponse correcte. C’est pourquoi de récents travaux mettant en œuvre le test le font en contrôlant l’effet de ces capacités cognitives au moyen d’un test additionnel [8, 13] (voir exemple en encadré « Exemple de test de mesure de capacités cognitives »).

Victime de son succès
Enfin, une inquiétude récente est apparue sur les usages qui peuvent être faits du CRT. Du fait de sa grande popularité, une grande partie des potentiels participants aux études y ayant recours le connaissent déjà, biaisant fortement les mesures. Logiquement, les personnes qui ont déjà été confrontées au test obtiennent de meilleurs résultats [19, 20].

Il semble toutefois que cette augmentation de performance à la suite d’une exposition multiple ne détériore pas la capacité prédictive du test : dans un groupe de participants, les individus qui ont les scores les plus faibles au test continuent à avoir les scores les plus faibles lorsqu’on le leur représente, possiblement car ils ne réalisent pas que l’administration multiple de ce test cache une difficulté plus importante que ce qu’ils en entrevoient [21]. L’exposition multiple n’a donc que peu d’incidence sur la capacité du test à prédire d’autres phénomènes, comme ceux illustrés plus haut.

Le test de réflexion cognitive mesure-t-il réellement ce qu’il est supposé mesurer ?
Finalement, il existe des critiques quant aux qualités psychométriques (en d’autres termes, de mesure) de cet outil. Permet-il réellement de distinguer des styles de raisonnement intuitifs de style analytique ? Une première difficulté concerne l’absence de réel consensus quant à ce que mesure le test (mesure-t-il un construit ? plusieurs ?) [22], et sur la procédure à utiliser pour construire un score à son issue [23]. Bien que le test ait une portée prédictive qui va au-delà des capacités mentales générales [24], de récentes études testant sa validité psychométrique par des méthodes de validation strictes mettent en doute sa capacité à réellement distinguer deux styles de raisonnement et à se distinguer d’un facteur d’intelligence générale [25].

La Révélation, Gaston Bussière (1862-1928)

Conclusion

Le test de réflexion cognitive est un outil de mesure stupéfiant par sa capacité à prédire des croyances, attitudes et comportements d’une grande variété, allant de nos performances de raisonnement et de décision à nos jugements moraux, en passant par une constellation de croyances. Bien que ses qualités psychométriques puissent être questionnées, sa facilité et sa rapidité d’administration, et le fait qu’il résiste aux multiples expositions, en font une des mesures phares utilisée par les chercheurs. En résulte un outil de mesure d’une grande importance dans l’étude du raisonnement humain et, par conséquent, dans l’étude de la pensée critique.

Références


1 | Kahneman D, Système 1, Système 2 : les deux vitesses de la pensée, Flammarion, 2013.
2 | Frederick S, “Cognitive reflection and decision making”, Journal of Economic Perspectives, 2005,19 :25-42.
3 | Campitelli G, Labollita M, “Correlations of cognitive reflection with judgments and choices”, Judgment and Decision Making, 2010, 5 :182-91.
4 | Juanchich M et al., “Cognitive reflection predicts real-life decision outcomes, but not over and above personality and decision-making styles”, Journal of Behavioral Decision Making, 29 (1). pp. 52-59.
5 | Pennycook G et al., “Everyday consequences of analytic thinking”, Current Directions in Psychological Science, 2015, 24 :425-32.
6 | Pennycook G et al., “Analytic cognitive style predicts religious and paranormal belief”, Cognition, 2012, 123 :335-46.
7 | Gervais WM, “Override the controversy : Analytic thinking predicts endorsement of evolution”, Cognition, 2015, 142 :312-21.
8 | Trémolière B, Djeriouat H, “Love is not exactly blind, at least for some people : Analytic cognitive style predicts romantic beliefs”, Personality and Individual Differences, 2019, 145 :119-31.
9 | Browne M, “Going against the herd : Understanding the psychosocial factors underlying the ‘vaccination confidence gap’”, PLoS One, 2015, 10 :e0132562.
10 | Pennycook G et al., “On the reception and detection of pseudo profound bullshit”, Judgment and Decision making, 2015, 10 :549-63.
11 | Pennycook G, Rand DG, “Who falls for fake news ? The roles of bullshit receptivity, overclaiming, familiarity, and analytic thinking”, Journal of Personality, 2020, 88 :185-200.
12 | Stecula DA, Pickup M,“Social media, cognitive reflection, and conspiracy beliefs”, Frontiers in Political Science, 2021, 3 :62.
13 | Trémolière B, Djeriouat H, “Exploring the roles of analytic cognitive style, climate science literacy, illusion of knowledge, and political orientation in climate change skepticism”, Journal of Environmental Psychology, 2021, 74 :101561.
14 | Martinelli M, Veltri GA, “Do cognitive styles affect vaccine hesitancy ? A dual-process cognitive framework for vaccine hesitancy and the role of risk perceptions”, Soc Sci Med, 2021, 114403.
15 | Murphy J et al.,“Psychological characteristics associated with COVID-19 vaccine hesitancy and resistance in Ireland and the United Kingdom”, Nature Communications, 2021, 12 :1-15.
16 | Paxton JM et al., “Reflection and reasoning in moral judgment”, Cognitive science, 2012, 36 :163-77.
17 | Patil I, Trémolière B, “Reasoning supports forgiving accidental harms”, Scientific Reports, 2021, 11 :1-8.
18 | Sirota M et al.,“Measuring cognitive reflection without maths : Development and validation of the verbal cognitive reflection test”, Journal of Behavioral Decision Making, 34 :322-43.
19 | Haigh M, “Has the standard cognitive reflection test become a victim of its own success ?”Advances in Cognitive Psychology, 2016, 12 :145-9.
20 | Stieger S, Reips UD, “A limitation of the cognitive reflection test : Familiarity”, Peer J, 2016, 4 :e2395.
21 | Bialek M, Pennycook G, “The cognitive reflection test is robust to multiple exposures”, Behavior Research Methods, 2018, 50 :1953-9.
22 | Pennycook G et al., “Is the cognitive reflection test a measure of both reflection and intuition ?”Behavior Research Methods, 2015, 48 :1-8.
23 | Erceg N, Bubic A, “One test, five scoring procedures : Different ways of approaching the cognitive reflection test”, Journal of Cognitive Psychology, 2017, 29 :381-92.
24 | Toplak ME et al., “Assessing miserly information processing : An expansion of the cognitive reflection test”, Thinking and Reasoning, 2014, 20 :147-68.
25 | Blacksmith N et al., “Assessing the validity of inferences from scores on the cognitive reflection test”, Journal of Behavioral Decision Making, 2019, 32 :599-612.

Publié dans le n° 343 de la revue


Partager cet article


L' auteur

Bastien Trémolière

Maître de conférences en psychologie cognitive à l’université Toulouse 2 Jean-Jaurès, Laboratoire Cognition, (…)

Plus d'informations