L’intuition

Les différentes formes de raisonnement présentées précédemment, permettent d’aboutir à la connaissance.
Mais il est tout à fait possible d’avoir accès à la connaissance, sans passer par un raisonnement, c’est la définition même de l’intuition.

L’intuition est un mode de connaissance, de pensée ou jugement, perçu comme immédiat (sans analyse ni raisonnement).
Le domaine de l’intuition est large : il concerne aussi bien la connaissance proprement dite (représentation du monde) que les sentiments (sur les choses, sur soi) ou les motivations (à agir, ne pas agir).

L’intuition semble être immédiate du fait qu’elle paraît opérer sans user de la raison, et est généralement perçue comme inconsciente : seule sa conclusion est alors disponible à l’attention consciente.

Aussi, l’intuition prend souvent la forme d’un sentiment d’évidence, et il est souvent difficile d’en justifier la pertinence. On aura par exemple l’intuition que telle idée ou action, tel sentiment, est juste, sans savoir vraiment pourquoi.
Néanmoins, il est fréquemment possible de rationaliser une intuition a posteriori.

Henri Poincaré est un mathématicien, physicien, philosophe et ingénieur français

Enfin, l’intuition (accompagnée d’imagination) a joué un grand rôle dans beaucoup de découvertes scientifiques, une étude suédoise menée en 1994 menée auprès de lauréats de prix Nobel révèle que l’immense majorité de ces lauréats se basent sur l’intuition dans leur travail et regrettent que l’intuition n’ait pas une place plus importante dans les formations scientifiques.

On peut se poser une question : puisque l’intuition est aussi importante, et qu’elle opère sans analyse ni raisonnement, peut-on améliorer son intuition ? Si oui comment ?

Le Paradoxe de Simpson


Rien à voir avec notre cher Homer Simpson, le paradoxe de Simpson ou effet de Yule-Simpson est un paradoxe statistique décrit par Edward Simpson en 1951 et George Udny Yule en 1903, dans lequel un phénomène observé de plusieurs groupes semble s’inverser lorsque les groupes sont combinés.

Ce résultat qui semble contradictoire est lié à des éléments qui ne sont pas pris en compte (comme la présence de variables non indépendantes ou de différences d’effectifs entre les groupes, etc.) est souvent rencontré dans la réalité, en particulier dans les sciences sociales et les statistiques médicales.

Ces éléments non pris en compte sont nommés : facteurs de confusions.

Exemple :

Supposons que l’on mesure la performance scolaire de différents élèves en fonction de la quantité de sport pratiqué.

Les résultats sont présentés dans le graphique ci-dessous :

  • l’axe horizontal x (abscisse) représente la quantité de sport pratiqué.
  • l’axe vertical y (ordonnée) représente la performance scolaire.

Dans cet exemple, on voit que parmi les élèves « bleus » ceux qui pratiquent davantage de sport sont meilleurs à l’école et il en est de même dans le groupe « rouge ».

Pourtant, quand on combine les deux groupes ensemble (axes en noir) on a une relation inversée qui semble indiquer que plus on pratique de sport (x élevé), moins on obtient de bonnes performances scolaires (baisse sur l’axe y) : l’observation des deux groupes combinés semble contredire ce qu’on a observé dans chacun des groupes pris séparemment, c’est ça le Paradoxe de Simpson.

x le nombre d’heures consacrées au sport, y les notes.

L’exemple illustre le fait qu’il existe des différences entre les groupes (bleu et rouge) dont on n’a pas tenu compte dans l’analyse. En les négligeant, on peut donc aboutir à des conclusions qui semblent contradictoires.

L’explication peut simplement être que le nombre d’étudiants du groupe bleus est (nettement) différent de celui du groupe rouge, le nombre d’étudiants est ici le facteur de confusion.

Conclusion : Toujours faire attention aux conclusions tirées à partir de données statistiques, l’erreur écologique, le paradoxe de Simpson et bien d’autres peuvent fausser notre interprétation finale.

Enfin, j’aimerais finir sur une citation d’un économiste, démographe et sociologue français Alfred Sauvy :

« Les chiffres sont des êtres fragiles qui, à force d’être torturés, finissent par avouer tout ce qu’on veut leur faire dire »

L’erreur écologique

L’inférence écologique présentée précédemment m’a fait découvrir ce qu’on appelle l’erreur écologique.

Encore une fois, rien à voir avec l’écologie, l’erreur écologique est tout bonnement une erreur de raisonnement dans l’interprétation de résultats statistiques au niveau individuel à partir de données agrégées.

Autrement dit, lorsqu’on travaille avec des données agrégées, il n’est pas judicieux de tirer des conclusions sur les individus qui composent un cas observé.

Par exemple :

Observer que les pays catholiques ont des partis démocrates-chrétiens forts ne permet pas de dire que les catholiques votent davantage démocrates-chrétiens que les protestants.
C’est possible, mais rien ne le prouve dans notre raisonnement..

Ici, les données agrégées sont : Les pays catholiques ont des partis démocrates-chrétiens forts

L’interprétation au niveau individuel à partir de données agrégées : les catholiques votent davantage démocrates-chrétiens que les protestants.

Un autre exemple :

L’exemple, mais dans le sens inverse.

En mesurant le QI d’un groupe d’individus, on aboutit à un résultat nettement inférieur à celui du QI moyen de la population.

L’erreur écologique est de considérer qu’en prenant un individu au hasard, ce dernier aura un QI inférieur au QI moyen de la population. Rien ne le prouve.

Mathématiquement, cela s’explique par le fait qu’une distribution mathématique peut avoir une moyenne positive, mais une médiane négative.

Enfin, les interprétations se basant uniquement sur la moyenne sont souvent peu pertinentes, c’est pour cela que d’autres mesures existent (médiane, écart-type, asymétrie, etc..)