L’erreur écologique

L’inférence écologique présentée précédemment m’a fait découvrir ce qu’on appelle l’erreur écologique.

Encore une fois, rien à voir avec l’écologie, l’erreur écologique est tout bonnement une erreur de raisonnement dans l’interprétation de résultats statistiques au niveau individuel à partir de données agrégées.

Autrement dit, lorsqu’on travaille avec des données agrégées, il n’est pas judicieux de tirer des conclusions sur les individus qui composent un cas observé.

Par exemple :

Observer que les pays catholiques ont des partis démocrates-chrétiens forts ne permet pas de dire que les catholiques votent davantage démocrates-chrétiens que les protestants.
C’est possible, mais rien ne le prouve dans notre raisonnement..

Ici, les données agrégées sont : Les pays catholiques ont des partis démocrates-chrétiens forts

L’interprétation au niveau individuel à partir de données agrégées : les catholiques votent davantage démocrates-chrétiens que les protestants.

Un autre exemple :

L’exemple, mais dans le sens inverse.

En mesurant le QI d’un groupe d’individus, on aboutit à un résultat nettement inférieur à celui du QI moyen de la population.

L’erreur écologique est de considérer qu’en prenant un individu au hasard, ce dernier aura un QI inférieur au QI moyen de la population. Rien ne le prouve.

Mathématiquement, cela s’explique par le fait qu’une distribution mathématique peut avoir une moyenne positive, mais une médiane négative.

Enfin, les interprétations se basant uniquement sur la moyenne sont souvent peu pertinentes, c’est pour cela que d’autres mesures existent (médiane, écart-type, asymétrie, etc..)