La sagesse de la foule

La sagesse de la foule est l’idée qu’un grand nombre d’amateurs peut mieux répondre à une question qu’un seul expert. C’est une théorie émergente, popularisée notamment par le journaliste américain James Surowiecki.

3 ingrédients doivent être réunis pour parvenir à révéler l’intelligence de la foule :

  1. La diversité : avoir des personnes de divers milieux avec des idées originales ;
  2. L’indépendance : permettre à ces avis divers de s’exprimer sans aucune influence ;
  3. La décentralisation : laisser ces différents jugements s’additionner plutôt que de laisser une autorité supérieure choisir les idées qu’elle préfère.

Tous ces ingrédients sont favorisés par internet qui est par définition, un réseau décentralise et permet une diversité d’opinions.

https://ncase.me/crowds/sprites/bonus/surowieki.jpg
James Surowiecki et son best-seller.

Aristote avait déjà évoqué l’idée de Sagesse des foules dans son ouvrage La Politique, il écrit : « La Majorité, dont chaque membre pris à part n’est pas un homme remarquable, est cependant au-dessus des hommes supérieurs. »

De même, le théorème de Condorcet considère que la probabilité qu’une délibération – au sein d’un groupe nombreux – tende vers une conclusion optimale et rationnelle est supérieure à celle d’un groupe restreint.

La règle 68-95-99,7

En statistique, la règle 68-95-99,7 (appelée aussi la règle des trois sigmas ou règle empirique) indique que pour une loi normale, presque toutes les valeurs se situent dans un intervalle centré autour de la moyenne et dont les bornes se situent à 3 écarts-types de part et d’autre.

En résumé, cette règle stipule que :

  1. 68,27% des valeurs se situent à moins de 1 écart-type de la moyenne.
  2. 95,45% des valeurs se situent à moins de 2 écarts-types de la moyenne.
  3. 99,73% des valeurs se situent à moins de 3 écarts-types de la moyenne.
https://upload.wikimedia.org/wikipedia/commons/thumb/2/22/Empirical_rule_histogram.svg/640px-Empirical_rule_histogram.svg.png?1630072271321
Illustration de la règle empirique.

Les lois normales sont parmi les lois de probabilité les plus utilisées pour modéliser des phénomènes naturels issus de plusieurs événements aléatoires, comme le montre la Planche de Galton, la règle des 68-95-99.7 s’appliquera naturellement !

La Loi de Benford

Dans une série de nombres, on pourrait s’attendre à voir les chiffres de 1 à 9 apparaître à peu près aussi fréquemment comme premier chiffre de chacun des nombres, soit avec une fréquence de 1/9 = 11,1 % pour chacun.

Contrairement à cette intuition, la série suit très souvent approximativement la loi de Benford, cette loi fait référence à une fréquence de distribution statistique observée empiriquement sur de nombreuses sources de données dans la vraie vie, ainsi qu’en mathématiques.

La loi de Benford montre la fréquence d’apparition des chiffres.

En effet, dans notre série de nombres, pour un tiers des données, le 1er chiffre significatif le plus fréquent est le 1. Viennent ensuite le chiffre 2, puis le 3, etc.

Cette loi est observée aussi bien dans les sciences humaines et sociales, en physique, en volcanologie, génétique, en BTP, en économie ..

Pour tout c entre 1 et 9 (c étant le premier chiffre), la loi s’exprime comme suit : log(1 + 1/c).

Aujourd’hui, on utilise par exemple la loi de Benford pour détecter les fraudes fiscales : si quelqu’un invente des chiffres pour cacher ses revenues, ces derniers ne suivront probablement pas la loi de Benford.