Les arbres connectés d’Issy-les-Moulineaux

Le code QR a été créé par Masahiro Hara, ingénieur de l’entreprise japonaise Denso-Wave, en 1994 pour suivre le chemin des pièces détachées dans les usines de Toyota, Il est rendu public en 1999.

QR Code (de l’anglais Quick Response) signifie que le contenu du code peut être décodé rapidement après avoir été lu par un lecteur de code-barres, un smartphone par exemple.
Son avantage est de pouvoir stocker plus d’informations qu’un code à barres, et surtout, il permet de déclencher facilement des actions depuis son téléphone.

Depuis peu, la ville d’Issy-les-Moulineaux a mis en place des QR Code pour 50 arbres dans la ville, ces derniers donnent accès à un site mobile personnalisé, illustré et multimédia (photographies, vidéos, bandes-son) donnant accès à un descriptif complet sur l’arbre.

Étant donné que la ville contient bien plus que 50 arbres, tous les trouver de façon aléatoire risque de prendre pas mal de temps.
Puisque la ville a rendu publiques les données concernant les arbres, et notamment leurs emplacements, l’Informatique peut intervenir !

Je penserai à aller voir le Sephora du Japon à mon prochain passage à Issy !

Code Python :

Quartet d’Anscombe en Python

En 1973, le statisticien Francis Anscombe a construit un jeu de données constitué de 4 ensembles (d’où le nom Quartet d’Anscombe) dans le but de démontrer l’importance de tracer des graphiques avant d’analyser des données, car cela permet notamment d’estimer l’incidence des données aberrantes sur les différents indices statistiques que l’on pourrait calculer.

Ces jeux de données possèdent les mêmes propriétés statistiques suivantes :

  • Même moyenne
  • Même variance
  • Même coefficient de corrélation
  • Même équation de droite de régression linéaire
  • Même somme des carrés des erreurs relativement à la moyenne

Malgré les fortes similarités, leurs représentations graphiques sont radicalement différentes, ce qui montre le rôle indispensable des graphiques dans chaque analyse de données !

Source des données : Wikipédia

Code Python :

Le théorème central limite en Python

En théorie des probabilités et en statistique, les lois normales sont parmi les lois de probabilité les plus adaptées pour modéliser des phénomènes naturels issus de plusieurs événements aléatoires.

Aussi, le théorème central limite (aussi improprement appelé théorème de la limite centrale ou centrée) établit la convergence en loi de la somme d’une suite de variables aléatoires (indépendantes, et identiquements distribuées) vers la loi normale.

Intuitivement, ce résultat affirme que toute somme de variables aléatoires indépendantes tend dans certains cas vers une variable aléatoire gaussienne.

Notre simulation vise à reproduire ce résultat, mais en utilisant le théorème central limite.

En sommant par colonne, les résultats d’un tirage aléatoire d’une matrice de taille 10000 x 10000, on obtient :

L’histogramme se rapproche fortement de la courbe en cloche, c’est l’illustration du TCL.

Code Python :