Informatique – Page 7 – Blog personnel de Lyes Meghara

5 février 20206 février 2020

Les salaires moyens à Paris

Le traitement de données devient un enjeu crucial à notre époque, où les données sont produites par milliard chaque jour, c’est une compétence indispensable, notamment aux informaticiens intervenants sur ces thématiques, associées à celles de l’intelligence artificielle.

Mais le traitement seul de ces données n’est que la première étape ! Il faut pouvoir visualiser ces données de manières simples, et avoir un esprit d’analyse et le recul nécessaire permettant de tirer les conclusions et de prendre les bonnes décisions sur la base de ces données visualisées.

J’ai voulu me remettre à Power BI, mais hélas, ce n’est pas possible d’inclure des visualisations sur un site internet avec la licence gratuite, ce qui m’a permis de découvrir un autre outil qui le permet, Tableau !

Une étude de l’Insee sur les salaires moyens fournit des chiffres de 2012 à 2016, j’ai donc repris cette étude pour réaliser ce graphique interactif, moyennant quelques retraitements.

NB : J’affiche le salaire moyen, par arrondissement et par an, sans distinctions de sexe, d’âge, ou de catégorie socioprofessionnelle.

Quelles conclusions tirer à partir de ce graphique ?

Tout l’intérêt réside ici, afficher est bien, mais interpréter est encore mieux.
Ce que j’ai retenu personnellement sont les choses suivantes :

L’arrondissement le plus riche (en termes de salaire moyen) est le 7e, et non le 16 comme on pourrait le penser.
Les arrondissements 6,7,8 et 16, sont bien au-dessus des autres, avec des salaires moyens allant de 1.5 à 2.5 des autres .
Le 6e arrondissement a dépassé le 8e en 2014, avant de retrouver sa place originale en 2016, on peut se poser la question, que s’est-il passé dans ces 2 arrondissements entre ces 2 dates ?
Dans tous les arrondissements, le salaire moyen n’augmente pas chaque année.
Dans certains arrondissements, le salaire moyen augmente moins vite que l’inflation (Le 20e par exemple)

Compte tenu des informations limitées (On ne prend pas en compte le nombre d’habitants, la population active, la catégorie socioprofessionnelle, etc..) il ne serait pas prudent de tirer d’autres conclusions et de généraliser, il ne faudrait pas commettre une erreur écologique !

2 février 2020

Un jour = une citation …En Python

Quand j’étais plus jeune, j’avais un calendrier qui, pour chaque jour de l’an, avait une citation différente, j’ai appris tellement de citations grâce à ça !

J’ai donc eu l’idée de recréer ce système, sous forme de programme informatique en Python, de manière à ce que je reçoive chaque matin, un mail indiquant la citation du jour, de quoi bien commencer la journée !

L’idée est très simple, il suffit de sélectionner de façon aléatoire une citation, de l’envoyer par mail, et de faire ça chaque jour de l’année.

À moi les citations philosophiques 😀

Code Python :

27 janvier 202027 janvier 2020

Prédire les loyers Parisiens, en fonction de la surface et de l’arrondissement

L’article précédent, utilisait un jeu de donnée très simple, contenant uniquement la surface et le prix, cette fois-ci, je m’intéresse en plus du prix et de la surface, à l’arrondissement, et je compte, en plus de réaliser une régression linéaire, voir comment le loyer évolue dans les différents arrondissement de la capitale.

Il est évident que plus la surface est grande, plus le prix augmente, mais qu’en est-il de l’arrondissement ?

Ce violinplot montre que les prix ont plus tendances à s’envoler et à s’écarter de la moyenne dans le 4e et 1er arrondissement, ils sont plus autour de la moyenne dans le dixième arrondissement, et ils sont moins cher en moyenne.

Un diagramme en violon (Violinplot) est similaire à un Boxplot, mais affiche en plus la densité de probabilité, ce qui lui donne la forme d’un violon.

L’affichage précédent, tient compte uniquement de l’arrondissement et du loyer, peut-être que le fait de ne pas tenir compte de la surface est un biais, alors l’idéal est de confirmer ça :

Ce graphique à 3 dimensions, montre comment évoluent les loyers en fonction de la surface et de l’arrondissement, l’intuition précédente sur le 1 et 4e arrondissement se confirme.

Ainsi, selon le modèle :

Un 31 m² au 1er arrondissement, le loyer serait : 1362 €
Un 31 m² au 10e arrondissement, le loyer serait : 858 €

Code Python :