Prédire les loyers Parisiens, en fonction de la surface et de l’arrondissement

L’article précédent, utilisait un jeu de donnée très simple, contenant uniquement la surface et le prix, cette fois-ci, je m’intéresse en plus du prix et de la surface, à l’arrondissement, et je compte, en plus de réaliser une régression linéaire, voir comment le loyer évolue dans les différents arrondissement de la capitale.

Il est évident que plus la surface est grande, plus le prix augmente, mais qu’en est-il de l’arrondissement ?

Ce violinplot montre que les prix ont plus tendances à s’envoler et à s’écarter de la moyenne dans le 4e et 1er arrondissement, ils sont plus autour de la moyenne dans le dixième arrondissement, et ils sont moins cher en moyenne.

Un diagramme en violon (Violinplot) est similaire à un Boxplot, mais affiche en plus la densité de probabilité, ce qui lui donne la forme d’un violon.

L’affichage précédent, tient compte uniquement de l’arrondissement et du loyer, peut-être que le fait de ne pas tenir compte de la surface est un biais, alors l’idéal est de confirmer ça :

Ce graphique à 3 dimensions, montre comment évoluent les loyers en fonction de la surface et de l’arrondissement, l’intuition précédente sur le 1 et 4e arrondissement se confirme.

Ainsi, selon le modèle :

  • Un 31 m² au 1er arrondissement, le loyer serait : 1362 €
  • Un 31 m² au 10e arrondissement, le loyer serait : 858 €

Code Python :