Inutile de rappeler qu’à Paris, les logements sont un vrai parcours du combattant, l’informatique étant un de mes violons d’Ingres, j’ai voulu mettre à l’épreuve la régression linéaire face aux loyers de la capitale.
Pour rappel, un modèle de régression linéaire cherche à établir une relation linéaire (y = ax+b) entre une variable, dite expliquée, et une ou plusieurs variables, dites explicatives.
Le jeu de données utilisé provient d’openclassrooms, et contient 2 informations :
- La surface du logement
- Son prix
Ici, la variable expliquée est donc le prix des loyers, et la variable explicative est la surface.
À partir de ces 2 informations, il est possible d’entraîner un modèle, puis de réaliser des estimations du prix, et ce, en fonction de la surface fournie.
Ainsi, selon le modèle, un 31m² à Paris devrait coûter 1217€ par mois, en regardant les différentes annonces, pour un modèle prenant en compte uniquement la surface, je trouve que ce n’est pas très loin de la réalité !
Code Python :