PIB Mondial & émissions de CO2

La production de richesse, nécessite et consomme de l’énergie, cette énergie au niveau mondial, est principalement émettrice de CO2.

Il est parait donc raisonnable de réfléchir comme suit :

  • Plus on produit de richesse, plus on consomme de l’énergie.
  • Cette énergie étant majoritairement polluante (En tout cas pour l’instant).
  • Donc : Plus on produit de richesse, plus on pollue.

Pour voir si la production de l’énergie et le PIB mondial sont bien corrélés, rien de mieux que d’afficher tout ça !

L’hypothèse de départ se confirme (sans surprise) la corrélation est bien présente, et on peut même parler, dans ce cas, de causalité.

La crise de 2008 a provoqué un fort recul du PIB mondial, l’économie étant ralenti, cette dernière consomme moins d’énergie, et de ce fait, pollue moins.

Données du PIB.

Données du CO2.

Sentiment Analysis en Python

En informatique, le sentiment analysis est l’analyse des sentiments à partir de sources textuelles dématérialisées sur de grandes quantités de données (big data).

Ce procédé apparait au début des années 2000 et connait un succès grandissant dû à l’abondance de données provenant de réseaux sociaux, notamment celles fournies par Twitter.
Il a pour objectif d’analyser une grande quantité de données afin d’en déduire les différents sentiments qui y sont exprimés. Les sentiments extraits peuvent ensuite faire l’objet de statistiques sur le ressenti général d’une communauté.

Il peut aussi être utilisé pour l’étude de paroles de chansons ou de discours politiques.

Plus surprenant, une étude a montré que le taux d’émotion sur Twitter (espoir, peur, joie) était proportionnel à l’évolution des indices boursiers !

Pour explorer cette démarche, j’ai procédé comme suit :

  • Tirer 10000 tweets parlant du covid-19.
  • Tirer 10000 tweets de manières aléatoires (peu importe leurs sujets).
  • Réaliser des nuages de mots pour chacun des tirages
  • Voir si des mots premiers tirages, se retrouvent dans le second; le cas échéant, ça signifierait que les tweets parlant du covid sont assez récurrents pour apparaitre dans ceux tirés aléatoirement, ce qui n’est guère surprenant vu le contexte .

Les résultats :

Tirage de tweets contenant covid-19 : Sans surprise, la plupart des mots reflètent des éléments d’actualités.

Tirage aléatoire de tweets

Code Python :

Le mois de mai le plus chaud depuis 1979

Le programme Copernicus, a publié récemment un article affirmant qu’au niveau de la planète, nous venons de traverser le mois de mai le plus chaud depuis 1979 (date du début d’enregistrement des données) les données étant publiques, un petit programme informatique permet de confirmer ça !

Par ailleurs, il y’a de fortes chances que les images utilisées par Copernicus soit également faites en Python.

Avant 2020, mai 2016 était le mois le plus chaud

En affichant tous les mois et toutes les années on obtient :

La tendance à la hausse est clairement visible !

Code Python :