Sentiment Analysis en Python

En informatique, le sentiment analysis est l’analyse des sentiments à partir de sources textuelles dématérialisées sur de grandes quantités de données (big data).

Ce procédé apparait au début des années 2000 et connait un succès grandissant dû à l’abondance de données provenant de réseaux sociaux, notamment celles fournies par Twitter.
Il a pour objectif d’analyser une grande quantité de données afin d’en déduire les différents sentiments qui y sont exprimés. Les sentiments extraits peuvent ensuite faire l’objet de statistiques sur le ressenti général d’une communauté.

Il peut aussi être utilisé pour l’étude de paroles de chansons ou de discours politiques.

Plus surprenant, une étude a montré que le taux d’émotion sur Twitter (espoir, peur, joie) était proportionnel à l’évolution des indices boursiers !

Pour explorer cette démarche, j’ai procédé comme suit :

  • Tirer 10000 tweets parlant du covid-19.
  • Tirer 10000 tweets de manières aléatoires (peu importe leurs sujets).
  • Réaliser des nuages de mots pour chacun des tirages
  • Voir si des mots premiers tirages, se retrouvent dans le second; le cas échéant, ça signifierait que les tweets parlant du covid sont assez récurrents pour apparaitre dans ceux tirés aléatoirement, ce qui n’est guère surprenant vu le contexte .

Les résultats :

Tirage de tweets contenant covid-19 : Sans surprise, la plupart des mots reflètent des éléments d’actualités.

Tirage aléatoire de tweets

Code Python :

L’expérience de la chambre chinoise

La chambre chinoise expérience de pensée proposée par Searle, et vise à montrer qu’une intelligence artificielle ne peut être qu’une intelligence artificielle faible et ne peut que simuler une conscience, plutôt que de posséder d’authentiques états mentaux de conscience et d’intentionnalité (comme les êtres humains).

Elle vise à montrer également que le test de Turing est insuffisant pour déterminer si une intelligence artificielle est comparable à un humain dans son raisonnement.

L’expérience se présente comme suit :

  • Une personne A qui n’a aucune connaissance du chinois est enfermée dans une chambre.
  • On met à disposition de cette personne un catalogue de règles permettant de répondre à des questions en chinois.
  • La personne A enfermée dans la chambre, reçoit de la part d’une personne B des questions écrites en chinois et, en appliquant les règles qu’elle a à sa disposition, elle produit d’autres phrases en chinois qui sont parfaitement claires, et du niveau d’un locuteur de chinois.

Ainsi, du point de vue du locuteur qui pose les questions (la personne B), la personne A enfermée dans la chambre parle parfaitement le chinois.
Mais, en l’occurrence, cette dernière n’a aucune compréhension de la signification des phrases en chinois qu’elle compose, elle ne fait que suivre des règles prédéterminées dans le catalogue.

Illustration de l’expérience

Cette expérience de pensée suggère qu’il ne suffit pas d’être capable de reproduire exactement les comportements linguistiques d’un locuteur chinois pour parler chinois (ou toute autre langue).

Pour Searle, un usage maîtrisé du langage se double d’une conscience du sens de ce qu’on dit (ce qui n’est pas le cas de A) et la reproduction artificielle, même parfaite, d’un comportement linguistique ne suffit pas à produire une telle conscience, autrement dit les tests de Turing ne sont suffisants pour juger de l’intelligence d’une machine.

Le test de Turing

Le test de Turing est une proposition de test d’intelligence artificielle fondée sur la faculté d’une machine à imiter la conversation humaine.
Il est décrit par Alan Turing en 1950.

Ce test consiste à mettre un humain (qui est un arbitre) en confrontation verbale et à l’aveugle avec un ordinateur et un autre humain.

Si l’arbitre n’est pas capable de dire lequel de ses interlocuteurs est un ordinateur et lequel est un humain, on peut considérer que l’ordinateur a passé avec succès le test de Turing.
Bien sûr, la machine peut volontairement donner de fausses réponses pour se faire passer pour un humain.

Alan Turing a imaginé ce test pour répondre à sa question existentielle : « une machine peut-elle penser ? » Pour lui, si la machine peut être confondue avec un humain, alors oui, une machine peut penser.

Une nuance importante à apporter, est que ce test ne détermine pas directement si l’ordinateur se comporte de façon intelligente, cela teste seulement si l’ordinateur se comporte comme un être humain. (le comportement intelligent et les comportements humains ne sont pas exactement la même chose, il y’a inclusion, mais pas égalité).

En effet, l’hypothèse forte et implicite est que les êtres humains peuvent juger de l’intelligence d’une machine en comparant son comportement avec le comportement humain (qui lui, est donc la référence pour juger de l’intelligence).

De plus, si l’intelligence transparaît à travers son comportement – en l’occurrence ici, les réponses – elle peut parfaitement être simulée, mais c’est un sujet pour un autre article !