Je suis l’Opinion Mining

Article paru le 17 mars 2015 | Partager sur les réseaux sociaux

Classé dans : Big Data Systèmes décisionnels Tribune

Le commencement

Démarrons en 2012 lorsque des projets ont commencé à voir le jour sur un sujet encore peu connu : l’Opinion Mining. L’idée était de créer un modèle d’analyse basé sur les échanges collectifs « peer to peer » présents dans les réseaux sociaux et les blogs.

L’Opinion Mining peut se définir comme une sous-discipline informatique, à la frontière avec l’analyse linguistique, permettant de répondre aux questions suivantes :

  • Quelle est la partie du message exprimant une opinion ?
  • Qui est l’auteur ?
  • Quelle partie du texte a été commentée ?

Les experts avaient compris que l’explosion des réseaux sociaux permettrait aux internautes de faire entendre leurs avis. Mais le problème n’était finalement pas tant la quantité de données que la façon de les analyser : interpréter le langage humain reste, encore aujourd’hui, un challenge important, tant par la richesse d’une langue que par ses subtilités.

Quel est le support permettant de faire ces analyses ?

Twitter reste le réseau social permettant la meilleure analyse des messages de ses utilisateurs. Les messages sont généralement courts et assez clairs, et le principe de retweetage permet de mesurer l’impact d’une publication. De plus, Twitter met en open source des archives de ses tweets, permettant à des systèmes d’analyses de données de faire rapidement des reporting.

Autre outil d’analyse, Google Trends, issu de Google Labs, permet de connaître la fréquence de recherche d’un terme dans Google, avec la possibilité de visualiser ces données par région et par langue.

Mais alors comment extraire les informations des messages ?

Stefan Gindl et Arno Scharl de la MODUL University de Vienne ont développé une méthodologie d’analyse de textes complexes qui comprend les étapes suivantes :

  1. Identifier les termes qui peuvent être ambigus en fonction du sentiment du rédacteur
  2. Fournir des informations sur le contexte et l’intégrer dans le processus d’apprentissage automatique.
  3. Contribuer à une intelligence artificielle basée sur la logique formelle.

Depuis quelques années, de nombreux scientifiques et sociologues ont fait progresser les logiciels d’Opinion Mining. Il reste néanmoins de nombreux défis encore difficiles à relever, notamment :

  • Le filtrage des spams et des doublons ;
  • Le développement de l’apprentissage autonome des machines et leur intelligence artificielle ;
  • La détection de l’ironie.

Un visuel avec Hedonometer.org

Hedonometer est basé sur les travaux de recherche de Peter Dodds et Chris Danforth de la University of Vermont. Cet outil sélectionne un échantillon des derniers tweets publiés et injecte les mots écrits en anglais dans un système d’analyse qui attribue à chaque message un score de « bonheur » sur la base des mots qu’il contient.

Tribune d’Emmanuelle Claeys, consultante @mc2iGroupe.

Lire la tribune sur le site : Decideo.fr

Partagez cet article sur les réseaux sociaux