Text Mining : Comment exploiter la valeur de vos données textuelles ?

Article paru le 21 février 2017 | Partager sur les réseaux sociaux

Classé dans : Big Data Systèmes décisionnels

Qu’est-ce que le Text Mining ?

Gartner définit le Text Mining comme « Le processus d’extraction des informations à partir de collections de données textuelles et leurs utilisations pour des objectifs d’entreprises »

Le Text Mining, ou exploration de texte, s’efforce de résoudre le problème de surcharge d’informations textuelles en combinant des techniques d’exploration de données, d’apprentissage automatique, de recherche et d’extraction d’informations ou encore de traitement du langage naturel (NLP) qui permettent la compréhension du discours humain par les programmes informatiques.

Le processus de Text Mining se décompose en trois grandes étapes qui sont : le prétraitement des documents, l’analyse des représentations intermédiaires, et la restitution des résultats.

Le prétraitement

Les techniques de prétraitement, centrées sur l’identification et l’extraction des caractéristiques des données textuelles, sont utilisées pour transformer les données textuelles non structurées en un format intermédiaire structuré qui est stocké dans une base de données.

Cette transformation des documents repose sur différentes techniques d’identification des données textuelles notamment des techniques de NLP comme l’extraction des éléments, l’étiquetage grammatical (Part of Speech Tagging) qui identifie les rôles et relations de chaque mot et l’analyse syntaxique qui permet de comprendre le sens des phrases dans leur ensemble.

Les informations pertinentes sont ensuite extraites de ces représentations intermédiaires à l’aide d’algorithmes d’analyse de tendances et de modèles.

L’analyse des représentations

Les analyses Text Mining reposent principalement sur l’étude des modèles de cooccurrence de concepts dans les documents étudiées. Les systèmes d’analyses s’appuient sur des approches algorithmiques et heuristiques qui prennent en compte les distributions, les ensembles fréquents et les associations d’éléments pour découvrir les différents concepts et leurs relations dans l’ensemble des documents étudiés.

La restitution

La restitution des solutions de Text Mining repose sur un système de navigation. De nombreux systèmes d’exploitation de texte favorisent la navigation dynamique permettant une exploration guidée par le contenu des documents et non par des structures prédéfinies. La navigation est facilitée pour l’utilisateur en fournissant une présentation graphique des modèles conceptuels sous la forme d’une hiérarchie facilitant les recherches et les analyses.

Quelles applications pour le Text Mining ?

Le Text Mining permet aux entreprises d’analyser les performances des produits et services qu’elles offrent à leurs clients. Il leur permet également de découvrir des informations sur leurs marchés et leurs concurrents en analysant les revues de presse ou d’autres sources pertinentes.

Le Text Mining permet par exemple de surveiller l’opinion du marché afin d’identifier de nouveaux clients potentiels, les positions des concurrents et de déterminer l’image de l’organisation. Ces analyses s’appuient sur les opinions publiées sur Internet (Réseaux sociaux, sites de e-commerce, etc.) et l’ensemble des interactions avec les clients pour analyser leurs sentiments positifs ou négatifs exprimés sur différents sujets.

L’exploration de texte dans les CRM est le plus souvent utilisée dans les domaines liés au traitement et à l’analyse du contenu des messages clients. Ces analyses permettent le plus souvent de tirer des conclusions commerciales ou opérationnelles.

Elles permettent d’identifier des groupes de clients « modèles » qui partagent les mêmes caractéristiques et les mêmes intérêts, ou encore, de déterminer les schémas d’achat des clients au fil du temps. Elles peuvent, par ailleurs, permettre de rediriger automatiquement les demandes spécifiques vers le service approprié, ou de fournir des réponses immédiates aux questions les plus fréquemment posées.

Les techniques d’exploration de texte sont également utilisées pour gérer les ressources humaines avec des logiciels permettant d’analyser les opinions du personnel, à contrôler le niveau de satisfaction des employés, ou encore à lire et à stocker des CV pour la sélection de nouveaux employés.

Le Text Mining a encore d’autres domaines d’application notamment dans la détection des fraudes ou encore la recherche médicale.

L’explosion du volume de données textuelles disponibles représente un réel défi faisant place à davantage d’opportunités pour les entreprises. Toutefois, les technologies de Text Mining ont encore beaucoup à tirer de leurs proches cousines du Data Mining, notamment pour étendre leur capacité à découvrir de l’information et à créer de la valeur à partir de ces données.

Partagez cet article sur les réseaux sociaux