Qu’est ce que le Datamining ?

Article paru le 11 janvier 2011 | Partager sur les réseaux sociaux

Classé dans :

Le datamining, également appelé fouille de données, est la mise en œuvre de techniques et de méthodes statistiques d’exploration de base de données permettant de mettre en évidence des corrélations (cachées ou non) entre des données. Ces liens peuvent être déclinés en tendances, en règles ou en modèles qui seront utilisés pour analyser de manière plus rapide et plus simple des données transformées en informations.

Il existe deux types de datamining :

  1. le datamining dit descriptif, qui permet de faire ressortir des informations noyées sous un volume trop important de données,
  2. le datamining dit prédictif, qui permet de créer de nouvelles informations qui pourront être utilisées de manière prévisionnelle en terme qualitatif (score) ou quantitatif (prédiction).

Le datamining est la version préventive de l’OLAP (Online Analytical Processing). En effet, si l’OLAP permet de répondre à des questions sur ce qui s’est passé dans l’entreprise (ex : Combien de produits X ai-je vendu cette année ?), le datamining permet de répondre à des questions sur le futur de l’entreprise (ex : Combien de produits X vais-je vendre l’année prochaine ?) mais également de déceler des comportements.
C’est une méthode qui est à la croisée des bases de données, des statistiques et de l’intelligence artificielle, utilisant le passé pour prédire le futur.

Principe du Datamining

Le datamining comporte plusieurs étapes :

  1. En premier lieu, il faut définir la question à laquelle on veut répondre,
  2. Il faut ensuite collecter les données. Cette étape est généralement longue (en moyenne, cela représente 60% du temps de travail du projet) et coûteuse puisqu’il est important d’avoir des données fiables et cohérentes ; dans le cas contraire, une analyse basée sur des données peu fiables pourrait être très préjudiciable à l’entreprise.
  3. Une fois qu’on est assuré d’avoir des données fiables, l’analyse peut commencer, plusieurs méthodes se distinguent :
    1. Techniques de classification et de segmentation
    2. Arbres de décision (proche de la segmentation)
    3. Associations et analogies
    4. Réseaux de neurones (Modélisation, apprentissage, multiples données d’entrées)
    5. Algorithmes génétiques (obtenir une solution approchée en un temps raisonnable)

Il ne faut pas hésiter à tester plusieurs méthodes d’analyse avant de valider les résultats obtenus.

Domaines d’utilisation du datamining

Voici quelques exemples détaillés de domaines d’utilisation du Datamining :

Services financiers :

  • Consentements de prêts automatisés, support à la décision de crédit,
  • Détection des fraudes.

Grande distribution :

  • Profils de consommateurs et modèles d’achats,
  • Constitution des rayonnages,
  • Marketing ciblé.

Ressources humaines :

  • Développement de programmes de recrutement

Toutes ces analyses prédictives permettent à l’entreprise d’anticiper et de prendre ainsi des mesures préventives pour corriger la trajectoire et améliorer les résultats.

Quel avenir pour le Datamining ?

Le datamining tend à se développer. Actuellement, le marché du décisionnel est de 9 milliards de dollars et le datamining en représente un peu plus de 22%. Sachant que près de 85% des entreprises comptent investir dans une solution d’analyse prédictive dans les 5 prochaines années, on peut aisément prévoir une croissance importante dans un avenir proche…

Sources :

- Decideo
- Decideo

Partagez cet article sur les réseaux sociaux