La méthode CRISP pour les projets Big Data

Article paru le 13 décembre 2017 | Partager sur les réseaux sociaux

Classé dans : Big Data Systèmes décisionnels Tribune

Depuis la révolution numérique et l’explosion du volume de données, nombreuses sont les entreprises qui engagent des projets Big Data. Innovation, meilleurs collecte et traitement des données, meilleurs bénéfices, nouvelles offres et nouveaux marchés… les tentations sont multiples, et les opportunités alléchantes.

Mais le tableau est sombre. Parmi ces innovateurs, beaucoup ne vont pas au-delà du projet pilote ou Proof of Concept (POC), comme le montre une étude du Gartner datant de Juillet 2016 (1). En effet, seuls 15% des projets Big Data atteindraient la phase d’industrialisation.

Les raisons principales de cet échec ? Une indéniable inadéquation entre les attentes (parfois surréalistes) des métiers et la réalité du Big Data, et une mauvaise maîtrise de ces nouvelles technologies. Heureusement, le modèle vertueux du CRISP apporte quelques solutions aux obstacles qui entravent la réussite de ces projets.

CRISP : Une méthode en avance sur son temps

Le CRoss-Industry Standard Process, plus communément appelé CRISP, était initialement dédié à l’exploration de données ou Data Mining (CRISP-DM, DM pour « Data Mining »). Aujourd’hui généralisée à tous les types de projets Big Data, cette intrépide méthodologie, résistante aux vingt-et-une années passées depuis sa création, est toujours de loin la méthodologie la plus populaire dans la mise en place de projets Big Data.

Le consortium CRISP-DM (formé par les compagnies NCR, SPSS, et Daimler-Benz) attribue en 2000 le succès de sa méthodologie à la conduite de projets pratiques d’exploration de données pendant plus de deux ans et demi : « CRISP-DM réussit parce qu’il est fondé sur l’expérience pratique et réelle de la façon dont les gens mènent des projets d’exploration de données » (2).

Loin donc de la théorie, la méthodologie CRISP est également totalement indépendante de l’industrie technologique, des outils et des applications en croissance constante dans le marché puisqu’elle impose un schéma standard applicable à tout type de projet et/ou d’infrastructure.

Par ailleurs, cette méthodologie a la particularité d’adopter une démarche cyclique et itérative, semblable à celle du modèle Agile, permettant une meilleure appréhension des spécificités de chaque projet, comme le montre l’illustration ci-dessous.

CRISP ne propose pas un chemin linéaire unique entre le démarrage du projet et le déploiement. A contrario, l’ensemble du cycle projet a vocation à être itératif, et la marche arrière est non seulement autorisée, mais recommandée : les ajustements en cours de route sont les bienvenus, puisqu’ils permettent de garder le modèle efficace.

Des aspects métiers à ne pas négliger

« Si j’avais une heure pour sauver le monde, je passerais 59 minutes à définir le problème et 1 minute à trouver la solution ».

Cette célèbre phrase d’Albert Einstein démontre ce que de nombreuses méthodologies de traitement de la donnée n’arrivent malheureusement pas à appliquer aujourd’hui : la résolution d’un problème devient un jeu d’enfant dès lors que la problématique métier et les enjeux en sont clairement définis.

En effet, contrairement aux idées reçues, le Big Data est avant tout une réponse à une ou des problématiques métiers spécifiques, et non un ensemble abstrait de technologies complexes. Bien qu’il utilise les apports des statistiques et de la Data Science pour analyser et valoriser la donnée, il est important de garder en mémoire qu’il puise son origine dans un besoin métier préalablement identifié, et qu’il s’inscrit dans un schéma business en accord avec la stratégie globale de l’entreprise.

C’est pour cette raison que CRISP constitue un excellent cadre pour la mise en place d’un projet Big Data : cette méthodologie organisée en six étapes accorde une attention particulière à la définition du besoin et des objectifs métiers, ainsi qu’à l’échange et la collaboration continus entre le métier et l’équipe projet. Chaque itération renforce d’ailleurs la connaissance métier, et confirme la problématique et l’adéquation de la solution avec le besoin, jusqu’à la phase de déploiement final du projet.

Une évolution vers plus d’agilité

Bien que prônant le modèle itératif et les nombreuses possibilités de retours en arrière, force est de constater que la méthode CRISP peut dans certains cas manquer d’agilité.

Dans un monde ivre d’incertitudes, où le besoin métier évolue rapidement, la mise en place d’un dialogue régulier entre les équipes projets et les équipes techniques devient indispensable. Ainsi, en complément du mode itératif caractéristique du CRISP, l’association d’un framework agile permettra une plus grande réactivité face aux changements. Scrum, Kanban, Lean, aucune méthodologie agile n’est incompatible avec CRISP. Chacune des six étapes de la méthodologie CRISP peut alors être assimilée à une user story, en mettant la production de valeur au centre de chaque itération.

En somme, bien que tout projet soit unique, la méthodologie CRISP semble être la plus adaptée à la conduite de projets Big Data, à condition qu’elle soit appliquée dans son intégralité. En effet, aucune étape n’est superflue, seul le temps passé sur chacune d’elle peut varier d’un projet à un autre, voire d’une itération à une autre.

Cependant, aucune méthodologie n’est parfaite, et la clé de la réussite résidera toujours dans l’implication constante des métiers pour une amélioration continue du produit final. Après tout, comme disait le statisticien George E.P.BOX “All models are wrong, but some are useful" (traduction : Tous les modèles sont faux mais certains sont utiles).

Tribune d’Alianor SIBAI, consultante mc2i Groupe

Lire la tribune sur le site : Solutions numériques

Partagez cet article sur les réseaux sociaux