Dans le domaine commercial et scientifique, la plupart des organisations font la distinction entre quatre formes différentes d’identification de modèles dans les ensembles de données :
- l’analyse des données
- Analytique
- Intelligence économique (BI)
- le Big Data.
Bien que ces quatre définitions soient étroitement liées, il existe des différences subtiles entre les termes qui ont un impact sur la conception des solutions Big Data.
Analyse des données
L’analyse des données est un processus qui consiste à inspecter, nettoyer, transformer et modéliser des données dans le but de découvrir des informations utiles, de suggérer des conclusions et de soutenir la prise de décision.
L’analyse des données a de multiples facettes et approches, englobant diverses techniques sous une variété de noms, dans différents domaines des affaires, des sciences et des sciences sociales.
L’analyse des données – au sens littéral du terme – existe depuis des siècles. L’objectif principal de l’analyse des données est d’examiner les données existantes afin de décrire des modèles qui se sont produits dans le passé. C’est pourquoi on parle aussi fréquemment d’analyse descriptive des données.
Un exemple d’analyse des données serait d’examiner les schémas de vente de différents magasins au cours des dernières années.
Analytique
L’analytique est la découverte, l’interprétation et la communication de modèles significatifs dans les données. Particulièrement précieuse dans les domaines riches en informations enregistrées, l’analytique repose sur l’application simultanée des statistiques, de la programmation informatique et de la recherche opérationnelle pour quantifier les performances.
L’analytique englobe un champ croissant de capacités en matière de science des données, notamment les statistiques, les mathématiques, l’apprentissage automatique, la modélisation prédictive, l’exploration de données, l’informatique cognitive et l’intelligence artificielle.
Il existe quatre catégories d’analytique que les organisations doivent prendre en compte :
L’analytique descriptive
Les analyses descriptives ou l’exploration de données se situent au bas de la chaîne de valeur du big data, mais elles peuvent être précieuses pour découvrir des modèles qui offrent un aperçu.
Un exemple simple d’analyse descriptive serait d’examiner le nombre de personnes ayant visité le site Web de l’entreprise au cours des derniers mois. L’analyse descriptive peut être utile dans le cycle de vente, par exemple, afin de repérer les tendances saisonnières et d’adapter les décisions d’achat en conséquence.
Analyse diagnostique
Les analyses diagnostiques sont utilisées à des fins de découverte ou pour déterminer pourquoi quelque chose s’est produit.
Dans le cadre d’une campagne de marketing sur les médias sociaux, par exemple, l’analyse diagnostique peut être utilisée pour déterminer pourquoi certaines publicités ont entraîné une augmentation des taux de conversion.
Les analyses diagnostiques fournissent des informations précieuses aux organisations, car elles les aident à comprendre quelles décisions ont un impact sur les performances de l’entreprise.
Analyse prédictive
L’analyse prédictive utilise le Big Data pour identifier les modèles passés afin de prédire l’avenir. À partir de tendances ou de modèles dans les ensembles de données existants, les algorithmes prédictifs calculent la probabilité qu’un certain événement se produise.
Par exemple, certaines entreprises utilisent l’analyse prédictive pour le scoring des pistes de vente, en indiquant quelles pistes de vente entrantes auront le plus de chances de se convertir en un client réel.
Une analyse prédictive bien réglée peut être utilisée pour soutenir les ventes, le marketing ou d’autres types de prévisions complexes.
L’analyse prescriptive
L’analyse prescriptive est le dernier niveau d’analyse et le plus précieux. Alors que l’analyse des Big Data en général éclaire un sujet, l’analyse prescriptive vous permet de répondre à des questions spécifiques en vous concentrant comme un laser.
Par exemple, dans le secteur de la santé, vous pouvez mieux gérer la population de patients en utilisant l’analytique prescriptive pour mesurer le nombre de patients cliniquement obèses, puis ajouter des filtres pour des facteurs tels que le diabète et le taux de cholestérol LDL afin de déterminer où concentrer le traitement.
Le même modèle prescriptif peut être appliqué à presque tous les groupes cibles ou problèmes de l’industrie.
Alors que l’analyse des données vise à faciliter la prise de décision en examinant les données passées (analyse descriptive ou diagnostique), l’analyse dans le contexte du Big Data vise principalement à optimiser l’avenir (analyse prédictive ou prescriptive).
À cette fin, l’analytique utilise des algorithmes (complexes) pour trouver des modèles dans les données afin de fournir des conseils sur le meilleur plan d’action possible pour une organisation (c’est-à-dire des recommandations).
Un exemple d’outil d’analyse populaire et largement utilisé est Google Analytics, que les organisations peuvent utiliser pour prédire le trafic d’un site web et optimiser les publicités en ligne.
Business Intelligence
La Business Intelligence (BI) comprend les stratégies et les technologies utilisées par les entreprises pour l’analyse des informations commerciales. La Business Intelligence utilise à la fois l’analyse des données et les techniques d’analyse pour consolider et résumer les informations qui sont spécifiquement utiles dans un contexte d’entreprise.
Le principal défi de la Business Intelligence est de consolider les différents systèmes d’information de l’entreprise et les sources de données en un seul entrepôt de données intégré sur lequel des opérations d’analyse ou d’investigation peuvent être effectuées.
Un entrepôt de données est une (grande) base de données centralisée dans une organisation qui combine une variété de bases de données différentes provenant de différentes sources.
Un exemple d’intelligence économique serait de construire un tableau de bord de gestion qui visualise les indicateurs clés de performance de l’entreprise dans différentes divisions du monde. Vous pouvez visiter ce site pour en savoir plus.
Big Data
Comme nous l’avons vu dans notre précédent article sur les caractéristiques du Big Data, le Big Data a quatre propriétés clés – les quatre V.
Le Big Data utilise à la fois des techniques d’analyse de données et des techniques analytiques et s’appuie fréquemment sur les données des entrepôts de données d’entreprise (tels qu’utilisés dans la BI). En tant que tel, il peut être considéré comme la « prochaine étape » dans l’évolution de la Business Intelligence.
Le Big Data nécessite toutefois une approche différente de la Business Intelligence pour un certain nombre de raisons essentielles.
Les données qui sont analysées dans les environnements Big Data sont plus volumineuses que ce que la plupart des solutions BI traditionnelles peuvent traiter, et nécessitent donc des solutions de stockage et de traitement distinctes et distribuées.
Le Big Data se caractérise par la variété de ses sources de données et inclut des données non structurées ou semi-structurées. Les solutions Big Data doivent, par exemple, être capables de traiter des images ou des fichiers audio.