Qu’est ce que l’OLAP (définition) ?

l’OLAP ou On-Line Analytical Processing est un terme qui revient régulièrement dans les discussions d’informaticiens en charge de mettre en place un ou plusieurs systèmes d’analyse de données.

L’OLAP, une brève définition.

L’olap est un processus informatique qui permet d’extraire et d’analyser des données sous plusieurs angles. Par exemple, vous souhaitez obtenir des données de ventes sur les 3 derniers mois sur les pays européen filtrés sur une seule gamme de produit? L’olap vous permettra d’extraire ces informations relativement rapidement. Les données en OLAP sont enregistrées dans des bases multidimensionnelles, qui sont en fait des tables ayant préalablement calculées tous les croisements de données possibles.

Imaginez, pour rendre cela plus concret, une fichier excel avec une table permettant de faire un tableau croisé dynamique. De façon très simple et réductrice, les données préparées ressemblent à ces données contenues dans le fichier excel. Chaque ligne contient des données pour un sous-ensemble de données précises. Ces bases multidimensionnelles sont aussi appelées communément « cube », à l’occasion si vous entendez parler de ce terme. Le principe est donc le même. Ces données sont en revanche créées par un informaticien qui saura aller récupérer ces données dans des tables situées en amont du process de transformation de données.

Les logiciels utilisant cette technologie OLAP peuvent rapidement, en fonction de la formule utilisée et de la sélection de données (par exemple, Italie, Juin 2010, chiffre d’affaires), repérer le croisement de données et rapatrier ces données pour les rendre visibles et utilisables à l’utilisateur final. Les attributs comme le temps peuvent être désagrégées en plusieurs sous-attributs comme les semaines, les trimestres ou les journées.

Les données sont ainsi préparées en amont dans des datamarts permettant de stocker et de pré-calculer suivant une fréquence définie des « cubes ». Ces rechargements de données peuvent être quotidiens, hebdomadaires ou mensuels, il n’y a pas de règle en la matière. Plus le cube sera volumineux – et donc plus celui-ci contiendra de données et de dimensions, plus le temps de rapatriement des données risque d’être long et donc fastidieux pour l’utilisateur. Pour cette raison, les informaticiens préfèrent généralement créer plusieurs cubes ou bases multidimensionnelles de façon à garantir une expérience utilisateur optimale.