Alatation, un outil collaboratif de SQL pour une meilleure data gouvernance

Lorsque vous êtes plusieurs analystes à travailler sur des bases de données et que l’activité croit, il arrive un moment où inévitablement les différences dans les résultats générés par les requêtes SQL écrites par les analystes apparaissent et où savoir quelle table utiliser devient…compliqué.

Pour analyser un sujet donné, les tables utilisées, les filtres mis en place dans les requêtes ne vont pas donner systématiquement les résultats d’un analyste à un autre dans une organisation mature à l’architecture de données complexe. Un analyste aura par exemple utilisé une table brute de logs, tandis qu’un autre, pour mesurer la même chose, sera passé par un autre datamart. Les résultats seront proches mais pas forcément très précis.

Cela va si l’output souhaité correspond à des données high level mais beaucoup moins quand il s’agit d’extraire des informations pour préparer une newsletter ou une communication qui partira dans des boîtes mails de milliers d’individus. La précision est de mise dans ce dernier axe. De même lorsque vous devez être très précis dans vos calculs ou que vous analyser un épiphénomène.

La connaissance de chaque analyste des bases de données existantes se réduit à mesure que l’organisation grandit: les tables à utiliser, les data model, les datamarts existants se multiplient rapidement et chaque analyste de données devient rapidement spécialiste d’un sujet, d’un domaine. Les échanges d’information ne sont pas toujours facilement et quand il s’agit de récupérer rapidement une information ou de savoir comment untel à écrit telle ligne de code pour tomber sur ce résultat, l’effet d’apprentissage et de transmission de la connaissance peut être parfois très long.

alation

Dans les « nouveaux » outils SQL, Alation est vraiment une solution chouette à tester. L’outil est disponible dans une version client web et client desktop. Il permet bien évidemment à chaque analyste qui dispose d’un compte utilisateur, d’écrire et d’exécuter des requêtes SQL directement sur les bases de données comme n’importe quel client SQL classique.

Sa force réside dans l’aspect collaboratif et sa gestion de la méta-data. Les requêtes SQL peuvent être « validées » par son auteur et chaque analyste peut rapidement retrouver du code écrit par d’autres analystes.  Très pratique, surtout si la validation vient directement d’un DBA. Des « brouillons » non publiés sont accessibles aussi, permettant de ne pas perdre l’effet de partage entre les analystes.

La documentation des modèles de données et des tables pose régulièrement des problèmes de manière générale dans les organisations. Alation donne de précieuses informations sur chaque table: quels sont les champs les plus utilisés? Qui sont les principaux utilisateurs de la table – très pratique pour identifier immédiatement le contact pertinent ? Quelles sont les requêtes qui ont été exécutées contentant cette table. Cette information qui n’est jamais disponible immédiatement – sauf pour un DBA – l’est ainsi directement grâce à Alation.

Des discussions peuvent aussi avoir lieu et des commentaires être écrits ce qui permet rapidement en cas de doute de le noter et de partager l’information avec le reste de la communauté analytique et à un nouvel utilisateur d’apprendre très rapidement. Ces commentaire permettent, sans l’avoir demandé, de récupérer de l’information et de créer des ponts entre les analystes.

Toutes ces fonctionnalités permettent de partager rapidement l’information et de garantir une meilleure data gouvernance en aval dans la chaîne de traitement de l’information par ceux qui produisent de l’information en interne, souvent source de décisions business.

Précisez votre besoin, nous nous chargeons de vous trouver les bons contacts suivant votre besoin.