Kaggle, la communauté des data scientists

Si vous vous suivez le monde du big data et des Data scientists, vous serez sûrement intéressé dans ce cas par le site kaggle.com

kaggle-logo

Le Big data et les ressources rares en analystes de données

Les données à manipuler explosent littéralement depuis plusieurs années. Il n’a jamais été aussi peu cher et facile de stocker et de retraiter des données. La numérisation de l’économie, la croissance du e-commerce, l’explosion des smartphone ont mécaniquement engendré une accumulation par les compagnies de datas – et ceux sous toutes leurs formes: Textes, photos, chiffres, données de géolocalisation à profusion, partout et tout le temps.

Si stocker et mettre en place des services numériques et relativement aisé, trouver les personnes ayant les compétences pour analyser ces données n’est en revanche pas évident du tout comme en témoignent les nombreuses offres d’emploi pour des postes de data analysts et autres data scientists que l’on trouve en permance sur les sites d’emploi et les nombreuses sollicitations en provenance de cabinets de chasseurs de tête.

La promesse est la suivante: ces tonnes de données recèlent des informations précieuses permettant d’optimiser les produits, optimisations cumulées qui viendront se transformer en dollars sonnants et trébuchants. Encore faut-il avoir les moyens de trouver et de motiver ces chercheurs d’or de la data, qui viendront creuser, analyser, modéliser, disséquer, retraiter, manipuler, chaque octet, chaque table, chaque base de données pour leur donner un sens que le business saura par la suite exploiter.

Et c’est la que réside la promesse de Kaggle: mettre en relation ces ressources rares avec les besoins des entreprises.

Une communauté de spécialistes de données

Vous trouverez sur kaggle.com une communauté de data scientists qui tentent de résoudre les problèmes data posés par les entreprises. Le concept est simple: les entreprises vont fournir un jeu de données et lancer un défi comme par exemple demander aux analystes de prévoir les ventes des prochaines semaines. Celui ou celle qui sera le ou la plus proche de la réalité remportera le premier prix et sûrement… une proposition d’embauche. Car les entreprises paient les gagnants de ces concours, en plus généralement de chercher à les débaucher, ces ressources étant rares à trouver.

Autre point intéressant de Kaggle, le site rend disponible les scripts uploadés par les participants, scripts rédigés dans plusieurs langages: utilisation des librairies pandas, numpy ou encore matplotlib pour Python, scripts écrits en R et ainsi de suite. Les options permettent de faire le tri entre les langages, idéal pour celui ou celle qui s’intéresse de près à cette discipline et qui souhaite apprendre des méthodes de retraitement de l’information.