Le Data Scientist est l’expert qui se cache derrière les algorithmes qui régissent l’organisation de l’entreprise. Féru de mathématiques, il traque l’optimisation et la moindre erreur dans les bases de données. Si l’aspect technique de ce métier représente un véritable défi, il a des applications très concrètes dans la vie de l’entreprise. Laura Mandon est data scientist depuis plus de deux ans et elle nous raconte son métier.
Le goût des mathématiques et de la recherche opérationnelle
J’ai suivi une classe préparatoire maths et physique, puis je suis entrée en école d’ingénieur généraliste. Je ne savais pas à l’époque que le métier de Data Scientist existait. Sur la fin de mon parcours, je me suis spécialisée en informatique et productique (ce qui correspond aux techniques informatiques pour optimiser les systèmes de production industrielle et automatisée). J’ai acquis quelques notions en bases de donnée et en recherche opérationnelle, mais c’était encore assez général. Ensuite, j’ai eu l’occasion de réaliser un double au diplôme au Québec. C’est à ce moment-là que j’ai commencé à me familiariser avec les métiers de la Data. J’ai obtenu l’équivalent d’une maîtrise en informatique et je me suis initiée à ce qu’ils appellent là-bas” la fouille de données” en prenant des cours.
La data se trouve à la croisée de plusieurs de mes centres d’intérêt. Je n’aime pas du tout la physique, alors ce n’était pas idéal pour évoluer en tant qu’ingénieure généraliste. En revanche, j’ai toujours eu un goût pour les maths et la programmation.
La dimension résolution de problèmes, prédiction et optimisation de la data science m’a séduite.
Je trouve cela fascinant à maîtriser. Au départ, je n’avais que quelques connaissances basiques en informatique. J’ai mis un peu de temps à m’y familiariser davantage et maintenant, j’y vois surtout de la logique.
On obtient le résultat de chaque manipulation sur l’écran, c’est magique. Si on fait un changement, il apparaît tout de suite, c’est très satisfaisant.
Pour mon stage de fin d’études, je cherchais de façon large une expérience dans la Data ou la recherche opérationnelle, qui est assez proche et nécessite aussi des maths et de la programmation. J’ai été prise comme Data Scientist chez Decathlon avec justement une dimension de recherche opérationnelle car ils cherchaient à ouvrir ce domaine.
Je pense que c’est un métier qui exige d’être curieux. Au-delà de ce qui est demandé, il est important d’avoir un regard, d’anticiper sur les optimisations qui sont possibles, de prédire ce qui pourrait être amélioré.
Il faut être rigoureux évidemment et assez tenace pour faire face aux bugs et problèmes techniques qui sont fréquents. Les bases mathématiques sont nécessaires pour comprendre ce qu’il y a derrière les algorithmes, pour pouvoir les choisir et les améliorer. Avoir des connaissances en Machine Learning et connaître son fonctionnement est nécessaire aussi. Le langage de base de données que l’on utilise est généralement SQL et en terme de programmation, on utilise le langage R et le langage Python, qui ont chacun leurs avantages et leurs inconvénients.
Un métier théorique aux conséquences pratiques
J’ai été embauchée à la suite de mon stage et cela fait deux ans et demie maintenant que je travaille comme Data Scientist chez Decathlon.
Mon métier consiste à dégager les éléments les plus intéressants de la donnée, puis en faire quelque chose d’intelligent. Le défi est de créer une information à partir de la donnée, qui ne soit pas forcément dans la donnée elle-même initialement.
Je passe beaucoup de mon temps à nettoyer la donnée. Comme c’est la base de notre travail, nous devons être rigoureux. La culture de la donnée n’est pas encore très présente en entreprise en général, même si on est plutôt avancés chez Decathlon. Il est rare de trouver de la donnée qui soit 100% propre et fiable. Il faut donc commencer par faire ce travail. Ensuite, nous rencontrons les personnes de l’entreprise qui ont des problématiques métier, puis nous essayons d’y répondre avec un algorithme qui leur permettra de mieux travailler. Pour cela, il y a une partie modélisation, puis compréhension des métiers et de leur langage. De plus en plus, dans notre équipe data, nous tentons d’être spécialisés par corps de métier pour justement répondre le plus efficacement possible aux demandes.
Chez Decathlon, les enjeux data sont multiples. J’ai récemment travaillé sur un projet qui consistait à détecter les aberrations dans nos données poids/dimensions des articles. Si on trouve une chaussure qui mesure trois mètres par exemple, il y a aura de nombreuses conséquences. En magasin, la fiche de produit fera rire, mais ne sera pas très crédible. Sur le site web, la dimension de la chaussure induit le coût de la livraison, qui risque de vous sembler exorbitant si elle mesure trois mètres. Dans nos entrepôts, une partie du stockage est automatisée donc par défaut, la chaussure de trois mètres se verra refuser l’accès. Et en cas de transport à l’international, c’est une information qui peut aussi poser problème à la douane. Ces erreurs dans la donnée peuvent donc avoir des répercussions monétaires énormes.
J’évolue essentiellement au sein de l’équipe qui traite de l’approvisionnement et des transports. Donc, je fais face justement aux problématiques internationales concernant les usines de production, les entrées des produits dans les pays, etc. Je travaille par exemple depuis 3-4 mois sur le projet est l’optimisation des flux de transports internationaux.
J’aime beaucoup le fait qu’il y ait des applications réelles derrière la technique.
J’ai des retours concrets sur ce que je fais et sur les optimisations apportées. Je suis toujours motivée de réfléchir aux problématiques, d’imaginer quel algorithme je vais utiliser. Il y a un aspect casse-tête théorique avec de vraies conséquences pratiques.
Un domaine en pleine structuration
Quand je suis arrivée chez Decathlon, nous étions une petite dizaine au sein du data center. L’équipe était assez récente, très centrale sans vraiment de spécialité attribuée. Nous faisions essentiellement de l’analyse et nos projets étaient relativement limités. La frontière était encore floue entre la Data Science et la Data Analyse. Aujourd’hui en France, nous sommes une trentaine de Data Scientists chez Decathlon et nous avons des pôles internationaux. Dans chaque pays où nous sommes présents, il y a un petit pôle Data science qui traite des problématiques locales du pays et nous en France nous agissons sur les problèmes plus génériques.
Notre corps de métier évolue très rapidement donc nous sommes très investis dans la formation continue. C’est indispensable de connaître les nouveaux outils, d’apprendre quels algorithmes fonctionnent le mieux etc.
Nous dédions une partie de notre temps de travail à la formation. Pour la partie technique, ce sont souvent des MOOCs en ligne, puis en interne, nous nous transmettons les articles pertinents entre Data Scientists.
Je pense qu’à terme, la qualité de la donnée va s’améliorer dans les entreprises. Aujourd’hui, c’est quelque chose sur lequel on passe du temps, il faut tout vérifier, s’assurer que l’on a rien oublié. En termes d’infrastructure, nous avons des projets et des objectifs ambitieux à l’échelle industrielle mais des serveurs qui ne suivent pas forcément. L’objectif dans le futur est vraiment de devenir meilleur techniquement. Pour l’instant, on réalise beaucoup d’expérimentations et de démonstrations de faisabilité (ou POC pour Proof of Concept), et à l’avenir il faut réussir à les implanter réellement de façon industrielle. À ce jour, nous sommes aux prémices, ce qui est très enthousiasmant pour la suite où nous pourrons être davantage impliqués dans la structure de l’entreprise.
C’est vraiment le moment de se lancer dans la Data car la demande est énorme. Il y a beaucoup de choses à mettre en place et à structurer, c’est exaltant.
Les recruteurs ne cherchent pas de profils types, beaucoup de gens se forment ou apprennent en autodidactes pour se reconvertir dans ce domaine. Avec de la motivation, de la passion et un minimum de bagage technique, tout le monde peut tenter sa chance !
Très bon métier , et d’une formation technique pratique et approfondie .