De plus en plus demandés par les recruteurs de tous types d’entreprises, les Data Scientists ont pris une importance considérable dans leurs processus de décision. Lors de cette session Ask My Anything, nous répondrons à toutes vos questions sur le métier de Data Scientist après vous avoir donnés nos astuces et conseils.

Retrouvez les slides de la présentation sur Slideshare !

Quels étaient les besoins du kiosk quand ils t’ont recruté ?

Je suis le seul Data Scientist chez eux, ce qui implique beaucoup, je gère beaucoup de projets car Le Kiosk commence à avoir une grande base de données d’articles.
NLP : traitement des articles pour extraire des métadata et créer des applications produits.
Marketing : les mises en place d’automatisation
Détection de fraude 
Automatisation de la chaîne de production


Est-ce génant d’être le seul Data Scientist chez le Kiosk ?

Être le seul Data Scientist, qui plus est Junior, dans une structure de taille moyenne comme le Kiosk, me permet d’être très autonome dans ce que je fais. Je fais beaucoup de veille technologique pour me tenir au courant de ce qui se fait de nouveau. Je consulte régulièrement des articles (medium, blog ou autre) lorsque je coince sur quelque chose.

Il a une équipe de Data Analysts et Data Management qui s’occupe de toute la partie de structuration de la donnée.


Les outils principaux d’un Data Scientist ?

Je dirais qu’il y en a deux types :
– La compétence en programmation. Au quotidien, on code en Python
– La gestion des outils Big Data même s’il ne sont pas toujours utilisés dans l’univers professionnel. Chez le Kiosk, nous ne sommes pas arrivés à un tel stade de collecte données pour pouvoir utiliser des outils Big Data .


Est-ce que dans ton travail quotidien, les mathématiques sont-elles aussi importantes que les algorithmes qui existent déjà dans les librairies ?

Les deux sont importants, mais il y a aussi un part d’intuition. Avec toutes les variables que j’ai, j’essaye d’imaginer comment un modèle va se comporter face à la base de données. Selon les cas d’usage, on peut être amené à modifier des algorithmes existants.


Est-il obligatoire d’avoir un background ingénieur ou matheux pour devenir Data Scientist ?

Avoir cette double casquette Business / Data Science peut être aussi très appréciée. La programmation est le plus dur en commençant, c’est ce qui parait comme le plus impressionnant au début, mais à force d’entrainement, on y arrive. Je connais des gens qui sont passés Data Engineer, Analysts, Data Scientists. Avec les projets qui vont avec et la formation continue et professionnelle, on arrive à de beaux débouchés.


Que conseillerais-tu à quelqu’un qui veut se lancer en tant que Data Scientist ?

Des Bootcamp, masters universitaires, des MOOC, il y a beaucoup de matériaux en ligne. Faire des projets Data Science sur Kaggle pour accéder à un bon niveau permet de progresser rapidement. UCI Machine Learning Repository, des blogs, rassemblent beaucoup de papiers intéressant pour rester en veille technologique. Se construire un portfolio de données est une très bonne possibilité pour rapidement progresser, en croisant Data Science avec le secteur d’activité dans laquelle on veut tailler.