Il a construit sa voiture autonome !
Sélectionnez un chapitre
Son projet final ? La construction d'une voiture autonome, la vidéo juste en bas de cet article ! D'une carrière dans le SEO et l'analyse web, Adrien a rapidement crée une appétence pour l'analyse de la donnée et a souhaité monter en compétences. Il a donc suivi la formation Fullstack à temps partiel, et 6 mois après, il est maintenant Data Scientist pour TF1 ! Il nous raconte son histoire.
[Interview de Adrien Dodinet, Data Scientist @ TF1 & Alumni de la formation avancée en Data Sciences de Jedha Bootcamp : 420 heures de formation à temps complet pour maîtriser l'entièreté du pipeline Data, depuis la collecte de données jusqu'au déploiement d'applications en passant bien sûr pour la création de modèles de Machine Learning & Deep Learning. Adrien est aujourd'hui Head of Data @ Kiccks] Découvrez sa voiture autonome en bas de cette interview 👇
Hello Adrien, quel est ton parcours ?
J’ai commencé ma carrière dans le SEO. En faisant du référencent web, je me suis intéressé à la donnée et suis devenu Web Analyst. J’ai ensuite eu envie de construire des choses avec ces données, ne pas simplement faire de l'analyse : la première chose pour moi était de me former. Je ne souhaitais pas de formation en ligne, afin de garder le mentoring nécessaire, avoir des des collègues d’entraide et une structure. Quand j’ai voulu rechercher sérieusement des moyens de me former, je me suis inscrit à la formation Data Science Fullstack à temps partiel.
Tu as suivi la première de nos sessions à temps partiel !
La formation temps partiel a duré 6 mois, les lundis soir et les samedis dans la journée. Ça peut paraître assez impressionnant comme cela, mais avec des objectifs d’apprentissage clairs et la motivation, c’est très bien passé : ce n’est pas quelque chose de contraignant. Nous reprenions pas mal de bases, avant d’aller plus loin, le code étant le nerf de la guerre. La pratique était de mise, entre les exercices, projets et use cases que l’on allait sûrement retrouver dans des tests d’embauches. La formation étant très dense, on avons vu étape par étape les méthodes de Machine Learning, du plus simple au plus compliqué.
Les exercices correspondent à plus de 50% de la formation. On nous montre rapidement la pratique puis on rentre dedans assez tôt. Le format bootcamp orienté pratique était l'élément le plus plaisant. La théorie étant dans le marbre, on ne peut pas y déroger.
Depuis, le programme a évolué, mais la boîte à outils du professionnel de la Data est globalement la même, que ce soit pour du Machine Learning, du Python, du Big Data.
Ton projet final : une voiture autonome !
Avant même la fin de la formation, j’avais pour ambition de construire ma propre petite voiture autonome. Je voulais appliquer les méthodes d'analyse d’images que l’on avait vu dans en cours à l’analyse de route et la prise de décision (gauche / droite pour une voiture).
Il reste très important d’avoir un projet qui nous plaît et sur lequel on veut itérer dans le futur.
Tous les projets - modules que l’on va faire aborde un côté de la Data Science. On commence avec du classique, l‘analyse des prix de l’immobilier de Paris afin de prédire le prix d’un appartement à partir de ses features. On va ensuite vers des choses plus complexes où on nous laisse aussi plus libres, on va ici devoir nous mêmes faire évoluer et interpréter la donnée.
Les professeurs veulent vraiment nous emmener vers ce à quoi nous seront confrontés dans l’environnement professionnel, avec données impropres et des guidelines plus ou moins précises. Leur accompagnement est donc d'autant précieux.
Nous avons eu plusieurs professeurs, avec des backgrounds très différents (Statistiques, Développeurs, Data Scientists) et donc plusieurs manières de voir le métier. C’est ce suivi qui m’a vraiment fait pencher pour une formation en live, par rapport à des formations en ligne.
Ton background tech t’a-t-il bien aidé pendant ta formation ?
J’avais certes la compétence des chiffres de par mon background, mais le gros de la Data Science - à savoir le code - a été très majoritairement appris sur place.
J’ai en tout cas bien compris au niveau de profils présent dans la formation que le background n’importait pas énormément. Tout va revenir à la motivation et l’investissement car contrairement à une école sûrement ‘académique ‘, on n’a pas de partiel, ni d’évaluation.
Tout va relever de la motivation à satisfaire une ambition personnelle.
Les Lundis soir, les samedis soir, comment t’organisais-tu ?
D’abord la formation est le lundi soir, il reste beaucoup d'autres soirs de la semaine pour vaquer à ses occupations. Pour le samedi, on avait tous des impératifs ponctuels, des weeks-ends, des événements. Mais ça ne portait pas préjudice, nous avions tous les accès aux cours donc possible de les rattraper. On avait également pour habitude de passer la majorité des exercices en cours pour faire le plus complexe en étant accompagnés. Ceux qui voulaient aller plus loin le pouvait donc parfaitement. Quant au projet final, la majorité de sa réalisation se déroulait en dehors de la formation. C’est d‘ailleurs la principale raison pour laquelle il faut avoir un projet qui vous intéresse au delà de l’aspect purement technique.
Personnellement je souhaitais quitter mon travail après la formation et me reconvertir : la motivation, j’en avais !
Venons-en à ton recrutement chez TF1, comment s’est-il passé ?
J’ai rejoins TF1 il y a 2 mois, au début du confinement ! Mais tout se passe très bien :) Pour son obtention, j’ai eu un mélange de chance et d’opportunité. Lorsque j’allais commencer à chercher du travail, un de nos professeurs (Frédéric Enard) avec qui je m’entendais très bien et qui m’avait bien orienté pour ma voiture autonome m’a annoncé qu’il partait de TF1 (où il travaillait en tant que Data Scientist | Data Engineer) et cherchait un remplaçant. Il m’a alors recommandé pour la reprise de son poste. La recommandation ne faisant clairement pas tout, j’ai passé des entretiens et tests techniques avec les managers de TF1.
Pour le test technique, cela ressemblait souvent aux exercices que l’on a fait pendant la formation, parfois en plus compliqué, le tout pour savoir de quoi on est capable. Pour mon cas, on m’a donné un Dataset de 2 colonnes, je devais prédire la prochaine connexion d’un utilisateur au site internet.
Pour les recruteurs, l'idée n’est pas de faire le modèle de Machine Learning avec la meilleure performance, le recruteur cherche à comprendre les méthodes utilisées et pourquoi elles ont été utilisées.
J’ai eu des questions techniques sur le pourquoi de tel ou tel modèle, afin d’évaluer mon intuition sur les différentes étapes d’un projet (nettoyage, transformation, des données etc). Il faut montrer ce que vous savez faire : que vous savez coder, l’analyse la donnée, l’analyse des résultats, le tout en un seul problème. La pierre angulaire reste le code !
Pour les questions techniques, on m’a aussi demandé d’expliquer un modèle, comment est-ce qu’il est construit, quelle est son architecture.
Il faut démystifier la Data Science dans la mesure où tout comme un développeur, un Data Scientist va passer beaucoup de son temps sur Google à chercher des réponse à ses questions. Il ne faut pas croire que l’on peut garder tout en mémoire. Le plus important est d’avoir les méthodes et mécanismes !
Comment est-ce que les recruteurs percevaient-ils ton expérience de formation chez Jedha ?
Les recruteurs ont trouvé ça intéressant, je n’ai pas ressenti de gêne ou autre sentiment du genre. On m’a simplement demandé d’aller plus loin dans les concepts statistiques que je vais spécifiquement voir dans le cadre de mes projets chez TF1 (e.g factorisation matricielle). Et il n’y a effectivement rien de mieux que d’apprendre des concepts aussi complexes au moment où on doit les appliquer dans un métier, plutôt que de les apprendre en cours de formation académique à un âge où on n’a pas forcément d’expérience professionnelle. Pour me mettre en avant, j’ai travaillé pendant un moment sur un projet freelance, ce qui m’a rajouté une pièce à mon CV. Un autre conseil, tout ce qui bon pour apprendre est à prendre !
Tu travailles maintenant sur la recommandation de MyTF1.fr !
Aujourd’hui, je travaille sur la recommandation vidéo de myTF1.fr, en cours de projet. Quand on touche à la pratique dans le cadre professionnelle, on tombe très vite sur des problématiques de mise en production. Car un modèle n’est pas emmené à être sollicité qu'une seule fois.
En l'occurrence, pour des recommandations, le modèle doit tourner en permanence, en traitant énormément d’informations à la seconde. C’était donc d’autant plus intéressant d’apprendre tout ceci !
Étais-tu au fait de la manière dont un process de recrutement en Data se déroulait ?
On nous avait expliqué le fil rouge des processus de recrutement pour des postes techniques, avec des test techniques blancs etc. De mon expérience en recherche, j’en ai vu 2 types :
- Le Coding challenge sous forme de problème à résoudre
- Des interrogations sur les questions type que les recruteurs posent très régulièrement
Quand on n’a pas beaucoup d’expérience professionnelle, il faut savoir mettre en avant les bons éléments, à savoir les compétences maîtrisées, les projets sur lesquels ont les a appliquées, et pas juste les compétences théoriques.
Quelle était ta méthode de travail ?
On nous donne régulièrement des exercices supplémentaires. Nous trouvons également des ressources en abondance sur Internet, entre des blogs ou les sites de concours type Kaggle.
Un conseil : essayez de filtrer avec un domaine d’intérêt personnel.
Si vous aimez le sport, faites votre projet sur le sport ! Si c’est le cinéma, faites un projet sur le cinéma. Vous travaillerez sans vous en rendre compte et tomberez surtout sur de vraies problématiques professionnelles.
Dans le cadre de ton travail, peux-tu nous décrire le life cycle d’un projet Data ?
Il faut d’abord avoir une demande. Parfois il n’y en a pas, et c’est à nous avec le client (e.g marketing ou autres départements) de proposer des choses. Il convient alors de leur montrer ce qui est faisable, et l’intérêt qu’ils pourraient en ressortir (l'intérêt commercial, de notoriété). Un travail de vulgarisation et d'explicabilité est nécessaire, car les boîtes noires sont à éviter. Globalement certains métiers peuvent être réticents à tout ceci car ils n’ont pas envie de changer de manière de travailler, mais la démonstration par les chiffres fonctionne, l’immobilisme est moins important.
Une fois le projet lancé, le plus gros challenges est de trouver la donnée, savoir ses sources, l’homogénéiser. Il faut ensuite créer un modèle de Machine Learning robuste puis un pipeline qui va complètement automatiser le processus : ce modèle ne va jamais être amené à être exécuter qu’une seule fois.
Le client a-t-il un cahier des charges à vous faire respecter ?
Il va souvent falloir construire le cahier des charges avec le client, car il ne sait jamais exactement ce qu’il veut en termes d’analyse et de méthodes, il a simplement un objectif business global à satisfaire, c'est le cas dans énormément d'entreprises. Ceci est alors tout aussi challengeant !
Parfois même, il peut arriver que l’on commence un projet qui fonctionne de notre côté, avant de le présenter au marketing, à la finance etc.
Comment est structuré le département chez TF1 ?
Nous avons un pôle Data avec les 3 métiers de Data Scientist, Data Analyst, Data Engineer. Chacun est expert de son domaine, et nous travaillons régulièrement avec les autres pour qu’il nous face eux mêmes monter en compétences. Les Data Engineers sont par exemple très stricts sur la gestion de la donnée et son architecture, ils nous font donc monter en compétences là dessus. Quant aux Data Scientists, nous allons s’attarder sur la manière de faire des modèles. Les Data Engineers ou Analysts vont par exemple vouloir se former sur ces aspects là. Entre les 3 métiers, on est toujours en communication.
Des conseils pour quelqu’un voulant se lancer dans la Data ?
- Se familiariser avec le code, juste pour voir si cela vous plait ! Les Essentials, notre formation en 75h en Data, servent d’ailleurs à ça. Le code est la base de tout pour le professionnel de la Data.
- Ne pas vouloir aller trop loin, trop vite. Beaucoup de personnes veulent se lancer directement dans des algorithmes très complexes car ce sont eux qui font rêver. Mais il faut garder en tête que le Deep Learning, c’est du Machine Learning x 1 000 000, donc beaucoup plus complexe.
- Travailler régulièrement son code, s’améliorer en permanence en code, car encore une fois, le code est la pierre angulaire de tout.
J’ai peur des mathématiques, la Data est-elle faite pour moi ?
Si vous êtes effrayés par les maths, il faut savoir qu’en Data Science, la machine va faire beaucoup du travail.
Un Data Scientist n’est jamais tenu à appliquer lui même des formules très complexes, et avec l'expérience, on comprend à quoi tout cela sert, car la pratique vient rapidement éclaircir certaines formules complexes.
Il faut simplement avoir un attrait pour les maths sans être statisticien né, car les formules sont gérées par le modèle. Les connaissances de mathématiques niveau lycée sont suffisantes !
Et maintenant, place à la Demo de sa voiture autonome !
Si vous souhaitez acquérir les compétences en Data recherchées des recruteurs, n'hésitez pas à regarder notre formation en Data Analysis.