Se former en Data Science par des projets
Sélectionnez un chapitre
L’interview de Pierre-Antoine, notre supra Maître Jedha, spécialisée dans l’imagerie médicale ! Enseignant à la première promotion Fullstack Lyonnaise, il est intervenu sur les 3 dernières semaines constituantes des modules Carrière et réalisation de projets. Retrouve ici tous ses conseils et bonnes pratiques, que tu sois autodidacte, élève actuel, futur ou tout simplement intéressé par la Data !
Hello Pierre-Antoine, peux-tu nous parler de ton parcours ?
J’ai fait une licence en informatique et un master en Data Science à Lyon 2, j’avais aussi des bases en développement. Je me suis ensuite orienté dans la recherche avec une thèse le Machine Learning appliqué à l’imagerie médicale. J’ai réalisé un premier stage dans un Labo de recherche médicale, dans l’imagerie du cerveau.
J’ai ensuite réalisé un second stage à la suite de celui-ci car on avait de belles pistes de progression. Ce secteur peut avoir beaucoup de cas d’applications, les financements se retrouvés débloqués, mais dans la recherche, j’avais besoin d’un sentiment d’accomplissement pratique. Après ma thèse, j’avais des ambitions entrepreneuriales, des nouveautés après la recherche académique. C’est dans ce cadre que j’ai, avec d’autres doctorants, crée notre entreprise, Radiostic, fournissant des solutions d’analyse d’image pouvant détecter des problèmes cardiaques.
J’ai effectué quelques missions d’enseignement vers la fin de ma thèse. En étant enseignant chercheur j’avais la possibilité d’être également maître de conférence.
"C’est ce que je transmets quand j’enseigne : savoir pourquoi on apprend ce qu’on apprend."
Comment t'es venue l'envie d'enseigner ?
Quand j’enseigne, je donne souvent des exemples qui sont liés à mon domaine d’application. Cela permet d’expliquer des concepts techniques avec des illustrations très simples, de la vie commune. Je pense que ce qui m’a manqué dans mes études, c’est de savoir que tout ce que j’apprenais aller me servir pour la suite. C’est ce que je transmets quand j’enseigne : savoir pourquoi on apprend ce qu’on apprend. Par exemple, quand on fait de la dérivation à titre purement théorique, c’est très difficile de se projeter. Lorsque l’on sait plus tard que la dérivation est utile pour apprendre les paramètres des réseaux neurones ou les paramètres d’une régression linéaire, tout prend sens.
"Mes conseils : Se créer un profil GitHub, avoir un portfolio Kaggle, mettre à jour son LinkedIn constamment, contacter les professionnels directement sur les réseaux pour mettre en valeur ses compétences"
Quels modules as-tu enseignés ?
J’ai d’abord enseigné le module Carrière et j’ai bien aimé intervenir sur cette session en aval. Il y a un réel argument :
Les projets finaux sont de très gros avantages dans les CVs des alumni, un pilier de leur formation en matière d’ambition et d’innovation.
J’essaie donc de donner le plus d’importance à cela, que ce ne soit pas juste un projet visant simplement à valider la formation. On a d’abord fait le point sur les acquis : ils étaient assez en avance sur la recherche d’emploi – mise à jour de leurs profils sur Linkedin par exemple. L’idée est vraiment de mettre en valeur les compétences, en se créant un profil Kaggle et un portfolio pour qu’ils puissent appuyer leurs différents projets durant la formation. Je pense qu’il est important de montrer que l’on traverse beaucoup de thématiques.
Mon conseil : Contacter des personnes sur LinkedIn c’est le meilleur moyen de se faire connaître, simplement pour avoir des avis ou retours d’expérience de personnes qui travaille dans le secteur visé.
L’élément intéressant dans la pédagogie ici, c’est la notion de sprint. On a une semaine, un module, des notions à maîtriser et un projet à réaliser.
Autre conseil : il faut avoir la première version d’un programme le plus rapidement possible, plutôt que d’essayer de chercher le meilleur modèle pendant trop longtemps. Pourquoi ? Ce prototype va justement servir à quantifier les améliorations nécessaires.
Est venue ensuite la fameuse préparation des projets finaux !
C’était un très bon challenge qui me poussait à acquérir d’autant de plus de compétences techniques et créatives, même en tant qu’enseignant et professionnel.
Autre conseil : avoir la première version du programme le plus rapidement possible, plutôt que d’essayer de chercher le meilleur modèle pendant longtemps.
Pourquoi ? Ce prototype va justement servir à quantifier les améliorations nécessaires. Ce que certains vont appeler la baseline, le modèle de référence. Il faut la faire ressortir le plus rapidement possible pour améliorer son projet au global et être sûr que l’on va dans bonne direction. Certains élèves ont passé pas mal de temps à aller chercher le meilleur modèle, puis il y a eu aussi des réflexions telles que : Quel était le projet en lui même ? Quels étaient les thèmes que j’allais aborder ? Quel était le jeu de données à utiliser ?
Il y a d’autres élèves qui se sont un peu plus penchés sur les cours ou ont exploré des choses qu’ils n’avaient pas vu pendant la formation en toute autonomie pour aller plus loin. Une des grandes utilités de ce projet : il donne de l’ambition. La théorie s’est mélangée à la pratique. Pour les personnes avec qui ça bloquait, il fallait avoir un “Data MVP” qui marche. Ce n’est pas grave si les données ne sont pas parfaitement propres, mais il faut avoir avoir un premier modèle qui marche pour qu’il ait quelque chose qui puisse bien orienter sa direction dans le projet et préciser sa problématique. 2 semaines, c’est court, mais là est l’enjeu de l’exercice.
"Je trouve qu'il n'y a pas de meilleure façon pour comprendre un concept que de l'expliquer à une autre personne. Comme l'a dit le célèbre professeur Richard Feynman : If you can’t explain something in simple terms, you don’t understand it."
Accompagner aux mieux les futurs alumni
Je demandais toujours en début de journée : Qu’est-ce que chaque personne avait comme missions pour la journée ? Et est-ce qu’il y avait des blocages ? Il est important d’avoir des moments en 1 to 1 pour répondre aux questions et les aider, bien que certains avancent en tout autonomie. Je trouve qu’il n’y a pas de meilleure façon pour comprendre un concept que de l’expliquer à une autre personne. Comme l’a dit le célèbre professeur Richard Feynman :
If you can’t explain something in simple terms, you don’t understand it.
Je demande donc aux étudiants de m’expliquer les notions qu’ils ont vu pour comprendre comment je peux compléter leurs connaissances. D’autres avaient ponctuellement besoin d’un petit soutien. Ils bloquaient sur une méthode et ils ne savaient pas comment l’interpréter, ou ne savaient pas où aller parce qu’elles avaient l’impression d’avoir explorer tout ce qui était faisable. Dans ce cas, nous vérifions que tous les objectifs élémentaires sont complets (pré-traitement des données, transformation des descripteurs, modélisation, étude des performances) avant d’aller plus loin. Si tout ça est ok, j’apporte mon point de vue sur les performances et des pistes d’améliorations, soit en isolant des observations mal prédites ou en utilisant un modèle plus complexe.
Comment réalises-tu ta veille technologique ?
Je garde toujours un oeil ouvert sur l’actualité. Si je lis quelque chose que je n’arrive pas à comprendre, je cherche des cours détaillés, ou je consulte un blog si il y a blocage. Je suis également un grand fan de Twitter, je suis abonné à des personnes qui m’influencent dans ma communauté médicale mais aussi dans des communautés plus larges comme par exemple le traitement du langage.
L’avantage de Twitter pour la Data Science, c’est que la publication est souvent réalisée par l’auteur de l’article lui même.
J’arrive à suivre l’évolution du coté de l’académie, des publications scientifiques, je vois ce qui marche bien, les thématiques qui sont en avance et qui ont beaucoup d’influence en terme de résultats, d’influence sur ce que je vais étudier de mon côté, des technos sur lesquelles je souhaite me mettre à jour. Bien évidemment j’utilise Kaggle pour la pratique, ce qui me permet d’avoir un retour sur les techniques qui ont bien marché.
Focus sur le campus Lyonnais ! Quelles sont les spécificités du marché de la Data ici ?
A Lyon, il y a un nombre important d’entreprises de conseil en Data Science parmi lesquelles Keyrus, Econocom, B&D, Micropole, Datalyo, Sopra Steria, Amaaris, Alten ou Data Genius. Si l’industrie pharmaceutique est un domaine qui vous intéresse, il y a de grandes chances pour que vous trouviez votre bonheur ici, car plusieurs des plus grandes sociétés pharmaceutiques comme Biomérieux et Sanofi sont implantées ici.
Pour des personnes qui débuteraient, le mieux ce serait qu’elles participent aux meet-ups, les plus importants : Lyon data science, Lion is IA, (autours de technologies Deep Learning et de la démocratisation de la Data Science, ils ont aussi un bon point de vue). Jedha en délivre également régulièrement.
Si vous souhaitez acquérir les compétences en Data recherchées des recruteurs, n'hésitez pas à regarder nos formations Data que Jedha Bootcamp propose.