Monter en compétences

Par où commencer pour apprendre le Machine Learning ?

Antoine Krajnc
Par 
Antoine Krajnc
CEO & Fondateur
Dernière mise à jour le 
24
 
November
 
2024
Vous débutez en Data ? Maîtrisez les fondamentaux en quelques heures !
Débuter en Data
Par où commencer pour apprendre le Machine Learning ?
Sommaire

Le Machine Learning, composant essentiel des Data Sciences, est devenu très populaire. Il existe depuis que nos ordinateurs sont assez puissants pour traiter l’énorme masse de données nécessaires au bon fonctionnement de ces algorithmes. Etre capable de comprendre et utiliser ces modèles sont donc devenues des compétences très recherchées par les recruteurs. Cet article va vous donner les clés pour commencer votre apprentissage du Machine Learning.

Vous débutez en Data ? Maîtrisez les fondamentaux en quelques heures !
Débuter en Data
Formation Data pour débutantFormation Data pour débutant

Coder en R ou en Python

Pour pouvoir parler à un ordinateur, vous devez utiliser un langage qu’il comprend. Python et R sont les langages les plus populaires en Machine Learning. Chez Jedha, nous avons une préférence pour Python qui devient de plus en plus populaire en raison de sa polyvalence.De même qu’en statistiques, être un expert et connaître absolument tout de ces deux langages n’est pas nécessaire (et est de toute façon presque impossible). Cependant, il est bon de comprendre les différents types de données (Text, Integer, Float, Array etc.) et de savoir construire des boucles.Vous pouvez utiliser les ressources suivantes pour commencer votre apprentissage :

  • Learnpython.org (plateforme gratuite)
  • Udemy (cours en ligne spécialisée Data)
  • Team Treehouse (Cours en ligne spécialisé web)

D’autres bibliothèque en ligne rassemble un grand nombre de MOOC. Course Duck a par exemple, établi un classement des meilleurs cours de Machine Learning en ligne, a différents niveaux d’expertise, de durées etc.

Statistiques

Avant de vous plonger dans l’écriture de codes et de vous amuser avec Python ou R, il est important de comprendre ce qu’il y a derrière le Machine Learning. En effet, ce domaine est exclusivement basé sur des concepts statistiques. Fort heureusement, vous n’avez pas besoin d’être un expert pour pouvoir manier le Machine Learning.

Le Machine Learning repose sur la création de modèles imparfaits qu’il faudra améliorer au cours du temps afin que ceux-ci répondent au mieux à votre problématique. Ce sont les statistiques qui vont vous aider à définir la qualité d’un modèle. Cela implique donc de connaître les notions de moyenne, médiane, écart-type et p-values et de construire des intervalles de confiance. Le site statsoft.fr vous aidera à appréhender ces notions statistiques.

Appliquer le code au Machine Learning

Après avoir compris les notions statistiques basiques et le fonctionnement de Python, vous allez pouvoir utiliser des librairies (comme NumPy, Pandas, Scikit learn pour Python) qui vous aideront pour construire votre modèle de Machine Learning. Vous avez différents types de Machine Learning :


  • Supervisé
  • Non-supervisé

En fonction de cela, vous allez déterminer quel modèle vous pouvez utiliser. Pour vous donner une idée, voici une liste des différents modèles :


  • Régression
  • Classification
  • Clustering

N’hésitez pas à lire les autres articles de notre blog pour accéder à des informations plus poussées sur le Machine Learning. Si vous souhaitez suivre une formation en Machine Learning, différentes ressources s’offrent à vous :


  • Le bootcamp Data débutant de Jedha : 75 heures de formation sur 2 semaines pour apprendre les bases de Python, SQL, du Machine Learning avant de réaliser votre premier projet Data. Vous y verrez l'ensemble du pipeline Data et serez à la fin, à même de discuter avec des équipes techniques, de manager des équipes techniques.
  • Cours en ligne : les cours de Hadelin De Ponteves & Kirill Eremenko sur Udemy sont très bien faits.
  • Les formations avancées Data de Jedha : en fonction de vos projets professionnels, vous pourrez vous inscrire au bootcamp Essentials, Fullstack ou Lead pour monter en compétence et atteindre un niveau Data Analyst, Data Scientist ou Data Engineer.
  • Master en Machine Learning : si vous souhaitez une formation à temps complet et sur plusieurs années et avoir une formation théorique.

Pratique sur Kaggle


Enfin, le meilleur moyen de ne pas oublier et solidifier ces connaissances est de pratiquer. Kaggle est la meilleure plateforme pour cela, puisqu’elle vous permet de participer à un grand nombres de compétitions de Machine Learning où vous pourrez utiliser vos connaissances ! L’avantage de cette plateforme est qu’elle fournit des bases de données nettoyées. Ainsi, vous n’aurez pas à passer beaucoup de temps à préparer ces dernières pour votre analyse. Nous espérons que cet article vous aidera dans votre recherche, n’hésitez pas à ajoutez en commentaire vos suggestions pour apprendre le Machine Learning.

Soirée Portes Ouvertes Jedha BootcampSoirée Portes Ouvertes Jedha Bootcamp
CEO & Fondateur
Antoine Krajnc
CEO & Fondateur
Antoine est le CEO et fondateur de Jedha. Diplômé d’Audencia Business School et de UC Berkeley, Antoine a travaillé pendant plus de 3 ans en tant que Business Analyst à San Francisco et à Paris. Il a ensuite fondé sa première entreprise Evohé qu’il a vendu pour repartir dans la Silicon Valley et fonder le cours de Data Analytics de Product School, le plus grand bootcamp de Product Management des US, qu’il a enseigné pendant 2 ans. De retour en France, il a fondé Jedha Bootcamp.

Articles recommandés