INTRODUCTION

Le Machine Learning, composant essentiel des Data Sciences, est devenu très populaire. Il existe depuis que nos ordinateurs sont assez puissants pour traiter l’énorme masse de données nécessaires au bon fonctionnement de ces algorithmes. Etre capable de comprendre et utiliser ces modèles sont donc devenues des compétences très recherchées par les recruteurs. Cet article va vous donner les clés pour commencer votre apprentissage du Machine Learning.

CODER EN R OU PYTHON

Pour pouvoir parler à un ordinateur, vous devez utiliser un langage qu’il comprend. Python et R sont les langages les plus populaires en Machine Learning. Chez Jedha, nous avons une préférence pour Python qui devient de plus en plus populaire en raison de sa polyvalence.

De même qu’en statistiques, être un expert et connaître absolument tout de ces deux langages n’est pas nécessaire (et est de toute façon presque impossible). Cependant, il est bon de comprendre les différents types de données (Text, Integer, Float, Array etc.) et de savoir construire des boucles.

Vous pouvez utiliser les ressources suivantes pour commencer votre apprentissage:
Learnpython.org

Teamtreehouse.com
(site en anglais ayant des cours bien faits)
Udemy
(plateforme de cours en ligne)

STATISTIQUES

Avant de vous plonger dans l’écriture de codes et de vous amuser avec Python ou R, il est important de comprendre ce qu’il y a derrière le Machine Learning. En effet, ce domaine est exclusivement basé sur des concepts statistiques. Fort heureusement, vous n’avez pas besoin d’être un expert pour pouvoir manier le Machine Learning.

Le Machine Learning repose sur la création de modèles imparfaits qu’il faudra améliorer au cours du temps afin que ceux-ci répondent au mieux à votre problématique. Ce sont les statistiques qui vont vous aider à définir la qualité d’un modèle. Cela implique donc de connaître les notions de moyenne, médiane, écart-type et p-values et de construire des intervalles de confiance. Le site statsoft.fr vous aidera à appréhender ces notions statistiques.

APPLIQUER LE CODE AU MACHINE LEARNING

Après avoir compris les notions statistiques basiques et le fonctionnement de Python, vous allez pouvoir utiliser des librairies (comme NumPy, Pandas, Scikit learn pour Python) qui vous aideront pour construire votre modèle de Machine Learning.

Vous avez différents types de Machine Learning :
– Supervisés
– Non-supervisés

En fonction de cela, vous allez déterminer quel modèle vous pouvez utiliser. Pour vous donner une idée, voici une liste des différents modèles :
– Regression
– Classification
– Clustering
– Reinforcement Learning
– Natural Language Processing
– Artificial Neural Network

N’hésitez pas à lire les autres articles de notre blog pour accéder à des informations plus poussées sur le Machine Learning.

Pour apprendre le Machine Learning, différentes ressources s’offrent à vous :
– Cours en ligne : les cours de Hadelin De Ponteves & Kirill Eremenko sur Udemy sont très bien faits
– Notre formation Jedha : Formation à temps partiel sur 8 semaines durant lesquelles un professeur vous expliquera les différents concepts des Data Sciences et les bases du Machine Learning.
Master en Machine Learningsi vous souhaitez une formation à temps complet et sur plusieurs mois.

PRATIQUER SUR KAGGLE

Enfin, le meilleur moyen de ne pas oublier et solidifier ces connaissances est de pratiquer. Kaggle est la meilleure plateforme pour cela, puisqu’elle vous permet de participer à un grand nombres de compétitions de Machine Learning où vous pourrez utiliser vos connaissances voire même gagner de l’argent!

L’avantage de cette plateforme est qu’elle fournit des bases de données nettoyées. Ainsi, vous n’aurez pas à passer beaucoup de temps à préparer ces dernières pour votre analyse.

Nous espérons que cet article vous aidera dans votre recherche, n’hésitez pas à ajoutez en commentaire vos suggestions pour apprendre le Machine Learning.