Prédire, collecter, recommander. Quels sont aujourd’hui les usages concrets du Machine Learning en entreprise ? Adoptés par un nombre grandissant d’entreprises, les outils d’automatisation bousculent aujourd’hui les codes et process métiers.

Ce workshop vous permettra  de comprendre et d’expérimenter l’impact du Machine Learning sur la construction de modèles prédictifs puissants et leurs usages multiples.

QU'EST-CE QUE LE MACHINE LEARNING ?

Le Machine Learning “apprentissage automatique” en français – est un ensemble d’outils permettant de réaliser des prédictions et prévisions d’un phénomène ou d’une action. Il s’agit d’un programme informatique qui résout des tâches très complexes à partir des données récoltées par l’équipe Data.

Classifications SPAM sur Gmail, système de recommandations sur Netflix ou Amazon, voiture automatisée par Tesla ou Google, détection de tumeurs ou de maladies dans la médecine, reconnaissances d’objets, détection de fraudes : les applications du Machine Learning sont extrêmement nombreuses, et la véritable prouesse technique de ces dernières années réside dans la puissance calculatoire développée pour ces ordinateurs.

Lors de notre workshop sur les applications du Deep Learning, Antoine prenait l’exemple d’Alpha Go. Il s’agit d’un programme développé par Google dont le but est de jouer au Go, un jeu de plateau chinois. En 2016,  Alpha Go a battu le champion du monde de Go.

Qu’est-ce qui rend cette victoire notable ? Le nombre de combinaisons possibles au jeu de Go s’élève à 10 puissance 170 (vous aurez compris, soit 1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000
Un 1 avec 170 zéros)  !  Ce programme est donc capable d’apprendre par lui même les bonnes techniques de jeu à adopter selon les changements de son environnement (le jeu de son adversaire, le champion du monde de Go) .

Dans la pratique : les étapes du projet Machine Learning

Un même objectif à tous les projets Machine Learning : prédire des événements et prendre des décisions et actions basées sur ces prédictions.

Vous pouvez avoir une idée concrète du déroulé d’un projet Machine Learning en consultant ceux de nos élèves.

– L’extraction via des bases de données : on extrait de là les informations que l’on veut traiter, analyser, et qui vont servir de socle à la prise de décision finale.
– Le pré-processing : cette étape consiste en un pré-traitement de toutes ces données avant de commencer à les analyser. Gestion des valeurs manquantes, des valeurs textuelles (un algorithme sait gérer des chiffres et non pas des mots et il va s’agir de les “traduire” en chiffre), mise sous forme tabulaire des données ; le but de cette étape de rendre la modélisation plus simple et rapide.
La modélisation et la mise en production : une fois les données pré-traitées, il va s’agir de trouver le bon algorithme correspondant à la problématique métier posée par votre client. En testant tous les algorithmes à disposition du Data Scientist (voir la Cheat Sheet) , cette étape est en somme très chronophage. Après avoir appliqué ce modèle, de nouvelles données arrivent, des prévisions sont faites et finalement des actions concrètes sont prises au sein de l’entreprise.

En pratique, un des gros challenges d’un projet Data réside dans les différences métiers entre les équipes Data et les équipes IT. Les premières opèrent l’extraction des données, leur pré-processing, et leur modélisations, les équipes IT passent ces modèles en production. Ces deux collectifs ne parlent pas les mêmes langages informatiques, pourraient ne pas se comprendre, et donc pourraient mettre en compromission tout le projet mené pendant des mois.

Il est donc important de bien embarquer les équipes IT dans vos projets Data, par exemple en leur délivrant ainsi qu’à l’ensemble de l’entreprise un Machine Learning Canvas.

LE MACHINE LEARNING AUTOMATISÉ : L'OUTIL DE PREVISION.IO

Dans tous les projets Machine Learning, peu importe la prédiction à réaliser, les étapes sont les mêmes. L’outil du Machine Learning Automatisé permet donc à partir de données récoltées, qui elles sont différentes pour chaque projet, de réaliser toutes les étapes intermédiaires du projet de manière automatique. Avec un pré-processing réalisé par l’outil, celui-ci sélectionne les algorithmes et modèles selon des indicateurs de performance, puis les expose sur la plateforme. Il les mettra ensuite en production pour pouvoir rendre un reporting interprétable par le Data Scientist, menant à une prise de décision réfléchie au sein de l’entreprise.

QU’EST-CE-QUE CELA CHANGE POUR L’ÉQUIPE DATA ?

Concrètement, cela signifie que le travail du Data Scientist peut être non seulement simplifié, mais lui fera en plus gagner énormément de temps. Au lieu de tester chaque algorithme individuellement (étape qui prend des semaines), l’outil les teste en quelques heures.

Pour l’équipe Data, le Machine Learning Automatisé facilite l’itération et donc la productivité : si le Data Scientist veut par exemple traiter une donnée différemment, ou en ajouter une nouvelle, il ne sera plus obligé de changer de modèle. L’outil le fera automatiquement pour lui en prenant en compte les modifications apportées à la base de données d’origine.

Relativement à la prise de décision finale qui est l’objectif de tout projet Data, l’outil de Machine Learning Automatisé va permettre à l’équipe Data de choisir un modèle, mais surtout d’expliquer aux preneurs de décisions pourquoi celui-ci a été choisi. En somme, ce genre d’outil brise le manque de compréhension entre les différentes parties prenantes du projet : les équipes Data, IT et les preneurs de décision qui sont le plus souvent issus de départements commerciaux.