Le Geocoding en Data Science
Sélectionnez un chapitre
Partoo est une startup dont le but est de donner de la visibilité des entreprises locales sur internet et ainsi, permettre aux commercants de mieux connaître leurs clients et de générer plus de trafic dans leurs magasins. En quatre ans d’existence, l’entreprise a énormément grandie passant de deux fondateurs à une équipe d’une trentaine de personnes !
Quels étaient les besoins de Partoo quand ils t’ont recruté ?
Antoine Nuttinck : Partoo est une jeune entreprise en pleine croissance. Lorsqu’ils m’ont recruté, il y a un an, c’était principalement pour un projet de recherche autour du geocoding (le fait de pouvoir estimer les coordonnées GPS d’un endroit à partir de son adresse). Pour une entreprise spécialisée dans le référencement local, il est essentiel d’être capable de s’assurer de la position exacte des points de ventes.
Le traitement manuel de cette tâche est très coûteux et particulièrement lent alors que les solutions techniques existantes ne permettent pas une précision satisfaisante. Partoo a donc décidé d’investir .
Dans la recherche en traitement de l’image et deep learning pour être capable de reconnaître un point de vente sur des images géolocalisées. L’explosion du nombre de données et la forte croissance de Partoo permet, aujourd’hui, à de nouveaux projets de data science de voir le jour.
A quoi ressemble ta journée type au travail ?
Antoine Nuttinck : Dans une entreprise comme Partoo, le rôle de data scientist est particulier. En effet, je travaille en étroite collaboration avec les développeurs mais je suis la seule personne à travailler à plein temps sur la recherche. C’est un vrai challenge mais cela permet une grande liberté dans l’organisation de mes journées.
Celles-ci se répartissent principalement entre l’étude de papiers de recherche, les échanges avec les différentes équipes pour aligner les recherches sur les besoins du métier ou des clients et l’implémentation de prototypes qui permettent d’évaluer les performances des modèles vis à vis du problème.
Ces journées sont cependant ponctuées par des moments d’échange au sein de Partoo : Tous les matins, les développeurs et moi, nous retrouvons autour d’un café pour répartir les différentes tâches à réaliser pendant la journée. C’est l’occasion pour moi de faire, avec eux, le point sur l’avancement de mes recherches.
Le repas du midi est un moment de partage avec l’ensemble des équipes. Une fois par semaine, nous organisons également au sein de l’équipe Recherche & Développement des moments de partage de connaissance durant lesquels un membre de l’équipe présente aux autres une technologie qu’il connait bien.
Enfin, je travaille un jour par semaine avec des Data Scientists d’autres entreprises pour partager nos connaissances autour des modèles et des technologies que nous utilisons.
Peux-tu nous parler de ton projet sur le Géocoding ?
Antoine Nuttinck : C’est un projet je trouve particulièrement intéressant car il répond à une problématique concrète. Le client, le commerçant et les plateformes ont tous intérêt à ce que l’endroit indiqué sur la carte interactive soit le bon. Par ailleurs, pour répondre à cette problématique, j’ai utilisé une grande variété de modèles et d’outils.
J’ai à la fois travailler sur le text mining, pour faire correspondre des adresses souvent imprécises avec leur coordonnées GPS, et le traitement de l’image, pour détecter la présence d’un point de vente sur une image géolocalisée.
J’ai pu comparer différentes techniques de vision par ordinateur avec les derniers modèles de deep learning.
C’est d’autant plus intéressant que très peu d’entreprise font des recherches sur ce sujet.
Pour finir, à ton avis, à quoi ressemblera le métier de Data Scientist dans 5 ans ?
Antoine Nuttinck : Je pense que le terme de Data Scientist regroupe déjà un très grand nombre d’activités différentes. L’explosion des quantités de données et les progrès fulgurants dans ce domaine vont continuer à élargir le domaine des data sciences. De plus en plus d’entreprises, dans tous les secteurs, vont rechercher ce type de profils. Pour répondre à ces besoins, je pense qu’il faudra non seulement plus de formations en data spécialisées mais également que ces techniques deviennent de plus en plus accessibles à ceux qui ne sont pas spécialistes.
Ces derniers mettront alors les data sciences au service de leur métier (qu’on n’appellera sûrement pas data scientist) pendant que les spécialistes se concentreront sur la recherche.
Comme l’informatique, je pense que la Data Science va devenir progressivement plus qu’un métier, un outil utilisé par tous.
Vous êtes intéressé par les métiers de la data ? N'hésitez pas à regarder notre formation data science, formation data analysis & formation data engineering !