webleads-tracker

JEAN-MARC

ref. Co38xa048

DATA SCIENTIST

Expériences professionelles

2018

DATA SCIENTIST

BEEZEN DATA SCIENTIST

Juillet 2018 à ce jour : Carrefour France - Equipe Data scientist Intervenir au besoin sur plusieurs projets en tant que data scientist traitant différentes problématiques sur un environnement Big Data Hadoop et GCP. Missions : Parmi les principaux projets, on site : - Système de recommandation de produits non alimentaires développé sur Big Query GCP se basant sur l’historique de transactions des clients sur les sites d’achat en ligne de Carrefour utilisant des mesures comme les notions de support, lift et confiance. - Centralisation des données via la création de référentiel produits global : développement de scripts en PySpark exécutés en tant que jobs Big Data sur la plateforme Hadoop, du code SQL sur Big Query GCP et utilisation de google storage - Refactoring d’anciens scripts en les adaptant aux nouvelles sources de données. Environnement technique :PySpark,SQL sur Big Query,Google Cloud Plateform GCP,Google storage Git, Bitbucket.

2018

DATA SCIENTIST

BEEZEN DATA SCIENTIST

Mars 2018 – Juin 2018 : Davidson consulting Luxembourg - Consultant Data scientist Mission chez : ArcelorMittal – Luxembourg - Equipe Data scientist Refactoring d’un projet pricing automatique de produits à partir d’une version codée sous R à Python en l’adaptant aux nouvelles bases de données Azur et au besoin commercial actuel. Environnement de travail en anglais et en mode agile Missions : Compréhension d’un code R complexe utilisé auparavant pour ce projet, Traduction de ce code de R à Python en utilisant les librairies adaptées ; ce code traitant des problématiques d’ingénieurie de données, statistique, clustering et scoring. Adaptation du code aux besoins des commerciaux et aux nouvelles bases de données utilisées Documentation du projet Environnement technique :Python,R,SQL Azure,Git,Jira.

2017

DATA SCIENTIST

BEEZEN DATA SCIENTIST

Avril 2017 à Février 2018 : Generali Assurance, Equipe Connaissance Clients (PARIS) Elaboration de modèles de scoring de rétention clients pour produit d’assurance automobile via différents algorithmes de machine learning à savoir GLM, régressions pénalisées, Random Forest, XGBoost. Missions : • Collecte de la base de données via des jointures. • Etude descriptive. • Réalisation de traitements préliminaires tels que l'étude de corrélation et l'imputation des valeurs manquantes nécessaires pour la mise en place de modèles de régression logistique et logistiques pénalisées. • Mise en place des modèles de régression logistique et logistiques pénalisées (Ridge, Lasso et Elastic Net). • Mise en place de modèle de machine Learning à base d'arbres tels que Random forest et XGBoost. • Evaluation des modèles obtenus. Environnement technique : R (librairies Machine Learning : caret, xgboost, randomforest, …),SAS (proc SQL).

Formations

Bac +5 - -