Skip to content
View Souley225's full-sized avatar

Highlights

  • Pro

Block or report Souley225

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Souley225/README.md

Salut, moi c'est Souleymane

Typing SVG

LinkedIn GitHub Email Medium


Présentation

Data Scientist titulaire d’un Master en Économétrie et Statistique Appliquée. Maîtrise les étapes clés du cycle de vie des modèles de Machine Learning, du feature engineering au déploiement, avec une base solide en modélisation statistique et prédictive. Première expérience du déploiement via API, capable de passer du prototype à la production. Forte appétence pour l’intégration des pratiques MLOps.

Compétences clés

Modélisation prédictive Scoring MLOps Déploiement Cloud Analyse statistique


Stack Technique

Langages & Outils

Python R SQL SAS

Machine Learning & Data Science

Scikit-learn Pandas NumPy XGBoost LightGBM CatBoost

MLOps & Production

MLflow Docker FastAPI GitHub Actions DVC Optuna Hydra

Cloud & Plateformes

Google Cloud BigQuery Vertex AI Dataiku

Visualisation & BI

Streamlit Power BI Plotly Matplotlib


Expérience Professionnelle

Consultant Data Scientist | Micropole (Groupe Talan)

Mars 2025 – Septembre 2025 | Paris, France

Réalisations clés :

  • Conception et déploiement d'un pipeline ML complet sur Google Cloud et BigQuery
  • Mise en place d'une analyse de segmentation RFM pour le profilage et le ciblage de la base clients
  • Développement d'une Market Basket Analysis pour l'identification d'opportunités de cross-sell et upsell
  • Création de tableaux de bord pour les equipes marketing.

Technologies : GCP Vertex AI BigQuery Scikit-learn XGBoost Power BI Docker Git


Projets Phares

Pipeline de Prédiction du Churn Client

GitHub

Pipeline MLOps prêt pour la production pour la prédiction du churn client avec automatisation complète et monitoring.

Implémentation technique :

  • Gestion de configuration avec Hydra pour des expériences reproductibles
  • Versioning et suivi des données avec DVC
  • Suivi des expériences et registre de modèles avec MLflow
  • Optimisation automatisée des hyperparamètres avec Optuna
  • Déploiement d'API REST avec FastAPI
  • Interface interactive construite avec Streamlit
  • Déploiement conteneurisé avec Docker Compose
  • Automatisation CI/CD via GitHub Actions

Impact business : Permet des stratégies de rétention client proactives avec scoring du risque de churn en temps réel.

Technologies : Python MLflow Docker FastAPI Streamlit


Segmentation Client & Market Basket Analysis

GitHub

Analyse client avancée combinant segmentation RFM et analyse d'association pour l'optimisation de stratégies marketing.

Composantes analytiques :

Segmentation RFM

  • Analyse Récence, Fréquence, Montant pour le profilage client
  • Système de scoring multidimensionnel pour la classification des segments
  • Identification des patterns comportementaux tout au long du cycle de vie client

Market Basket Analysis

  • Découverte d'associations de produits via l'algorithme Apriori
  • Identification d'opportunités de cross-sell par règles d'association
  • Développement de stratégies d'upsell basées sur les patterns d'achat

Impact business : Personnalisation marketing data-driven résultant en stratégies de campagne ciblées basées sur les comportements clients réels.

Technologies : Python Scikit-learn Pandas


Formation & Certifications

Formation Académique

Master en Économétrie & Statistique Appliquée
Université d'Orléans | 2022 – 2025

Licence en Économie
Université de Bourgogne | 2019 – 2022

Certifications Professionnelles

  • SAS Certified Statistical Business Analyst
  • SAS Base Programming Specialist
  • Python for Data Science
  • Dataiku Core Designer
  • Dataiku ML Practitioner

Langues

Français : Langue maternelle
Anglais : Professionnel (TOEIC 895 - C1)
Espagnol : Notions


Approche Professionnelle

Construire des solutions ML fiables nécessite de combiner rigueur statistique et discipline d'ingénierie. Mon focus est de créer des pipelines prêts pour la production qui délivrent une valeur business mesurable, de l'exploration initiale au déploiement automatisé. Chaque composant doit être testé, reproductible et maintenable.

Principes clés :

  • Transformer les données en insights business actionnables
  • Équilibrer méthodologie scientifique et pragmatisme d'ingénieur
  • Concevoir des solutions fiables, scalables et impactantes
  • Garantir la clarté et la testabilité du pipeline de bout en bout

Statistiques GitHub

GitHub Streak

Activity Graph


Contact

Ouvert aux discussions autour de la data science, du machine learning et des bonnes pratiques MLOps.

LinkedIn Email


Profile views

Pinned Loading

  1. Customer_Churn_Project Customer_Churn_Project Public

    Python 2

  2. Customer_segmentation_project Customer_segmentation_project Public

    Python 1

  3. mlops-recommender-system mlops-recommender-system Public

    Python 2