Hybrid Explainable Framework for Stroke Prediction

Hybrid Explainable Framework for Stroke Prediction is an advanced AI-powered system for early stroke prediction that combines machine learning, deep learning, and explainable AI techniques. This comprehensive framework enhances predictive accuracy while ensuring clinical interpretability for healthcare applications.

⚠️ Notice: This project is currently under publication. Only the web-based interface and essential components are included for demonstration purposes. Full model architecture, dataset preprocessing scripts, and training configurations will be released post-publication.

📊 Data Analysis & Exploratory Data Analysis

Class Distribution Analysis

The dataset exhibits significant class imbalance with only 4.9% stroke-positive cases, necessitating advanced resampling techniques for robust model training.

Univariate Distributions by Stroke Status

Age Analysis: Stroke-positive individuals show distinct age distribution patterns, with higher risk observed in older demographic groups.

BMI Analysis: Body Mass Index distributions reveal subtle differences between stroke and non-stroke cases, informing feature engineering strategies.

avg_glucose_level_distribution_by_stroke

Glucose Level Analysis: Average glucose levels demonstrate significant variations between stroke-positive and negative cases, highlighting its importance as a clinical predictor.

📈 Model Performance Evaluation

Comprehensive Model Comparison

Multi-faceted evaluation across 12 machine learning algorithms demonstrating performance trade-offs across accuracy, F1-score, precision, recall, ROC-AUC, and PR-AUC metrics.

ROC Curve Analysis

Receiver Operating Characteristic curves showing strong discriminative power across all evaluated models, with consistent performance across different classification thresholds and excellent area under curve values.

🔬 Explainable AI (XAI)

Integrated Feature Importance Analysis

shap_lime_tabnet_fn_approx_final_labeled_quantile

Combined SHAP and LIME analysis revealing key clinical features contributing to stroke prediction, with age and glucose levels emerging as dominant risk factors in model decision-making.

🏗️ Technical Architecture

End-to-End Prediction Pipeline

Our framework implements a comprehensive workflow:

Data Preprocessing: Handling class imbalance, missing values, and feature normalization
Feature Engineering: Clinical feature transformation and selection
Hybrid Modeling: Machine learning and deep learning ensemble approaches
Model Interpretation: Explainable AI techniques for clinical transparency
Performance Validation: Comprehensive evaluation across multiple metrics

🔧 Key Features

🤖 Hybrid AI Approach: Combines traditional machine learning and modern deep learning models
🔍 Explainable Predictions: Transparent feature importance for clinical trust
🔄 Robust Preprocessing: Advanced handling of class imbalance and data quality
📊 Comprehensive Evaluation: Multi-metric assessment across diverse algorithms
🏥 Clinical Relevance: Domain-informed feature selection and interpretation
⚡ Scalable Architecture: Modular design for healthcare integration

🛠️ Technical Stack

Programming: Python 3.8+
Machine Learning: Scikit-learn, XGBoost, LightGBM
Deep Learning: PyTorch-based architectures
Explainable AI: SHAP, LIME for model interpretability
Visualization: Matplotlib, Seaborn, Plotly
Data Processing: Pandas, NumPy for efficient data manipulation
Model Optimization: Advanced hyperparameter tuning techniques

📁 Repository Structure

Hybrid-Stroke-Prediction/
├── src/
│   ├── data_preprocessing/       # Data cleaning and preparation pipelines
│   ├── feature_engineering/      # Feature selection and transformation
│   ├── models & evaluation/      # Model implementations & performance assessment
├── config/                       # Model and experiment configurations
├── tests/                        # Comprehensive test suites
├── requirements.txt              # Project dependencies
└── README.md                     # Project documentation

🎯 Research Contributions

1. Clinical AI Integration

Bridges the gap between high-performance AI models and clinical practicality through interpretable and actionable predictions.

2. Advanced Modeling Strategy

Implementation of both traditional machine learning algorithms and modern deep learning architectures for comprehensive predictive performance.

3. Explainable Healthcare AI

Transparent model reasoning enabling clinical validation and trust in AI-assisted decision making.

4. Robust Evaluation Framework

Multi-dimensional assessment across accuracy, sensitivity, specificity, and clinical relevance metrics.

📊 Performance Highlights

Strong Predictive Performance: Comprehensive model evaluation demonstrating reliable stroke prediction capabilities across multiple algorithms
Clinical Interpretability: Transparent feature importance analysis aligning with medical domain knowledge
Robust Generalization: Consistent performance across different validation strategies and data splits
Scalable Architecture: Modular design suitable for integration with healthcare systems

🔬 Methodology Overview

Our systematic approach encompasses:

Comprehensive Data Analysis: In-depth exploratory data analysis to understand feature distributions and relationships
Advanced Feature Engineering: Domain-informed transformations and selection techniques
Diverse Model Development: Implementation of multiple machine learning and deep learning approaches
Rigorous Evaluation: Multi-faceted assessment including performance metrics and model interpretability
Clinical Validation: Framework designed for healthcare professional review and practical application

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
data_preprocessing.ipynb		data_preprocessing.ipynb
feature_engineering.ipynb		feature_engineering.ipynb
models_evaluation.ipynb		models_evaluation.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Hybrid Explainable Framework for Stroke Prediction

📊 Data Analysis & Exploratory Data Analysis

Class Distribution Analysis

Univariate Distributions by Stroke Status

📈 Model Performance Evaluation

Comprehensive Model Comparison

ROC Curve Analysis

🔬 Explainable AI (XAI)

Integrated Feature Importance Analysis

🏗️ Technical Architecture

End-to-End Prediction Pipeline

🔧 Key Features

🛠️ Technical Stack

📁 Repository Structure

🎯 Research Contributions

1. Clinical AI Integration

2. Advanced Modeling Strategy

3. Explainable Healthcare AI

4. Robust Evaluation Framework

📊 Performance Highlights

🔬 Methodology Overview

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Hybrid Explainable Framework for Stroke Prediction

📊 Data Analysis & Exploratory Data Analysis

Class Distribution Analysis

Univariate Distributions by Stroke Status

📈 Model Performance Evaluation

Comprehensive Model Comparison

ROC Curve Analysis

🔬 Explainable AI (XAI)

Integrated Feature Importance Analysis

🏗️ Technical Architecture

End-to-End Prediction Pipeline

🔧 Key Features

🛠️ Technical Stack

📁 Repository Structure

🎯 Research Contributions

1. Clinical AI Integration

2. Advanced Modeling Strategy

3. Explainable Healthcare AI

4. Robust Evaluation Framework

📊 Performance Highlights

🔬 Methodology Overview

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages