🩺 Diabetes Prediction using Supervised Learning

🔍 Project Overview

This project applies supervised machine learning algorithms to predict whether a patient is diabetic based on diagnostic medical attributes. Using the Pima Indians Diabetes Dataset, we trained and evaluated multiple classification models to identify high-risk individuals and assist in early detection.

📊 Dataset

Source: Kaggle – Pima Indians Diabetes Database
Features: Pregnancies, Glucose, Blood Pressure, Skin Thickness, Insulin, BMI, Diabetes Pedigree Function, Age
Target: Outcome (0: Non-Diabetic, 1: Diabetic)

🚀 Features Implemented

✅ Data cleaning & exploration
✅ Feature scaling with StandardScaler
✅ Model training: Logistic Regression, Random Forest, and SVM
✅ Model evaluation using:
- Accuracy, Precision, Recall, F1-Score
- Confusion Matrix & Classification Report
- ROC Curve & AUC Score
✅ Single-patient prediction with real data simulation
✅ Clean, modular, and well-commented code

🧠 Algorithms Used

Model	Description
Logistic Regression	Interpretable baseline classifier
Random Forest	Ensemble method for robust predictions
Support Vector Machine (SVM)	Effective for small-to-medium datasets with scaling

📈 Performance

The Random Forest classifier showed the best performance with:

Accuracy: ~85%
ROC AUC Score: High discriminative power
Balanced precision and recall, ideal for medical diagnosis

🔮 Sample Prediction

sample = np.array([[6, 148, 72, 35, 0, 33.6, 0.627, 50]])
sample_scaled = scaler.transform(sample)
prediction = model.predict(sample_scaled)

🛠️ Tech Stack

Python (NumPy, Pandas, Scikit-Learn)
Matplotlib & Seaborn for visualizations
Jupyter Notebook / Google Colab

💡Future Improvements

Hyperparameter tuning using GridSearchCV
Model deployment with Streamlit or Flask
Cross-validation and imputation for missing values
Advanced models like XGBoost or LightGBM

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
Diabetes_Prediction_Improved (1).ipynb		Diabetes_Prediction_Improved (1).ipynb
README.md		README.md
diabetes.csv		diabetes.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🩺 Diabetes Prediction using Supervised Learning

🔍 Project Overview

📊 Dataset

🚀 Features Implemented

🧠 Algorithms Used

📈 Performance

🔮 Sample Prediction

🛠️ Tech Stack

💡Future Improvements

About

Uh oh!

Releases

Packages

Languages

shretimag/Diabetes-Detection

Folders and files

Latest commit

History

Repository files navigation

🩺 Diabetes Prediction using Supervised Learning

🔍 Project Overview

📊 Dataset

🚀 Features Implemented

🧠 Algorithms Used

📈 Performance

🔮 Sample Prediction

🛠️ Tech Stack

💡Future Improvements

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages