Bu proje, sentetik bir ruh sağlığı veri seti üzerinde LightGBM algoritması kullanılarak geliştirilmiş bir risk tahminleme çalışmasıdır. Projenin temel amacı, yaşam tarzı faktörleri ve aile geçmişi gibi değişkenlerin ruh sağlığı riskleri üzerindeki etkisini analiz etmektir.
- Algoritma: LightGBM (Light Gradient Boosting Machine)
- Veri Seti: Sentetik Ruh Sağlığı Risk Veri Seti (
mental_health_risk_dataset.csv) - Odak Noktası: Kategorik veri işleme, korelasyon analizi ve özellik önemi (Feature Importance).
- Veri Ön İşleme:
objecttipindeki kategorik sütunlar, LightGBM'in yerel desteğinden faydalanmak içincategorytipine dönüştürüldü. - Keşifsel Veri Analizi (EDA): Değişkenler arasındaki ilişkiler korelasyon matrisi ile incelendi.
- Modelleme: Veri seti eğitim ve test olarak ayrılarak LightGBM modeli eğitildi.
- Değerlendirme: Model performansı için Confusion Matrix ve Classification Report oluşturuldu.
Sentetik veri yapısı nedeniyle model yüksek doğruluk oranlarına ulaşmıştır:
- Accuracy: %100
- F1-Score: 1.00
Modelin karar verirken en çok ağırlık verdiği değişkenler:
- Haftalık Fiziksel Aktivite Saatleri
- Ailede Ruhsal Hastalık Geçmişi
- Uyku Kalitesi