Büyük Transformer modellerini mobil ve edge cihazlarda çalıştırmak için kapsamlı rehber ve araçlar.
-
Quantization - INT8, FP16, Dynamic Quantization
- Model boyutu: 4x azalma
- Minimal doğruluk kaybı (~1-2%)
-
Knowledge Distillation - Öğretmen-öğrenci öğrenimi
- Model boyutu: 6-10x azalma
- Doğruluk korunur (~2-4% kayıp)
-
ONNX Runtime - Cross-platform deployment
- Hardware-accelerated inference
- Mobil ve edge cihaz desteği
- Yukarıdaki butona tıkla
- Runtime → Change runtime type → GPU
- Runtime → Run all
- 5 dakika bekle ve sonuçları izle! 🎉
# Repository'yi klonla
git clone https://github.com/mtkaya/transformer-edge-optimization.git
cd transformer-edge-optimization
# Bağımlılıkları yükle
pip install -r requirements.txt
# Jupyter'i başlat
jupyter notebook notebooks/- FP32 → INT8 dönüşümü
- Model boyutu: 4x azaltma
- İnferans hızı: 2x artış
- PyTorch → ONNX dönüşümü
- Dynamic quantization
- Cross-platform deployment
- Teacher-student training
- Model boyutu: 7.6x azaltma
- BERT → TinyBERT
import torch
from transformers import AutoModelForSequenceClassification
# Model yükle
model = AutoModelForSequenceClassification.from_pretrained('bert-base-uncased')
# Quantize et (FP32 → INT8)
quantized_model = torch.quantization.quantize_dynamic(
model, {torch.nn.Linear}, dtype=torch.qint8
)
# Model boyutu 4x daha küçük! 🎉
print("Model 4x daha küçük, 2x daha hızlı!")| Teknik | Boyut Azaltma | Hız Artışı | Doğruluk |
|---|---|---|---|
| Quantization (INT8) | 4.0x | 2.1x | 91.2% |
| ONNX Runtime | 3.8x | 2.2x | 88.2% |
| Distillation | 7.6x | 3.0x | 87.1% |
| Combined | 31.4x | 9.5x | 85.8% |
- ✅ Android - TensorFlow Lite
- ✅ iOS - Core ML
- ✅ Web - Transformers.js
- ✅ Edge Devices - ONNX Runtime
Katkılarınızı bekliyoruz!
- Fork yapın
- Feature branch oluşturun
- Commit yapın
- Pull Request açın
Detaylar için: CONTRIBUTING.md
Bu proje MIT lisansı altındadır - detaylar için LICENSE dosyasına bakın.
- Hugging Face - Transformers ve Optimum
- ONNX - Model interoperability
- Açık kaynak topluluğuna ❤️
- GitHub Issues: Sorun bildir
- Discussions: Tartışmalara katıl
⭐ Projeyi beğendiyseniz yıldız vermeyi unutmayın! ⭐
Made with ❤️ for the AI community