Skip to content

Spark-Hubs/TruthMark

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

23 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TruthMark

Web'de okuduğunuz her türlü metin için anında doğruluk kontrolü sağlayan AI destekli bir fact-checking platformu. TruthMark, herhangi bir web sayfasında metin seçip anında analiz yapabileceğiniz bir Chrome eklentisi ve güçlü bir backend hizmetinden oluşmaktadır.

🎯 Ne İşe Yarar?

TruthMark, günümüzün bilgi kirliliği sorununa teknolojik bir çözüm sunar. İnternette karşılaştığınız haberleri, iddiaları ve bilgileri anında kontrol edebilir, güvenilirliklerini öğrenebilirsiniz.

Temel Özellikler

  • Anında Analiz: Herhangi bir web sayfasında metin seçin ve anında AI destekli doğruluk analizi alın
  • Kolay Kullanım: Çift tıklama, sağ tık veya Ctrl+tık ile analizi başlatın
  • Detaylı Sonuçlar: Doğruluk skoru, güvenilirlik seviyesi ve detaylı açıklama
  • Türkçe Destek: Türkçe içerik analizi ve Türkçe sonuçlar
  • Kaynak Gösterimi: Analiz sonuçlarında güvenilir kaynaklara referanslar

📊 Nasıl Çalışır?

  1. Chrome Eklentisi: Tarayıcınıza kurduğunuz eklenti, web sayfalarındaki metinleri analiz etmenizi sağlar
  2. AI Analizi: Seçtiğiniz metin, gelişmiş AI algoritmaları ile analiz edilir
  3. Kaynak Kontrolü: Bilgiler güncel kaynaklardan kontrol edilir ve doğrulanır
  4. Anında Sonuç: Saniyeler içinde detaylı analiz sonucu alırsınız

Ölçümlenme sonuçları

Proje diaqrami

WhatsApp Image 2025-08-14 at 21 17 48

Gelişim sürecinde karşılaşılan zorluklar ve çözümleri

Kullandığımız LLM modeli, küçük bir sunucu üzerinde çalıştığı için boyut olarak küçük bir modeldir. Modelin performansını artırmak amacıyla fine-tuning yapmamız gerekmektedir. Ancak elimizde yeterli miktarda gerçek veri bulunmadığı için, sentetik veri üretimi yöntemini tercih ettik.

Veri üretim süreci şu şekilde ilerlemektedir:

1.⁠ ⁠Web Scraping

  • İlgili konularda web üzerinden veri toplanır.

2.⁠ ⁠Veri Dönüşümü (Synthetic Data Generation)

  • Toplanan ham veriler, GPT ve Claude gibi yapay zeka araçlarına gönderilerek sentetik veriye dönüştürülür.

3.⁠ ⁠Veri Yapılandırma

  • Üretilen veriler, tarafımızca belirlenen özel bir veri yapısına (structure) oturtulur.

Bu süreç sonunda elde edilen veriler, LLM modelimizin fine-tuning aşamasında kullanılmaktadır.

Gereksinimler

TruthMark, Türkçe ve İngilizce metinlerin doğruluğunu kontrol eden, Chrome eklentisi + backend API yapısında çalışan bir platformdur. Sistem, gerçek zamanlı web scraping ile güvenilir kaynaklardan veri toplar ve LLM tabanlı analiz yapar.

1. Donanım Gereksinimleri

Ortam Minimum Önerilen Açıklama
Production 4 vCPU, 8GB RAM, 50GB SSD 8 vCPU, 16GB RAM, 100GB SSD Yalnızca scraping + API servisleri çalışır, GPU gerekmez
Fine-Tuning RTX 3060 (12GB) GPU RTX 3090 / A100 (40GB) GPU Sentetik + gerçek veri ile offline model eğitimi
Depolama 50GB SSD 200GB NVMe SSD Veri geçmişi + scraping logları

2. Dataset Gereksinimleri

Model Boyutu Minimum Veri (örnek sayısı) Açıklama
Küçük 1,000–10,000 Türkçe + İngilizce karışık
Orta 10,000–50,000 Daha geniş konu çeşitliliği gerekir
Büyük 50,000+ Çoklu dil ve çok kaynaklı veri

3. Operasyonel Gereksinimler

  • Scraping Frekansı: 1–3 saatte bir veri güncelleme
  • Dil Desteği: Türkçe (optimizasyonlu), İngilizce
  • Veri Kaynakları: Fact-check siteleri, haber ajansları, resmi açıklamalar
  • Güncelleme Süreci:
    • Günlük scraping + veri temizleme
    • Haftalık LoRA/incremental fine-tuning
    • Aylık model değerlendirme ve iyileştirme

📁 Proje Yapısı

truthmark/
├── chrome-extension/     # Tarayıcı eklentisi
├── backend/              # Backend API servisi
├── landing-page/         # Tanıtım web sitesi
└── README.md             # Bu dosya

📚 Detaylı Dokümantasyon

Her bileşen için detaylı teknik bilgiler ve kurulum talimatları:

🚀 Hızlı Başlangıç

Kullanıcılar İçin

  1. Chrome eklentisini yükleyin
  2. Herhangi bir web sayfasında metin seçin
  3. Çift tıklayın veya sağ tıklayıp "Analiz Et" seçin
  4. Anında sonuçları görün

Geliştiriciler İçin

  1. Projeyi klonlayın: git clone https://github.com/Spark-Hubs/Teknofest2025-TruthMark.git
  2. Backend servisi için: backend/README.md talimatlarını takip edin
  3. Chrome eklentisi için: chrome-extension/README.md talimatlarını takip edin

Veri setimiz

ai-model/fine-tuning-dataset.jsonl

🌍 Dil Desteği

TruthMark şu anda Türkçe ve İngilizce dillerini desteklemektedir. Türkçe içerik analizi ve Türkçe kullanıcı arayüzü ile Türk kullanıcılar için optimize edilmiştir.

🎯 Kullanım Alanları

  • Haber Doğrulama: Sosyal medyada gördüğünüz haberlerin doğruluğunu kontrol edin
  • Araştırma: Akademik çalışmalarınızda karşılaştığınız bilgileri doğrulayın
  • Eğitim: Öğrenciler güvenilir kaynak kontrolü yapabilir
  • İş Hayatı: Raporlarda kullanacağınız bilgilerin doğruluğunu teyit edin

📄 Lisans

Bu proje MIT lisansı altında lisanslanmıştır. Detaylar için LICENSE dosyasına bakın.


Daha doğru bir internet için ❤️ ile yapıldı

About

Spark takımı

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •