Skip to content

Teaching material for an 8th-semester pharmacy course at the FU Berlin on ligand based ML in computer aided drug design, with practical examples for preparing molecular data, training simple models, and interpreting their performance.

Notifications You must be signed in to change notification settings

wolberlab/AI_teaching

 
 

Repository files navigation

🧪 Practical Course: Machine Learning for Virtual Screening

🧪 Praktischer Kurs: Maschinelles Lernen für Virtuelles Screening

🎯 Target Audience / Zielgruppe

EN: Undergraduate Pharmacy Students (no prior ML experience required)
DE: Pharmaziestudierende im Grundstudium (keine Vorkenntnisse in ML erforderlich)

🗓️ Course Duration / Kursdauer

EN: 1–1.5 Days (Intensive Hands-on Practical Course)
DE: 1–1,5 Tage (Intensiver praxisorientierter Kurs)

👥 Group Structure / Gruppenstruktur

EN: 8 groups (2–3 students per group)
DE: 8 Gruppen (jeweils 2–3 Studierende)


🧠 Course Overview / Kursübersicht

EN:
This course introduces the fundamentals of Machine Learning (ML) and Deep Learning (DL) for in silico virtual screening in drug discovery. Students will use Jupyter Notebooks on JupyterHub to work through a complete ML pipeline.

DE:
Dieser Kurs vermittelt die Grundlagen von Maschinellem Lernen (ML) und Deep Learning (DL) für das in silico Virtuelle Screening in der Arzneimittelentwicklung. Die Studierenden nutzen Jupyter Notebooks auf JupyterHub zur Bearbeitung einer vollständigen ML-Pipeline.

Goals / Lernziele:

  • EN: Understand ML concepts and workflows in pharmacy
    DE: ML-Konzepte und Arbeitsabläufe in der Pharmazie verstehen
  • EN: Handle real compound data and generate features (e.g. ECFP)
    DE: Reale Wirkstoffdaten verarbeiten und Merkmale erzeugen (z. B. ECFP)
  • EN: Train and evaluate models for screening
    DE: Modelle für das Screening trainieren und bewerten
  • EN: Perform screening and interpret hit compounds
    DE: Wirkstoffscreenings durchführen und Treffer interpretieren

📚 Course Structure / Kursstruktur

🔹 Session 1: Foundations and Environment Setup

🔹 Sitzung 1: Grundlagen und Systemeinrichtung

Background / Theorie:

  • EN: Introduction to ML, DL, Virtual Screening, Supervised Learning
    DE: Einführung in ML, DL, Virtuelles Screening, Überwachtes Lernen
  • EN: Dataset preprocessing and feature representation (ECFP)
    DE: Datenvorverarbeitung und Merkmalsdarstellung (ECFP)

Hands-on / Praxis:

  • EN: Jupyter Notebooks, Dataframes, ECFP generation
    DE: Jupyter Notebooks, Dataframes, ECFP-Erzeugung
  • EN: PCA and clustering on datasets:
    • PPAR-γ (fat metabolism)
    • A2A (caffeine receptor)
      DE: PCA und Clustering mit Datensätzen:
    • PPAR-γ (Fettstoffwechsel)
    • A2A (Koffeinrezeptor)

🔹 Session 2: Applying ML to Screening

🔹 Sitzung 2: Anwendung von ML für Screening

Background / Theorie:

  • EN: ML algorithms (SVM, RF, XGBoost, NN)
    DE: ML-Algorithmen (SVM, RF, XGBoost, NN)
  • EN: Model evaluation (ROC curve, confusion matrix)
    DE: Modellbewertung (ROC-Kurve, Konfusionsmatrix)
  • EN: Screening databases: DrugBank and focused libraries
    DE: Screening-Datenbanken: DrugBank und fokussierte Substanzbibliotheken

Hands-on / Praxis:

  • EN: Train and evaluate models using prepared notebooks
    DE: Modelle mithilfe vorbereiteter Notebooks trainieren und bewerten
  • EN: Perform virtual screening and visualize results
    DE: Virtuelles Screening durchführen und Ergebnisse visualisieren

📦 Deliverables / Abzugebende Leistungen

Each group will submit:
Jede Gruppe reicht ein:

  • 📊 EN: Visualizations (clustering, screening)
    DE: Visualisierungen (Clustering, Screening)
  • 🧾 EN: Short presentation of findings and leads
    DE: Kurze Präsentation der Ergebnisse und Wirkstoffkandidaten

⚙️ Technical Notes / Technische Hinweise

  • EN: All work done via JupyterHub on a hosted server
    DE: Alle Arbeiten erfolgen über JupyterHub auf einem Server
  • EN: Datasets and scripts are preloaded for each group
    DE: Datensätze und Skripte sind vorab für jede Gruppe geladen
  • EN: All models are CPU-friendly and beginner-accessible
    DE: Alle Modelle sind CPU-kompatibel und für Einsteiger geeignet

📁 Folder Structure / Ordnerstruktur (Beispiel)

About

Teaching material for an 8th-semester pharmacy course at the FU Berlin on ligand based ML in computer aided drug design, with practical examples for preparing molecular data, training simple models, and interpreting their performance.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 98.3%
  • Python 1.7%