EN: Undergraduate Pharmacy Students (no prior ML experience required)
DE: Pharmaziestudierende im Grundstudium (keine Vorkenntnisse in ML erforderlich)
EN: 1–1.5 Days (Intensive Hands-on Practical Course)
DE: 1–1,5 Tage (Intensiver praxisorientierter Kurs)
EN: 8 groups (2–3 students per group)
DE: 8 Gruppen (jeweils 2–3 Studierende)
EN:
This course introduces the fundamentals of Machine Learning (ML) and Deep Learning (DL) for in silico virtual screening in drug discovery. Students will use Jupyter Notebooks on JupyterHub to work through a complete ML pipeline.
DE:
Dieser Kurs vermittelt die Grundlagen von Maschinellem Lernen (ML) und Deep Learning (DL) für das in silico Virtuelle Screening in der Arzneimittelentwicklung. Die Studierenden nutzen Jupyter Notebooks auf JupyterHub zur Bearbeitung einer vollständigen ML-Pipeline.
Goals / Lernziele:
- EN: Understand ML concepts and workflows in pharmacy
DE: ML-Konzepte und Arbeitsabläufe in der Pharmazie verstehen - EN: Handle real compound data and generate features (e.g. ECFP)
DE: Reale Wirkstoffdaten verarbeiten und Merkmale erzeugen (z. B. ECFP) - EN: Train and evaluate models for screening
DE: Modelle für das Screening trainieren und bewerten - EN: Perform screening and interpret hit compounds
DE: Wirkstoffscreenings durchführen und Treffer interpretieren
- EN: Introduction to ML, DL, Virtual Screening, Supervised Learning
DE: Einführung in ML, DL, Virtuelles Screening, Überwachtes Lernen - EN: Dataset preprocessing and feature representation (ECFP)
DE: Datenvorverarbeitung und Merkmalsdarstellung (ECFP)
- EN: Jupyter Notebooks, Dataframes, ECFP generation
DE: Jupyter Notebooks, Dataframes, ECFP-Erzeugung - EN: PCA and clustering on datasets:
- PPAR-γ (fat metabolism)
- A2A (caffeine receptor)
DE: PCA und Clustering mit Datensätzen: - PPAR-γ (Fettstoffwechsel)
- A2A (Koffeinrezeptor)
- EN: ML algorithms (SVM, RF, XGBoost, NN)
DE: ML-Algorithmen (SVM, RF, XGBoost, NN) - EN: Model evaluation (ROC curve, confusion matrix)
DE: Modellbewertung (ROC-Kurve, Konfusionsmatrix) - EN: Screening databases: DrugBank and focused libraries
DE: Screening-Datenbanken: DrugBank und fokussierte Substanzbibliotheken
- EN: Train and evaluate models using prepared notebooks
DE: Modelle mithilfe vorbereiteter Notebooks trainieren und bewerten - EN: Perform virtual screening and visualize results
DE: Virtuelles Screening durchführen und Ergebnisse visualisieren
Each group will submit:
Jede Gruppe reicht ein:
- 📊 EN: Visualizations (clustering, screening)
DE: Visualisierungen (Clustering, Screening) - 🧾 EN: Short presentation of findings and leads
DE: Kurze Präsentation der Ergebnisse und Wirkstoffkandidaten
- EN: All work done via JupyterHub on a hosted server
DE: Alle Arbeiten erfolgen über JupyterHub auf einem Server - EN: Datasets and scripts are preloaded for each group
DE: Datensätze und Skripte sind vorab für jede Gruppe geladen - EN: All models are CPU-friendly and beginner-accessible
DE: Alle Modelle sind CPU-kompatibel und für Einsteiger geeignet