Celem zadania jest stworzenie hybrydowego modelu klasyfikatora, który łączy drzewa ID3 i maszyny wektorów nośnych (SVM).
- Drzewo decyzyjne (ID3): Zaimplementujemy algorytm ID3 do budowy drzew decyzyjnych, który wybiera podział w węźle na podstawie maksymalizacji zysku informacyjnego (information gain).
- SVM (Support Vector Machine): Będziemy korzystać z dostepnej implemenacji SVM z biblioteki scikit-learn.
- Dla każdego klasyfikatora generujemy losowy podzbiór danych treningowych.
- Co drugi klasyfikator jest zastępowany SVM. Wynik końcowy jest określany na podstawie głosowania większościowego.
Mateusz Ostaszewski Michał Sadowski
W celu instalacji projektu należy:
- pobrać kod z repozytorium
git clone https://gitlab-stud.elka.pw.edu.pl/mostasze/uma-random-forest-svm - Zainstalować wymagane biblioteki w środowisku wirtualnym
make requirements
Las losowy z SVM Drzewo ID3 Eksperyment z hiperparametrami Eksperyment porównawczy
- Przygotownie danych
make prepare_data - Przeprowadzenie eksprymentów
make run_experiments - Przegląd wyników
mlflow ui