Метрики качества предлагаю использовать из классической задачи классификации мультиклассовой
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html
Можно посчитать метрики отдельно на валидационной выборке и на тестовой. Здесь особо настраивать нечего, поэтому что валидационная и тестовая выборки - как тест работают.
В качестве baseline подхода можно взять этот https://github.com/lsd-maddrive/driver-stalker/blob/develop/notebooks/01-opencv-drowsiness.ipynb
Либо можно попробовать сделать что-то более сложное и качественное.
Но с другой стороны baseline подход на то и baseline, что это что-то простое и работающее только в ограниченных условиях
Метрики качества предлагаю использовать из классической задачи классификации мультиклассовой
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html
Можно посчитать метрики отдельно на валидационной выборке и на тестовой. Здесь особо настраивать нечего, поэтому что валидационная и тестовая выборки - как тест работают.
В качестве baseline подхода можно взять этот https://github.com/lsd-maddrive/driver-stalker/blob/develop/notebooks/01-opencv-drowsiness.ipynb
Либо можно попробовать сделать что-то более сложное и качественное.
Но с другой стороны baseline подход на то и baseline, что это что-то простое и работающее только в ограниченных условиях