Этот проект содержит два скрипта для обучения моделей обнаружения объектов:
- YOLO Training Script (
trainyolo.py): Обучение модели YOLO с интеграцией Comet.ml для отслеживания экспериментов. - Transformer-Based Detection Training Script (
traindetr.py): Обучение модели обнаружения объектов на основе трансформеров с использованием библиотеки Hugging Face Transformers.
Перед запуском скриптов убедитесь, что у вас установлены следующие библиотеки:
- Python 3.10.12
- PyTorch
- Transformers от Hugging Face
- Albumentations
- Supervision
- TorchMetrics
- Comet.ml (только для
train_yolo.py) - Другие зависимости, указанные в разделе Установка
-
Клонируйте репозиторий:
git clone https://github.com/SLENSER0/towerx_models cd towerx_models python3 -m venv venv source venv/bin/activate # Для Linux и macOS venv\Scripts\activate # Для Window pip install -r requirements.txt
- Обучение YOLO: Пример запуска скрипта для обучения yolo:
python train_yolo.py \
--comet_api_key YOUR_COMET_API_KEY \
--comet_project_name yolo_project \
--model_path yolo11x.pt \
--data_path data.yaml \
--epochs 25 \
--imgsz 1520 \
--device 0 \
--optimizer Adam \
--cos_lr \
--degrees 0.25 \
--scale 0.3 \
--save_period 10 \
--workers 4 \
--batch 8
- Обучение RT-DETR: Пример запуска скрипта для обучения RT-DETR:
python train_object_detection.py \
--img_size 1536 \
--output_dir ./finetune_outputs/ \
--train_images_directory_path /home/ubuntu/dataset/train/images \
--train_annotations_path /home/ubuntu/dataset/train/instances_train.json \
--val_images_directory_path /home/ubuntu/dataset/val/images \
--val_annotations_path /home/ubuntu/dataset/val/instances_val.json