Software Feature Detection using Source Code Minimaps as Visual Signatures

This repository trains deep learning classifiers on grayscale 128×128 minimap images, using GPU when available.
It automatically runs three classification tasks in one execution, using the label columns from the provided CSV:

type (≈63 classes)
project (≈99 classes)
author (≈97 classes)

The pipeline is clarity-first, modular, and reproducible (fixed seed). It logs progress,
saves confusion matrices, ROC curves (micro/macro AUC), classification reports, checkpoints, and XAI (Integrated Gradients).

Authors

Dataset & CSV

Place your images under data/minimaps_root/ (recursively) and the CSV at data/catalogo.csv (or set paths via CLI/YAML).
The CSV must include:

image → key column that matches image basenames (without extension).
One of the label columns: type, project, or author.
Other descriptive columns such as file_path and file_name can be used for traceability.

Quickstart (PyCharm + venv)

python3 -m venv .venv
source .venv/bin/activate    # Windows: .venv\Scripts\activate
pip install -r requirements.txt

# Train all three tasks (type, project, author):
python train_minimaps.py --config configs/resnet18.yaml

Outputs

A new run folder is created under outputs/run-YYYYmmdd-HHMMSS/. For each task, you will find:

metrics/metrics.json, metrics.csv, classification_report.txt
confusion_matrix.png
roc_curves_micro_macro.png (micro/macro ROC curves), plus per-class AUC in metrics
checkpoints/best.pt, last.pt
xai/integrated_gradients/ (attributions on a few validation samples per class)

Configuration

Edit configs/default.yaml or override via CLI (--root-dir, --csv-path, --csv-label-columns etc.).

How to cite (Zenodo)

After creating a Zenodo record for this dataset/code, replace the DOI placeholder below.

BibTeX:

@dataset{minimaps-zenodo, title = {Software Feature Detection using Source Code Minimaps as Visual Signatures},

year = {2025}, publisher = {Zenodo}, version = {1.1}, doi = {10.5281/zenodo.16929672}, url = {https://zenodo.org/records/16894040](https://zenodo.org/records/16929672} }

License

This code is provided for research purposes. Check dataset/image licenses before redistribution.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
configs		configs
src		src
.gitignore		.gitignore
README.md		README.md
minimap_report.py		minimap_report.py
requirements.txt		requirements.txt
requires.txt		requires.txt
train_minimaps.py		train_minimaps.py
xai_global.py		xai_global.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Software Feature Detection using Source Code Minimaps as Visual Signatures

Authors

Dataset & CSV

Quickstart (PyCharm + venv)

Outputs

Configuration

How to cite (Zenodo)

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Software Feature Detection using Source Code Minimaps as Visual Signatures

Authors

Dataset & CSV

Quickstart (PyCharm + venv)

Outputs

Configuration

How to cite (Zenodo)

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages