Handwritten Digit Recognition (C++)

This project explores handwritten digit recognition using basic machine learning algorithms written from scratch in C++.

It is not a finished system. It is a learning-focused implementation.

Overview

The system reads raw dataset files (MNIST format), processes them, and applies a classification algorithm.

Main components:

Data: Represents a single data sample (image + label)
DataHub: Handles dataset loading and association
KNN: Implements k-nearest neighbors classification

Dataset

MNIST handwritten digit dataset
Binary IDX file format
Image and label files are manually parsed

Implemented Algorithm

K-Nearest Neighbors (KNN)

Distance-based classification
Uses dataset loaded through DataHub
Example usage:
- K = 3
- Finds nearest samples and predicts label

Project Structure

/Data

Data representation and parsing

/Data Hub

Dataset loading and management

/KNN Algorithm

KNN implementation

/archive

Dataset files (MNIST)

/main.cpp

Entry point

How It Works

Load dataset paths (train + test)
Parse IDX files into memory
Associate images with labels
Run KNN on test data
Predict labels based on nearest neighbors

Notes

Written for learning purposes
Hardcoded dataset paths (needs refactor)
No optimization for large datasets
Error handling is minimal

Known Issues

Some unstable behavior during dataset parsing
No validation for corrupted files
Performance drops with large input size

TODO

Remove hardcoded paths (make configurable)
Improve parsing robustness
Add dataset normalization
Optimize KNN (distance calculation, memory usage)
Add accuracy evaluation (confusion matrix, metrics)

Build

mkdir build
cd build
cmake ..
make
Run

Make sure dataset paths are correctly set inside main.cpp.

Why This Project

The goal is to understand:

How raw data is handled in ML systems
How simple algorithms like KNN actually work internally
Memory and performance constraints in low-level implementations

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.idea		.idea
Data Hub		Data Hub
Data		Data
KNN Algorithm		KNN Algorithm
archive		archive
cmake-build-debug		cmake-build-debug
CMakeLists.txt		CMakeLists.txt
README.md		README.md
main.cpp		main.cpp

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Handwritten Digit Recognition (C++)

Overview

Dataset

Implemented Algorithm

K-Nearest Neighbors (KNN)

Project Structure

How It Works

Notes

Known Issues

TODO

Build

Why This Project

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Handwritten Digit Recognition (C++)

Overview

Dataset

Implemented Algorithm

K-Nearest Neighbors (KNN)

Project Structure

How It Works

Notes

Known Issues

TODO

Build

Why This Project

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages