Projet Animatronique : Marcus

Ce dépôt contient le code et la structure d’architecture pour un système d’animatronique capable de détecter des visages, reconnaître des émotions, parler et bouger la tête via des servomoteurs. L’objectif est de permettre à Marcus de réagir en temps réel aux personnes qui l’entourent (détection du regard, conversation audio, expressions faciales, etc.).

Aperçu du fonctionnement

Le diagramme ci-dessous illustre le flux de Communication/Fonctionnement entre les différents composants :

Raspberry Pi
Caméra + Reconnaissance faciale + Reconnaissance d'émotion
Envoi de la position (x,y,z) et des émotions détectées via MQTT au PC
PC central
- Fait office de Broker MQTT
- Utilise Whisper (STT) pour la reconnaissance vocale
- Fait des requêtes au LLM externe (OpenAI) via une API REST (avec le contexte : texte + émotion)
- Renvoie une réponse texte
- Gère la synthèse vocale (TTS) pour parler via un haut-parleur
Arduino OpenRB-150 (contrôle des servos)
- Reçoit des commandes UART (REGARDE, SURPRIS, NON IMPRESSIONER, etc.)
- Envoie son statut (ready) au départ
- Contrôle effectif des mouvements de la tête
Arduino MEGA (contrôle boule de cristal)
- Reçoit des commandes UART (ALLUME et ÉTEINT)
- Envoie son statut (ready) au départ
- Contrôle effectif des lumières de la boule de cristal

📄 License

Général

Ce projet est distribué sous la licence MIT pour tout le code source, les scripts, et les fichiers STL que nous avons créés.
Veuillez noter que certaines bibliothèques externes utilisées dans ce projet peuvent être soumises à des licences différentes. Il est de votre responsabilité de consulter et de respecter les conditions de licence de ces dépendances.

🗣️ Text-to-Speech (TTS)

Ce projet utilise edge-tts pour générer de la parole via le moteur TTS de Microsoft Edge.
Consultez leur répertoire GitHub pour plus d’informations sur leur licence et leur politique d'utilisation.

fer2013 : Base de données d'expressions faciales utilisée pour entraîner notre modèle de reconnaissance d'émotion.

Source : Kaggle - FER-2013
Utilisée uniquement à des fins de recherche et d'expérimentation.

Haar Cascade

Utilisé pour la détection de visages. Fichier haarcascade_frontalface_default.xml fourni par OpenCV sous licence Apache 2.0.

Structure générale

marcus/
├── docs/
│   └── ... (Documentation, schémas, etc.)
├── Code/
│   ├── Com/                      (Fonctions de communication MQTT et UART en python)
│   │   └── test_MQTT                             (Code test MQTT entre PC et PI)
│   │   └── test_MQTT_will.py                     (Code test MQTT entre PC et PI avec départ Mosquitto auto)
│   │   └── Test.py                               (Code test pour envoie de commande manuel au OpenRB-150)
│   │   └── dyn_test.py                           (Code test pour envoie de commande manuel spécialisé pour le cou et dynamixel)
│   │   └── Venv_setup.bat                        (Executable pour installer un environnement virtuel avec les requirements automatiquement)
│   │
│   ├── LLM/
│   │   └── marcus_mqtt.py                        (Code principal avec integration complète)
│   │   └── directttsb.py                         (Code modifier pour donner emotion a tts)
│   │   └── whisper_combat.py                     (Code pour transformer les paroles en txt)
│   │   └── Mega.cpp                              (Code pour controler les lumières de la boule de cristal)
│   │
│   ├── Servo/                    (Dossier platformio : Contient le code l'arduino OpenRB-150)
│   │   ├── src/main.cpp                          (Code principal de l'arduino)
│   │   ├── test/Demo.cpp                         (Demo de foncitonnement des moteurs dynamixel)
│   │   └── test/Scan.cpp                         (Code de détection des ID moteurs dynamixel)
│   │   └── test/main_backup.cpp                  (Code main fourni au départ peu modifier)
│   │   └── README                                (Quelque explication du fonctionnement de OpenRB-150)
│   │
│   └── Pi/
│       ├── FaceRecognition.py    (Détection visage, émotion et envoie info MQTT)
│       ├── EmotionRecognitionTraining.py         (Entrainnement d'un modèle IA avec la banque de donné FER2013)
│       ├── fer2013.zip                           (Banque de données FER2013 voir site officiel pour license)
│       ├── haarcascade_frontalface_default.xml   (Modèle IA pour détection de visage voir site officiel pour license)
│       ├── emotion_recognition_model.h5          (Modèle IA entrainé utiliser avec FaceRecognition)
│       ├── 60_model.h5                           (Alternative de modèle IA)
│       └── setup_venv.sh                         (Executable pour installer un environnement virtuel avec les requirements automatiquement)
│
├── STL                           (Dernier fichier stl des pièces imprimer)
│
└── README.md                     (Vous êtes ici)

Name		Name	Last commit message	Last commit date
Latest commit History 69 Commits
Code		Code
STL		STL
docs		docs
.gitignore		.gitignore
LICENSE		LICENSE
MIT License		MIT License
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet Animatronique : Marcus

Aperçu du fonctionnement

📄 License

Général

🗣️ Text-to-Speech (TTS)

fer2013 : Base de données d'expressions faciales utilisée pour entraîner notre modèle de reconnaissance d'émotion.

Haar Cascade

Structure générale

About

Uh oh!

Releases

Packages

Contributors 4

Uh oh!

Languages

License

philemonholland/marcus

Folders and files

Latest commit

History

Repository files navigation

Projet Animatronique : Marcus

Aperçu du fonctionnement

📄 License

Général

🗣️ Text-to-Speech (TTS)

fer2013 : Base de données d'expressions faciales utilisée pour entraîner notre modèle de reconnaissance d'émotion.

Haar Cascade

Structure générale

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Uh oh!

Languages

Packages