Assistant RAG avec Mistral

Ce projet implémente un assistant virtuel basé sur le modèle Mistral, utilisant la technique de Retrieval-Augmented Generation (RAG) pour fournir des réponses précises et contextuelles à partir d'une base de connaissances personnalisée.

Une démo est disponible ici sur streamlit.

Fonctionnalités

🔍 Recherche sémantique avec FAISS pour trouver les documents pertinents
🤖 Génération de réponses avec les modèles Mistral (Small ou Large)
⚙️ Paramètres personnalisables (modèle, nombre de documents, score minimum)

Prérequis

Python 3.9+
Clé API Mistral (obtenue sur console.mistral.ai)
Clé Google Gemini (obtenue sur aistudio)

Installation

Cloner le dépôt

git clone <url-du-repo>
cd <nom-du-repo>

Installer les dépendances

uv sync

Configurer la clé API

Créez un fichier .env à la racine du projet avec le contenu suivant :

MISTRAL_API_KEY=votre_clé_api_mistral
GEMINI_API_KEY=votre_clé_api_gemini

Structure du projet

.
├── data                                # Données brutes et base de connaissances
├── evaluation
│   ├── evaluate_ragas.py               # Script d'évaluation
│   ├── generate_dataset.py             # Script de generation des réponses au fichier questions.csv
│   └── questions.csv
├── src
│   ├── nba_assistant
│   │   ├── app.py                      # Interface utilisateur Streamlit
│   │   ├── config
│   │   │   ├── config.py               # Paramètres personnalisables
│   │   ├── database
│   │   │   ├── database_creation.py    # Création de la base de données SQLite
│   │   │   ├── load_excel_to_db.py     # Chargement des données depuis un fichier Excel
│   │   │   ├── nba_db.db               # Base de données SQLite
│   │   │   └── schemas.py              # Schemas Pydantic pour la base de données
│   │   ├── llm
│   │   │   ├── data_loader.py          # Chargement des données à partir de divers fichiers
│   │   │   ├── indexer.py              # Script d'indexation des données avec FAISS
│   │   │   ├── llm.py                  # Classe RAGAgent
│   │   │   ├── sql_tool.py             # Tool pour la gestion de la base de données
│   │   │   ├── vector_store_management.py  # Gestion de l'index FAISS
│   │   │   └── vector_store_tool.py     # Tool pour la recherche sémantique
│   │   └── utils
│   │       ├── logging_handler.py      # Configuration du logging

Evalue les performances de l'application en utilisant des questions et des réponses fournies. Évaluation d'un système RAG par Mistral

Utilisation

1. Ajouter des documents

Placez vos documents dans le dossier data/raw/. Les formats supportés sont :

PDF
TXT
DOCX
CSV
JSON

Vous pouvez organiser vos documents dans des sous-dossiers pour une meilleure organisation.

2. Indexer les documents

Exécutez le script d'indexation pour traiter les documents et créer l'index FAISS :

uv run python3 src/llm/indexer.py

Ce script va :

Charger les documents depuis le dossier data/raw/
Découper les documents en chunks
Générer des embeddings avec Mistral
Créer un index FAISS pour la recherche sémantique
Sauvegarder l'index et les chunks dans le dossier data/vector_store/

3. Lancer l'application

uv run streamlit run src/app.py

L'application sera accessible à l'adresse http://localhost:8501 dans votre navigateur.

Personnalisation

Vous pouvez personnaliser l'application en modifiant les paramètres dans src/config/config.py :

Modèles Mistral utilisés
Taille des chunks et chevauchement
Nombre de documents par défaut
Nom de la commune ou organisation

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.streamlit		.streamlit
assets		assets
data		data
evaluation		evaluation
src/nba_assistant		src/nba_assistant
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Assistant RAG avec Mistral

Fonctionnalités

Prérequis

Installation

Structure du projet

Utilisation

1. Ajouter des documents

2. Indexer les documents

3. Lancer l'application

Personnalisation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Assistant RAG avec Mistral

Fonctionnalités

Prérequis

Installation

Structure du projet

Utilisation

1. Ajouter des documents

2. Indexer les documents

3. Lancer l'application

Personnalisation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages