RAG (Retrieval-Augmented Generation) API

A Flask-based backend for document ingestion, semantic search, and influencer discovery using OpenAI and Google Gemini APIs. This project enables users to upload documents, generate embeddings, perform question answering over their data, and discover influencers for marketing campaigns.

Features

Document Upload & Embedding: Upload .txt, .pdf, .docx, .csv, or .xlsx files. The system extracts, chunks, and embeds the content using OpenAI’s embedding models and stores them with FAISS for efficient retrieval.
Semantic Q&A: Ask questions about your uploaded documents. The system retrieves relevant chunks and generates answers using OpenAI’s chat models.
Influencer Discovery: Generate a list of influencers matching campaign needs using Google Gemini’s generative AI.
Async Flask API: All endpoints are asynchronous for high performance.

Requirements

Python 3.8+
See requirements.txt for all dependencies.

Setup

Clone the repository:
```
git clone <repo-url>
cd RAG
```
Install dependencies:
```
pip install -r requirements.txt
```
Set environment variables:
- AZURE_OPENAI_API_KEY, AZURE_OPENAI_API_VERSION, AZURE_OPENAI_ENDPOINT, AZURE_OPENAI_CHAT_DEPLOYMENT_NAME, AZURE_DEPLOYMENT_EMBEDDING for OpenAI.
- GEMINI_API_KEY for Google Gemini.
- Optionally, SECRET_KEY and FLASK_ENV.
Run the server:
```
python run.py
```
The API will be available at http://localhost:5000.

API Endpoints

1. Upload Document

POST /upload

Upload a document for embedding and storage.
Body (form-data): file (the document file)
Response: { "success": true, "message": "...", "uuid": "<doc_id>" }

2. Question Answering

POST /qna

Ask a question about an uploaded document.

Body (JSON):

{
  "uuid": "<doc_id>",   // optional, if omitted uses default
  "question": "Your question here"
}

Response: Answer, context usage, logs, and search parameters.

3. Discover Influencers

POST /discover-influencers

Generate a list of influencers based on campaign/search parameters.

Body (JSON):

{
  "search_parameters": { /* campaign criteria */ }
}

Response: List of influencers, count, and logs.

File Structure

app/ - Main application code (routes, services)
embeddings/ - Stores FAISS indices and chunk data
storage/ - Stores uploaded files
config.py - Configuration
run.py - Entrypoint

License

MIT (or specify your license)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RAG (Retrieval-Augmented Generation) API

Features

Requirements

Setup

API Endpoints

1. Upload Document

2. Question Answering

3. Discover Influencers

File Structure

License

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
app		app
embeddings		embeddings
storage		storage
.gitignore		.gitignore
Procfile		Procfile
README.md		README.md
config.py		config.py
requirements.txt		requirements.txt
run.py		run.py

pratham8431/RAG

Folders and files

Latest commit

History

Repository files navigation

RAG (Retrieval-Augmented Generation) API

Features

Requirements

Setup

API Endpoints

1. Upload Document

2. Question Answering

3. Discover Influencers

File Structure

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages