Este projeto permite carregar documentos PDF, extrair seu conteúdo e realizar consultas inteligentes utilizando embeddings de IA. Ele utiliza as seguintes tecnologias:
- Ollama para geração de embeddings
- ChromaDB para armazenamento e consulta vetorial
- Streamlit para interface web
- PyPDF2 para extração de texto de PDFs
Antes de começar, instale as dependências executando:
pip install -r requirements.txtPara rodar a aplicação, execute:
streamlit run app.pyIsso iniciará uma interface web onde você poderá fazer upload de PDFs e realizar consultas.
O usuário faz upload de um arquivo PDF.
O texto é extraído e dividido em trechos menores.
Cada trecho é armazenado no ChromaDB com seus respectivos embeddings gerados pelo Ollama.
O usuário pode digitar perguntas sobre o conteúdo do documento, e o sistema retorna os trechos mais relevantes.
Python
Ollama
ChromaDB
LangChain (módulo OllamaEmbeddings)
Streamlit
PyPDF2
Este projeto é de código aberto e pode ser modificado conforme necessário.