Indice
AgriChat pertenece al TFM dentro del Máster en Ciencia de Datos de la UOC. Como tal, esta sujeto a errores de los cuales son responsables los usuarios que empleen agrichat.
Agrichat es un sistema conversacional basado en RAG junto con el poder del modelo Table Transformer para la identificacion de datos tabulares en archivos .pdf.
Su objetivo es poder extraer tablas de documentos pdf para transformarlas en informacion estructurada en formato .csv.
Para el desarrollo de AgriChat se ha usado:
- Streamlite
- LLamaIndex
- Table Transformer from Microsoft
- Pinecone
- RAGAS
(ARRIBA)
AgriChat funciona gracias a OPENIA, tanto para la construccion de embeddings como para el uso de LLMs.Es requisito tener un API_KEY.
Agrichat usa como base de conocimiento la base de datos vectorial. Se necesita una cuenta.
Dado que los modelos estan alojados en hugginghface:
- IDENTIFICADOR TABLAS: https://huggingface.co/kike/table-detection-fito
- IDENTIFICADOR ESTRUCTURA: https://huggingface.co/kike/table_structured_recognition_fito
es necesarios descargarselos en local y construir la siguiente estructura de carpetas en la raiz del proyecto.
Agrichat se centra en la documentacion oficial del Ministerio de Agricultura y la informacion que produce en formato pdf sobre productos fitosanitarios. Asi pues los pdf que admite son los que disponen del siguiente formnato:
Mediante esta pestaña podras chatear con Agrichat sobre los PDFs. Se trata de un sistema RAG que proporciona conocimiento desde los pdf.
(ARRIBA)
En esta seccion se puede observar las tablas que han podido ser extraido y descargar sus csv.
(ARRIBA)
Se dispone de un boton de evaluación que al ser presionado se lanza una evaluacion con el framework RAGAS para evaluar el comportamiento del RAG.
Enrique Villalobos Torregrosa -> kike_mto@hotmail.com
Trabajo Final de Máster -> https://github.com/loritobad/AgriChat/tree/main/TFM
(ARRIBA)





