Este repositório contém o código desenvolvido como trabalho final da disciplina INE410121 - Visão Computacional, com o objetivo de extrair informações de gráficos de barras presentes em artigos científicos em formato PDF.
- Extração de imagens em PDFs.
- Classificação de imagens em gráficos de barras e não gráficos de barras.
- Identificação de regiões relevantes.
- Reconhecimento de caracteres.
- Conversão dos dados para formato tabular.
- Python 3.8+
- Bibliotecas principais:
- PyMuPDF
- Pillow
- pandas
- OpenCV
- ultralytics
- cv2
- Tesseract OCR
- extrair_imagens.ipynb
- extrair_imagens_fastercnn.ipynb
- extrair_imagens_yolo.ipynb
- aumentar_dataset.ipynb
- classificar_imagens_cnns.ipynb
- classificar_imagens_ml.ipynb
- identificar_regioes.py
- reconhecer_caracteres.py
- conversao_medida.py
- Gabriel da Silva Stuart
- Vitória Soares dos Santos
- Tamires Martins Marchetto