Skip to content

Repositório contendo o código para extração de informações de gráficos de barras em arquivos PDF, desenvolvido como trabalho final da disciplina INE410121 - Visão Computacional.

Notifications You must be signed in to change notification settings

tamimart/vision_bargraph

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Extração de Dados de Gráficos de Barras em PDFs

Este repositório contém o código desenvolvido como trabalho final da disciplina INE410121 - Visão Computacional, com o objetivo de extrair informações de gráficos de barras presentes em artigos científicos em formato PDF.

Funcionalidades

  • Extração de imagens em PDFs.
  • Classificação de imagens em gráficos de barras e não gráficos de barras.
  • Identificação de regiões relevantes.
  • Reconhecimento de caracteres.
  • Conversão dos dados para formato tabular.

Requisitos

  • Python 3.8+
  • Bibliotecas principais:
    • PyMuPDF
    • Pillow
    • pandas
    • OpenCV
    • ultralytics
    • cv2
    • Tesseract OCR

Sequência de execução

  1. extrair_imagens.ipynb
  2. extrair_imagens_fastercnn.ipynb
  3. extrair_imagens_yolo.ipynb
  4. aumentar_dataset.ipynb
  5. classificar_imagens_cnns.ipynb
  6. classificar_imagens_ml.ipynb
  7. identificar_regioes.py
  8. reconhecer_caracteres.py
  9. conversao_medida.py

Membros

  • Gabriel da Silva Stuart
  • Vitória Soares dos Santos
  • Tamires Martins Marchetto

About

Repositório contendo o código para extração de informações de gráficos de barras em arquivos PDF, desenvolvido como trabalho final da disciplina INE410121 - Visão Computacional.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published