Extração de Dados de Gráficos de Barras em PDFs

Este repositório contém o código desenvolvido como trabalho final da disciplina INE410121 - Visão Computacional, com o objetivo de extrair informações de gráficos de barras presentes em artigos científicos em formato PDF.

Funcionalidades

Extração de imagens em PDFs.
Classificação de imagens em gráficos de barras e não gráficos de barras.
Identificação de regiões relevantes.
Reconhecimento de caracteres.
Conversão dos dados para formato tabular.

Requisitos

Python 3.8+
Bibliotecas principais:
- PyMuPDF
- Pillow
- pandas
- OpenCV
- ultralytics
- cv2
- Tesseract OCR

Sequência de execução

extrair_imagens.ipynb
extrair_imagens_fastercnn.ipynb
extrair_imagens_yolo.ipynb
aumentar_dataset.ipynb
classificar_imagens_cnns.ipynb
classificar_imagens_ml.ipynb
identificar_regioes.py
reconhecer_caracteres.py
conversao_medida.py

Membros

Gabriel da Silva Stuart
Vitória Soares dos Santos
Tamires Martins Marchetto

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.gitignore		.gitignore
README.html		README.html
README.md		README.md
aumentar_dataset.ipynb		aumentar_dataset.ipynb
classificar_imagens_cnns.ipynb		classificar_imagens_cnns.ipynb
classificar_imagens_ml.ipynb		classificar_imagens_ml.ipynb
conversao_medida.py		conversao_medida.py
criar_planilha_refs.R		criar_planilha_refs.R
explorar_planilha_refs.R		explorar_planilha_refs.R
extrair_imagens.ipynb		extrair_imagens.ipynb
extrair_imagens_fastercnn.ipynb		extrair_imagens_fastercnn.ipynb
extrair_imagens_yolo.ipynb		extrair_imagens_yolo.ipynb
google_colab_config.yaml		google_colab_config.yaml
identificar_regioes.py		identificar_regioes.py
modelo_identificacao.pt		modelo_identificacao.pt
reconhecer_caracteres.py		reconhecer_caracteres.py
vision_bargraph.Rproj		vision_bargraph.Rproj

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Extração de Dados de Gráficos de Barras em PDFs

Funcionalidades

Requisitos

Sequência de execução

Membros

About

Uh oh!

Releases

Packages

Languages

tamimart/vision_bargraph

Folders and files

Latest commit

History

Repository files navigation

Extração de Dados de Gráficos de Barras em PDFs

Funcionalidades

Requisitos

Sequência de execução

Membros

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages