-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathapp.py
More file actions
341 lines (290 loc) · 13.7 KB
/
app.py
File metadata and controls
341 lines (290 loc) · 13.7 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
import streamlit as st
import pdfplumber
import pandas as pd
import datetime
import io
import re
import random
from docx import Document
from docx.shared import Pt, Cm
from docx.enum.text import WD_ALIGN_PARAGRAPH
from docx.enum.table import WD_ALIGN_VERTICAL
from docx.oxml.ns import nsdecls, qn
from docx.oxml import parse_xml, OxmlElement
# --- CONFIGURAÇÃO DA PÁGINA ---
st.set_page_config(page_title="Gerador de Escala (V16 - Fix XML)", page_icon="🛠️", layout="centered")
# --- CORES ---
COR_AZUL_CLARO = "CFE2F3"
COR_ROSA_CLARO = "F4CCCC"
COR_ROSA_ESCURO = "EA9999"
# --- DEFINIÇÃO DE LARGURAS (Cm) ---
LARGURA_LATERAL = Cm(2.2)
LARGURA_TURNO = Cm(1.8)
LARGURA_NOME = Cm(4.0)
LARGURA_FUNC = Cm(1.5)
LARGURA_TROCAS = Cm(9.5)
# --- FUNÇÕES DE EXTRAÇÃO ---
def formatar_nome(nome_completo):
if not isinstance(nome_completo, str): return ""
partes = nome_completo.split()
ignorar = ["ENF", "ENFERMEIRO", "CONTRATO", "EFETIVO", "TEC", "TECNICO", "MÉDIO", "MEDIO", "VÍNCULO", "FUNÇÃO", "COREN", "COREN-AP"]
partes = [p for p in partes if p.upper() not in ignorar and len(p) > 2]
if len(partes) > 1: return f"{partes[0]} {partes[-1]}".upper()
elif len(partes) == 1: return partes[0].upper()
return ""
def limpar_valor(val):
return str(val).strip() if val is not None else ""
def detectar_metadados(pdf, nome_arquivo):
nome_upper = nome_arquivo.upper()
tipo = "ENFERMEIROS"
if "TEC" in nome_upper or "TÉC" in nome_upper: tipo = "TÉCNICOS"
elif "ENF" in nome_upper: tipo = "ENFERMEIROS"
texto_completo = ""
try: texto_completo = pdf.pages[0].extract_text().upper()
except: pass
meses = {r'JANEIRO':1, r'FEVEREIRO':2, r'MARÇO':3, r'MARCO':3, r'ABRIL':4, r'MAIO':5, r'JUNHO':6, r'JULHO':7, r'AGOSTO':8, r'SETEMBRO':9, r'OUTUBRO':10, r'NOVEMBRO':11, r'DEZEMBRO':12}
mes_detectado = 1
for r_mes, n_mes in meses.items():
if r_mes in texto_completo:
mes_detectado = n_mes
break
ano_detectado = 2026
match_ano = re.search(r'202[4-9]', texto_completo)
if match_ano: ano_detectado = int(match_ano.group(0))
return tipo, ano_detectado, mes_detectado
def processar_pdf(file_obj, nome_arquivo):
dados = []
with pdfplumber.open(file_obj) as pdf:
tipo, ano, mes = detectar_metadados(pdf, nome_arquivo)
for page in pdf.pages:
tabelas = page.extract_tables()
for tabela in tabelas:
df = pd.DataFrame(tabela)
idx_cabecalho = -1
mapa_dias = {}
for idx, row in df.iterrows():
numeros_validos = [int(limpar_valor(val)) for val in row if limpar_valor(val).isdigit() and 1 <= int(limpar_valor(val)) <= 31]
if len(numeros_validos) >= 5:
idx_cabecalho = idx
ultimo_dia_visto = 0
for c, v in enumerate(row):
vl = limpar_valor(v)
if vl.isdigit():
dia_num = int(vl)
if 1 <= dia_num <= 31:
if dia_num < ultimo_dia_visto and ultimo_dia_visto > 20: continue
mapa_dias[c] = dia_num
ultimo_dia_visto = dia_num
break
if idx_cabecalho == -1: continue
df_dados = df.iloc[idx_cabecalho+1:].copy()
col_nome = 1
for i, col in enumerate(df.columns):
if "NOME" in str(col).upper(): col_nome = i; break
for _, row in df_dados.iterrows():
if col_nome >= len(row): continue
nome = formatar_nome(limpar_valor(row.iloc[col_nome]))
if len(nome) < 3 or "TURNO" in nome.upper(): continue
for c_idx, dia in mapa_dias.items():
if c_idx < len(row):
turno = limpar_valor(row.iloc[c_idx]).upper()
validos = ["M", "T", "N", "N1", "N2", "D", "SD", "SN", "LP", "MT", "TM", "MD"]
eh_valido = False
if len(turno) < 7:
for v in validos:
if v in turno: eh_valido = True; break
if eh_valido:
dados.append({"DIA": dia, "TURNO": turno, "NOME": nome})
if not dados: return pd.DataFrame(columns=['DIA', 'TURNO', 'NOME']), tipo, ano, mes
return pd.DataFrame(dados), tipo, ano, mes
# --- FUNÇÕES WORD & LAYOUT ---
def definir_cor_fundo(celula, cor_hex):
shading_elm = parse_xml(r'<w:shd {} w:fill="{}"/>'.format(nsdecls('w'), cor_hex))
celula._tc.get_or_add_tcPr().append(shading_elm)
def formatar_texto(run, tamanho=10, negrito=False):
font = run.font
font.size = Pt(tamanho)
font.bold = negrito
font.name = 'Arial'
def tornar_tabela_fixa(table):
"""
CORREÇÃO DO ERRO (V16): Usa apenas 2 argumentos no set()
"""
tblPr = table._tbl.tblPr
layout = OxmlElement('w:tblLayout')
# O erro ocorria aqui. Agora usamos qn() para passar a chave correta.
layout.set(qn('w:type'), 'fixed')
tblPr.append(layout)
def forcar_larguras(row):
"""Aplica largura exata para cada célula da linha"""
larguras = [LARGURA_LATERAL, LARGURA_TURNO, LARGURA_NOME, LARGURA_FUNC, LARGURA_TROCAS]
for idx, cell in enumerate(row.cells):
if idx < len(larguras):
cell.width = larguras[idx]
def definir_funcoes_aleatorias(df_turno):
if df_turno.empty: return []
total = len(df_turno)
funcoes = ["Clas."] * total
if total > 0: funcoes[random.randint(0, total - 1)] = "Vol."
return funcoes
def adicionar_bloco_turno_enf(table, df_filtrado, nome_turno, cor_lateral):
start_row_idx = len(table.rows)
qtd = max(1, len(df_filtrado))
funcoes = definir_funcoes_aleatorias(df_filtrado)
for _ in range(qtd):
row = table.add_row()
forcar_larguras(row)
c1 = table.rows[start_row_idx].cells[0]
c2 = table.rows[start_row_idx + qtd - 1].cells[0]
merged = c1.merge(c2)
merged.text = nome_turno
merged.vertical_alignment = WD_ALIGN_VERTICAL.CENTER
merged.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
formatar_texto(merged.paragraphs[0].runs[0], negrito=True, tamanho=9)
definir_cor_fundo(merged, cor_lateral)
if df_filtrado.empty:
for i in range(1, 5):
if i < len(table.rows[start_row_idx].cells):
table.rows[start_row_idx].cells[i].text = "-"
else:
for i, (_, row) in enumerate(df_filtrado.iterrows()):
r = table.rows[start_row_idx + i]
# Turno
r.cells[1].text = row['TURNO']
r.cells[1].paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
formatar_texto(r.cells[1].paragraphs[0].runs[0], negrito=True, tamanho=9)
# Nome
r.cells[2].text = row['NOME']
formatar_texto(r.cells[2].paragraphs[0].runs[0], tamanho=8)
# Função
r.cells[3].text = funcoes[i]
r.cells[3].paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
formatar_texto(r.cells[3].paragraphs[0].runs[0], tamanho=8)
# Trocas
r.cells[4].text = ""
def adicionar_bloco_turno_tec(table, df_filtrado, nome_turno, cor_lateral):
start_row_idx = len(table.rows)
qtd = max(1, len(df_filtrado))
for _ in range(qtd):
row = table.add_row()
forcar_larguras(row)
c1 = table.rows[start_row_idx].cells[0]
c2 = table.rows[start_row_idx + qtd - 1].cells[0]
merged = c1.merge(c2)
merged.text = nome_turno
merged.vertical_alignment = WD_ALIGN_VERTICAL.CENTER
merged.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
formatar_texto(merged.paragraphs[0].runs[0], negrito=True, tamanho=9)
definir_cor_fundo(merged, cor_lateral)
if df_filtrado.empty:
if len(table.rows[start_row_idx].cells) > 2:
table.rows[start_row_idx].cells[1].text = "-"
table.rows[start_row_idx].cells[2].text = "-"
else:
for i, (_, row) in enumerate(df_filtrado.iterrows()):
r = table.rows[start_row_idx + i]
if len(r.cells) < 3: continue
r.cells[1].text = row['TURNO']
r.cells[1].paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
formatar_texto(r.cells[1].paragraphs[0].runs[0], negrito=True, tamanho=9)
r.cells[2].text = row['NOME']
formatar_texto(r.cells[2].paragraphs[0].runs[0], tamanho=8)
if len(r.cells) >= 5:
c_troca = r.cells[3].merge(r.cells[4])
c_troca.text = ""
# Ajusta largura da célula mesclada
c_troca.width = LARGURA_FUNC + LARGURA_TROCAS
def gerar_docx_completo(df_enf, df_tec, ano, mes):
doc = Document()
doc.styles['Normal'].font.name = 'Arial'
for section in doc.sections:
section.top_margin = Cm(1.0); section.bottom_margin = Cm(1.0)
section.left_margin = Cm(1.0); section.right_margin = Cm(1.0)
df_enf['DIA'] = pd.to_numeric(df_enf['DIA'], errors='coerce')
df_tec['DIA'] = pd.to_numeric(df_tec['DIA'], errors='coerce')
dias_totais = sorted(list(set(df_enf['DIA'].dropna().unique()) | set(df_tec['DIA'].dropna().unique())))
dias_semana = {0: 'SEG', 1: 'TER', 2: 'QUA', 3: 'QUI', 4: 'SEX', 5: 'SÁB', 6: 'DOM'}
contador_dias = 0
for dia in dias_totais:
if contador_dias > 0 and contador_dias % 2 == 0:
doc.add_page_break()
contador_dias += 1
try:
dt = datetime.date(ano, mes, int(dia))
txt_data = f"{dt.strftime('%d/%m/%Y')} {dias_semana[dt.weekday()]}"
except: continue
table = doc.add_table(rows=1, cols=5)
table.style = 'Table Grid'
tornar_tabela_fixa(table)
forcar_larguras(table.rows[0])
r = table.rows[0]
c = r.cells[0].merge(r.cells[4])
c.text = txt_data
definir_cor_fundo(c, COR_AZUL_CLARO)
c.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
formatar_texto(c.paragraphs[0].runs[0], tamanho=11, negrito=True)
r = table.add_row()
forcar_larguras(r)
c = r.cells[0].merge(r.cells[4])
c.text = "ENFERMEIROS"
definir_cor_fundo(c, COR_ROSA_CLARO)
c.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
formatar_texto(c.paragraphs[0].runs[0], tamanho=10, negrito=True)
r_head = table.add_row()
forcar_larguras(r_head)
col_names = ["", "Turno", "Nome", "Func.", "Trocas"]
for idx, nome in enumerate(col_names):
r_head.cells[idx].text = nome
r_head.cells[idx].paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
if idx > 0: formatar_texto(r_head.cells[idx].paragraphs[0].runs[0], tamanho=8, negrito=True)
sub_enf = df_enf[df_enf['DIA'] == dia].sort_values('TURNO')
not_enf = sub_enf[sub_enf['TURNO'].str.contains('N')]
diu_enf = sub_enf[~sub_enf.index.isin(not_enf.index)]
adicionar_bloco_turno_enf(table, diu_enf, "DIURNO", COR_AZUL_CLARO)
adicionar_bloco_turno_enf(table, not_enf, "NOTURNO", COR_ROSA_ESCURO)
r = table.add_row()
forcar_larguras(r)
c = r.cells[0].merge(r.cells[4])
c.text = "TÉCNICOS"
definir_cor_fundo(c, COR_ROSA_CLARO)
c.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
formatar_texto(c.paragraphs[0].runs[0], tamanho=10, negrito=True)
r_head = table.add_row()
forcar_larguras(r_head)
col_names_tec = ["", "Turno", "Nome", "Trocas", ""]
for idx, nome in enumerate(col_names_tec):
if idx == 4: continue
cell = r_head.cells[idx]
if idx == 3:
cell = cell.merge(r_head.cells[4])
cell.width = LARGURA_FUNC + LARGURA_TROCAS
cell.text = nome
cell.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
if idx > 0: formatar_texto(cell.paragraphs[0].runs[0], tamanho=8, negrito=True)
sub_tec = df_tec[df_tec['DIA'] == dia].sort_values('TURNO')
not_tec = sub_tec[sub_tec['TURNO'].str.contains('N')]
diu_tec = sub_tec[~sub_tec.index.isin(not_tec.index)]
adicionar_bloco_turno_tec(table, diu_tec, "DIURNO", COR_AZUL_CLARO)
adicionar_bloco_turno_tec(table, not_tec, "NOTURNO", COR_ROSA_ESCURO)
doc.add_paragraph("")
return doc
# --- INTERFACE ---
st.title("📏 Gerador de Escala ( HEOC)")
uploaded_files = st.file_uploader("Arraste os PDFs aqui", type=["pdf"], accept_multiple_files=True)
if uploaded_files:
if st.button(">>Processar<<"):
dfs = {'ENFERMEIROS': pd.DataFrame(), 'TÉCNICOS': pd.DataFrame()}
meta_ano, meta_mes = 2026, 1
for f in uploaded_files:
df, tipo, ano, mes = processar_pdf(f, f.name)
if not df.empty:
dfs[tipo] = df
meta_ano, meta_mes = ano, mes
st.success(f"Lido: {tipo} ({mes}/{ano})")
if not dfs['ENFERMEIROS'].empty or not dfs['TÉCNICOS'].empty:
doc = gerar_docx_completo(dfs['ENFERMEIROS'], dfs['TÉCNICOS'], meta_ano, meta_mes)
bio = io.BytesIO()
doc.save(bio)
st.download_button("📥 Baixar DOCX", data=bio.getvalue(), file_name=f"Escala_Oficial_{meta_mes}_{meta_ano}.docx", mime="application/vnd.openxmlformats-officedocument.wordprocessingml.document")
else:
st.error("Nenhum dado encontrado.")