escalaapp/app.py at main · cleo-dev/escalaapp · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
import streamlit as st
import pdfplumber
import pandas as pd
import datetime
import io
import re
import random
from docx import Document
from docx.shared import Pt, Cm
from docx.enum.text import WD_ALIGN_PARAGRAPH
from docx.enum.table import WD_ALIGN_VERTICAL
from docx.oxml.ns import nsdecls, qn
from docx.oxml import parse_xml, OxmlElement

# --- CONFIGURAÇÃO DA PÁGINA ---
st.set_page_config(page_title="Gerador de Escala (V16 - Fix XML)", page_icon="🛠️", layout="centered")

# --- CORES ---
COR_AZUL_CLARO = "CFE2F3"
COR_ROSA_CLARO = "F4CCCC"
COR_ROSA_ESCURO = "EA9999"

# --- DEFINIÇÃO DE LARGURAS (Cm) ---
LARGURA_LATERAL = Cm(2.2)
LARGURA_TURNO = Cm(1.8)
LARGURA_NOME = Cm(4.0)
LARGURA_FUNC = Cm(1.5)
LARGURA_TROCAS = Cm(9.5)

# --- FUNÇÕES DE EXTRAÇÃO ---

def formatar_nome(nome_completo):
    if not isinstance(nome_completo, str): return ""
    partes = nome_completo.split()
    ignorar = ["ENF", "ENFERMEIRO", "CONTRATO", "EFETIVO", "TEC", "TECNICO", "MÉDIO", "MEDIO", "VÍNCULO", "FUNÇÃO", "COREN", "COREN-AP"]
    partes = [p for p in partes if p.upper() not in ignorar and len(p) > 2]
    if len(partes) > 1: return f"{partes[0]} {partes[-1]}".upper()
    elif len(partes) == 1: return partes[0].upper()
    return ""

def limpar_valor(val):
    return str(val).strip() if val is not None else ""

def detectar_metadados(pdf, nome_arquivo):
    nome_upper = nome_arquivo.upper()
    tipo = "ENFERMEIROS"
    if "TEC" in nome_upper or "TÉC" in nome_upper: tipo = "TÉCNICOS"
    elif "ENF" in nome_upper: tipo = "ENFERMEIROS"

    texto_completo = ""
    try: texto_completo = pdf.pages[0].extract_text().upper()
    except: pass

    meses = {r'JANEIRO':1, r'FEVEREIRO':2, r'MARÇO':3, r'MARCO':3, r'ABRIL':4, r'MAIO':5, r'JUNHO':6, r'JULHO':7, r'AGOSTO':8, r'SETEMBRO':9, r'OUTUBRO':10, r'NOVEMBRO':11, r'DEZEMBRO':12}
    mes_detectado = 1
    for r_mes, n_mes in meses.items():
        if r_mes in texto_completo:
            mes_detectado = n_mes
            break

    ano_detectado = 2026
    match_ano = re.search(r'202[4-9]', texto_completo)
    if match_ano: ano_detectado = int(match_ano.group(0))

    return tipo, ano_detectado, mes_detectado

def processar_pdf(file_obj, nome_arquivo):
    dados = []
    with pdfplumber.open(file_obj) as pdf:
        tipo, ano, mes = detectar_metadados(pdf, nome_arquivo)
        for page in pdf.pages:
            tabelas = page.extract_tables()
            for tabela in tabelas:
                df = pd.DataFrame(tabela)
                idx_cabecalho = -1
                mapa_dias = {}
                for idx, row in df.iterrows():
                    numeros_validos = [int(limpar_valor(val)) for val in row if limpar_valor(val).isdigit() and 1 <= int(limpar_valor(val)) <= 31]
                    if len(numeros_validos) >= 5:
                        idx_cabecalho = idx
                        ultimo_dia_visto = 0
                        for c, v in enumerate(row):
                            vl = limpar_valor(v)
                            if vl.isdigit():
                                dia_num = int(vl)
                                if 1 <= dia_num <= 31:
                                    if dia_num < ultimo_dia_visto and ultimo_dia_visto > 20: continue
                                    mapa_dias[c] = dia_num
                                    ultimo_dia_visto = dia_num
                        break
                if idx_cabecalho == -1: continue
                df_dados = df.iloc[idx_cabecalho+1:].copy()
                col_nome = 1
                for i, col in enumerate(df.columns):
                    if "NOME" in str(col).upper(): col_nome = i; break
                for _, row in df_dados.iterrows():
                    if col_nome >= len(row): continue
                    nome = formatar_nome(limpar_valor(row.iloc[col_nome]))
                    if len(nome) < 3 or "TURNO" in nome.upper(): continue
                    for c_idx, dia in mapa_dias.items():
                        if c_idx < len(row):
                            turno = limpar_valor(row.iloc[c_idx]).upper()
                            validos = ["M", "T", "N", "N1", "N2", "D", "SD", "SN", "LP", "MT", "TM", "MD"]
                            eh_valido = False
                            if len(turno) < 7:
                                for v in validos:
                                    if v in turno: eh_valido = True; break
                            if eh_valido:
                                dados.append({"DIA": dia, "TURNO": turno, "NOME": nome})
    if not dados: return pd.DataFrame(columns=['DIA', 'TURNO', 'NOME']), tipo, ano, mes
    return pd.DataFrame(dados), tipo, ano, mes

# --- FUNÇÕES WORD & LAYOUT ---

def definir_cor_fundo(celula, cor_hex):
    shading_elm = parse_xml(r'<w:shd {} w:fill="{}"/>'.format(nsdecls('w'), cor_hex))
    celula._tc.get_or_add_tcPr().append(shading_elm)

def formatar_texto(run, tamanho=10, negrito=False):
    font = run.font
    font.size = Pt(tamanho)
    font.bold = negrito
    font.name = 'Arial'

def tornar_tabela_fixa(table):
    """
    CORREÇÃO DO ERRO (V16): Usa apenas 2 argumentos no set()
    """
    tblPr = table._tbl.tblPr
    layout = OxmlElement('w:tblLayout')
    # O erro ocorria aqui. Agora usamos qn() para passar a chave correta.
    layout.set(qn('w:type'), 'fixed')
    tblPr.append(layout)

def forcar_larguras(row):
    """Aplica largura exata para cada célula da linha"""
    larguras = [LARGURA_LATERAL, LARGURA_TURNO, LARGURA_NOME, LARGURA_FUNC, LARGURA_TROCAS]
    for idx, cell in enumerate(row.cells):
        if idx < len(larguras):
            cell.width = larguras[idx]

def definir_funcoes_aleatorias(df_turno):
    if df_turno.empty: return []
    total = len(df_turno)
    funcoes = ["Clas."] * total
    if total > 0: funcoes[random.randint(0, total - 1)] = "Vol."
    return funcoes

def adicionar_bloco_turno_enf(table, df_filtrado, nome_turno, cor_lateral):
    start_row_idx = len(table.rows)
    qtd = max(1, len(df_filtrado))
    funcoes = definir_funcoes_aleatorias(df_filtrado)

    for _ in range(qtd):
        row = table.add_row()
        forcar_larguras(row)

    c1 = table.rows[start_row_idx].cells[0]
    c2 = table.rows[start_row_idx + qtd - 1].cells[0]
    merged = c1.merge(c2)
    merged.text = nome_turno
    merged.vertical_alignment = WD_ALIGN_VERTICAL.CENTER
    merged.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
    formatar_texto(merged.paragraphs[0].runs[0], negrito=True, tamanho=9)
    definir_cor_fundo(merged, cor_lateral)

    if df_filtrado.empty:
        for i in range(1, 5):
            if i < len(table.rows[start_row_idx].cells):
                table.rows[start_row_idx].cells[i].text = "-"
    else:
        for i, (_, row) in enumerate(df_filtrado.iterrows()):
            r = table.rows[start_row_idx + i]
            # Turno
            r.cells[1].text = row['TURNO']
            r.cells[1].paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
            formatar_texto(r.cells[1].paragraphs[0].runs[0], negrito=True, tamanho=9)
            # Nome
            r.cells[2].text = row['NOME']
            formatar_texto(r.cells[2].paragraphs[0].runs[0], tamanho=8)
            # Função
            r.cells[3].text = funcoes[i]
            r.cells[3].paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
            formatar_texto(r.cells[3].paragraphs[0].runs[0], tamanho=8)
            # Trocas
            r.cells[4].text = ""

def adicionar_bloco_turno_tec(table, df_filtrado, nome_turno, cor_lateral):
    start_row_idx = len(table.rows)
    qtd = max(1, len(df_filtrado))

    for _ in range(qtd):
        row = table.add_row()
        forcar_larguras(row)

    c1 = table.rows[start_row_idx].cells[0]
    c2 = table.rows[start_row_idx + qtd - 1].cells[0]
    merged = c1.merge(c2)
    merged.text = nome_turno
    merged.vertical_alignment = WD_ALIGN_VERTICAL.CENTER
    merged.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
    formatar_texto(merged.paragraphs[0].runs[0], negrito=True, tamanho=9)
    definir_cor_fundo(merged, cor_lateral)

    if df_filtrado.empty:
        if len(table.rows[start_row_idx].cells) > 2:
            table.rows[start_row_idx].cells[1].text = "-"
            table.rows[start_row_idx].cells[2].text = "-"
    else:
        for i, (_, row) in enumerate(df_filtrado.iterrows()):
            r = table.rows[start_row_idx + i]
            if len(r.cells) < 3: continue

            r.cells[1].text = row['TURNO']
            r.cells[1].paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
            formatar_texto(r.cells[1].paragraphs[0].runs[0], negrito=True, tamanho=9)

            r.cells[2].text = row['NOME']
            formatar_texto(r.cells[2].paragraphs[0].runs[0], tamanho=8)

            if len(r.cells) >= 5:
                c_troca = r.cells[3].merge(r.cells[4])
                c_troca.text = ""
                # Ajusta largura da célula mesclada
                c_troca.width = LARGURA_FUNC + LARGURA_TROCAS

def gerar_docx_completo(df_enf, df_tec, ano, mes):
    doc = Document()
    doc.styles['Normal'].font.name = 'Arial'

    for section in doc.sections:
        section.top_margin = Cm(1.0); section.bottom_margin = Cm(1.0)
        section.left_margin = Cm(1.0); section.right_margin = Cm(1.0)

    df_enf['DIA'] = pd.to_numeric(df_enf['DIA'], errors='coerce')
    df_tec['DIA'] = pd.to_numeric(df_tec['DIA'], errors='coerce')
    dias_totais = sorted(list(set(df_enf['DIA'].dropna().unique()) | set(df_tec['DIA'].dropna().unique())))
    dias_semana = {0: 'SEG', 1: 'TER', 2: 'QUA', 3: 'QUI', 4: 'SEX', 5: 'SÁB', 6: 'DOM'}

    contador_dias = 0
    for dia in dias_totais:
        if contador_dias > 0 and contador_dias % 2 == 0:
            doc.add_page_break()
        contador_dias += 1

        try:
            dt = datetime.date(ano, mes, int(dia))
            txt_data = f"{dt.strftime('%d/%m/%Y')} {dias_semana[dt.weekday()]}"
        except: continue

        table = doc.add_table(rows=1, cols=5)
        table.style = 'Table Grid'

        tornar_tabela_fixa(table)
        forcar_larguras(table.rows[0])

        r = table.rows[0]
        c = r.cells[0].merge(r.cells[4])
        c.text = txt_data
        definir_cor_fundo(c, COR_AZUL_CLARO)
        c.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
        formatar_texto(c.paragraphs[0].runs[0], tamanho=11, negrito=True)

        r = table.add_row()
        forcar_larguras(r)
        c = r.cells[0].merge(r.cells[4])
        c.text = "ENFERMEIROS"
        definir_cor_fundo(c, COR_ROSA_CLARO)
        c.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
        formatar_texto(c.paragraphs[0].runs[0], tamanho=10, negrito=True)

        r_head = table.add_row()
        forcar_larguras(r_head)
        col_names = ["", "Turno", "Nome", "Func.", "Trocas"]
        for idx, nome in enumerate(col_names):
            r_head.cells[idx].text = nome
            r_head.cells[idx].paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
            if idx > 0: formatar_texto(r_head.cells[idx].paragraphs[0].runs[0], tamanho=8, negrito=True)

        sub_enf = df_enf[df_enf['DIA'] == dia].sort_values('TURNO')
        not_enf = sub_enf[sub_enf['TURNO'].str.contains('N')]
        diu_enf = sub_enf[~sub_enf.index.isin(not_enf.index)]

        adicionar_bloco_turno_enf(table, diu_enf, "DIURNO", COR_AZUL_CLARO)
        adicionar_bloco_turno_enf(table, not_enf, "NOTURNO", COR_ROSA_ESCURO)

        r = table.add_row()
        forcar_larguras(r)
        c = r.cells[0].merge(r.cells[4])
        c.text = "TÉCNICOS"
        definir_cor_fundo(c, COR_ROSA_CLARO)
        c.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
        formatar_texto(c.paragraphs[0].runs[0], tamanho=10, negrito=True)

        r_head = table.add_row()
        forcar_larguras(r_head)
        col_names_tec = ["", "Turno", "Nome", "Trocas", ""]
        for idx, nome in enumerate(col_names_tec):
            if idx == 4: continue
            cell = r_head.cells[idx]
            if idx == 3:
                cell = cell.merge(r_head.cells[4])
                cell.width = LARGURA_FUNC + LARGURA_TROCAS
            cell.text = nome
            cell.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
            if idx > 0: formatar_texto(cell.paragraphs[0].runs[0], tamanho=8, negrito=True)

        sub_tec = df_tec[df_tec['DIA'] == dia].sort_values('TURNO')
        not_tec = sub_tec[sub_tec['TURNO'].str.contains('N')]
        diu_tec = sub_tec[~sub_tec.index.isin(not_tec.index)]

        adicionar_bloco_turno_tec(table, diu_tec, "DIURNO", COR_AZUL_CLARO)
        adicionar_bloco_turno_tec(table, not_tec, "NOTURNO", COR_ROSA_ESCURO)

        doc.add_paragraph("")

    return doc

# --- INTERFACE ---
st.title("📏 Gerador de Escala ( HEOC)")
uploaded_files = st.file_uploader("Arraste os PDFs aqui", type=["pdf"], accept_multiple_files=True)

if uploaded_files:
    if st.button(">>Processar<<"):
        dfs = {'ENFERMEIROS': pd.DataFrame(), 'TÉCNICOS': pd.DataFrame()}
        meta_ano, meta_mes = 2026, 1

        for f in uploaded_files:
            df, tipo, ano, mes = processar_pdf(f, f.name)
            if not df.empty:
                dfs[tipo] = df
                meta_ano, meta_mes = ano, mes
                st.success(f"Lido: {tipo} ({mes}/{ano})")

        if not dfs['ENFERMEIROS'].empty or not dfs['TÉCNICOS'].empty:
            doc = gerar_docx_completo(dfs['ENFERMEIROS'], dfs['TÉCNICOS'], meta_ano, meta_mes)
            bio = io.BytesIO()
            doc.save(bio)
            st.download_button("📥 Baixar DOCX", data=bio.getvalue(), file_name=f"Escala_Oficial_{meta_mes}_{meta_ano}.docx", mime="application/vnd.openxmlformats-officedocument.wordprocessingml.document")
        else:
            st.error("Nenhum dado encontrado.")