Skip to content

Conversation

@marcarl
Copy link
Collaborator

@marcarl marcarl commented Jan 1, 2026

Summary

Lägger till ett script för att kontrollera tillgänglighet av PDF-filer från markdown-filer.

  • Script: scripts/check_pdf_availability.py - Extraherar pdf_url från frontmatter och kontrollerar tillgänglighet via HTTP HEAD requests
  • README: scripts/README_check_pdf_availability.md - Omfattande dokumentation med användningsexempel och felsökning

Funktionalitet

Scriptet:

  1. Scannar markdown-filer rekursivt i en katalog
  2. Extraherar pdf_url från YAML frontmatter
  3. Kontrollerar varje PDF med HTTP HEAD request
  4. Genererar detaljerad Markdown-rapport med:
    • Sammanfattande statistik (tillgängliga/otillgängliga)
    • Fördelning per databas (gamla/nya)
    • Status code-fördelning
    • Listor över otillgängliga PDF:er

Användning

python3 scripts/check_pdf_availability.py ../sfs-export-md-markers -o reports/pdf_availability_report.md

Test plan

  • Script skapad och testad lokalt
  • README skapad med omfattande dokumentation
  • Köra script på fullständigt dataset (~11 000 filer)
  • Granska genererad rapport

🤖 Generated with Claude Code

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants