Kontoutdrag i PDF till Excel — exakt extrahering, OCR och avidentifiering
Blogg

Kontoutdrag i PDF till Excel — exakt extrahering, OCR och avidentifiering

Konvertera kontoutdrag/kontoöversikter/faktura‑PDF till redigerbar Excel med hög noggrannhet. Omfattar OCR för skanningar, rubrikjustering, valuta-/datumigenkänning, batchflöden och integritet.

Svenska

Många banker, kortutgivare och betaltjänster levererar kontoutdrag som PDF. Genom att konvertera till strukturerad Excel förenklas avstämning, bokföring, deklaration och riskanalys. Den här guiden ger reproducerbara flöden: snabbstart → högre noggrannhet → regelefterlevnad och batch.

Snabbstart i 3 steg

  1. Öppna PDF till Excel
  2. Ladda upp kontoutdraget/utdragen (flera sidor/filer stöds)
  3. Vid skanning/foto: aktivera OCR, konvertera och ladda ned .xlsx

Vilka filer konverteras mest tillförlitligt?

  • Inhemska e‑utdrag (text valbar/sökbar): mest stabila; bevarar tabellstrukturen bäst.
  • Skanningar/foton (text ej valbar): aktivera OCR; förbättra läsbarhet först vid behov.

Nyckelinställningar för maximal noggrannhet

1) Städa sidor före igenkänning

  • Korrigera orientering/ordning:
    Ordna PDF‑sidor → batchrotera liggande sidor, dra för att ändra ordning, ta bort tomma/annons­sidor.

  • Svartvitt / högre kontrast (texttunga utdrag):
    Svartvitt / Gråskala → minskar färgbrus och förbättrar OCR.

Otydliga bilder? Förbättra läsbarheten först

OCR kan förväxla 8/0/6 på lågkvalitativa skanningar. Sikta på ≈300 DPI; skanna om i högre kvalitet vid behov.

2) Välj rätt OCR‑språk och layout

  • Språk: matcha dokumentet (sv/en/zh‑Hant/ja, etc.); vid blandat, välj alla relevanta.
  • Layout: bevara tabellstruktur för tabellcentriska utdrag; vid mycket komplex layout — konvertera först till text, städa i Excel.

3) Stabil väg för komplexa skanningar

  • Stökiga vektorer/bakgrunder?
    Rasterize PDF → gör skarpa bilder, kör sedan OCR.
  • Blir resultatet för stort?
    Komprimera PDF → enklare att mejla/ladda upp.