Blogg

Kontoutdrag i PDF till Excel — exakt extrahering, OCR och avidentifiering

Kontoutdrag i PDF till Excel — exakt extrahering, OCR och avidentifiering

Konvertera kontoutdrag/kontoöversikter/faktura‑PDF till redigerbar Excel med hög noggrannhet. Omfattar OCR för skanningar, rubrikjustering, valuta-/datumigenkänning, batchflöden och integritet.

Många banker, kortutgivare och betaltjänster levererar kontoutdrag som PDF. Genom att konvertera till strukturerad Excel förenklas avstämning, bokföring, deklaration och riskanalys. Den här guiden ger reproducerbara flöden: snabbstart → högre noggrannhet → regelefterlevnad och batch.

Snabbstart i 3 steg

  1. Öppna PDF till Excel
  2. Ladda upp kontoutdraget/utdragen (flera sidor/filer stöds)
  3. Vid skanning/foto: aktivera OCR, konvertera och ladda ned .xlsx

Vilka filer konverteras mest tillförlitligt?

  • Inhemska e‑utdrag (text valbar/sökbar): mest stabila; bevarar tabellstrukturen bäst.
  • Skanningar/foton (text ej valbar): aktivera OCR; förbättra läsbarhet först vid behov.

Nyckelinställningar för maximal noggrannhet

1) Städa sidor före igenkänning

  • Korrigera orientering/ordning:
    Ordna PDF‑sidor → batchrotera liggande sidor, dra för att ändra ordning, ta bort tomma/annons­sidor.

  • Svartvitt / högre kontrast (texttunga utdrag):
    Svartvitt / Gråskala → minskar färgbrus och förbättrar OCR.

Otydliga bilder? Förbättra läsbarheten först

OCR kan förväxla 8/0/6 på lågkvalitativa skanningar. Sikta på ≈300 DPI; skanna om i högre kvalitet vid behov.

2) Välj rätt OCR‑språk och layout

  • Språk: matcha dokumentet (sv/en/zh‑Hant/ja, etc.); vid blandat, välj alla relevanta.
  • Layout: bevara tabellstruktur för tabellcentriska utdrag; vid mycket komplex layout — konvertera först till text, städa i Excel.

3) Stabil väg för komplexa skanningar

  • Stökiga vektorer/bakgrunder?
    Rasterize PDF → gör skarpa bilder, kör sedan OCR.
  • Blir resultatet för stort?
    Komprimera PDF → enklare att mejla/ladda upp.