Logo
Scan PDF til redigerbart Word: komplet guide (OCR + layout)
Blog

Scan PDF til redigerbart Word: komplet guide (OCR + layout)

Gør scannede/fotograferede PDF’er redigerbare i Word med OCR, forbehandling og enkle fejl‑tjek.

Dansk

Når en PDF “ikke kan redigeres”, skyldes det ofte, at siderne i virkeligheden er billeder (scan/foto) uden rigtig tekst. For at få en redigerbar Word‑fil skal du typisk: rydde siderne op → køre OCR ved behov → eksportere til Word og tjekke nøglefelter.

10‑sekunders tjek: Skal du bruge OCR?

  • Du kan markere tekst og Ctrl+F finder ord: normalt ingen OCR — konvertér direkte til Word.
  • Du kan ikke markere tekst (eller kun blokke), og Ctrl+F finder intet: sandsynligvis scan/billed‑PDF — slå OCR til.
  • Undtagelse: nogle PDF’er har “tekst” som vektorgrafik (skarp, men ikke søgbar). OCR kan stadig hjælpe.

Vælg det rigtige mål: “redigerbar” eller “søgbar”?

Dit målBedste outputAnbefalet værktøj
Redigere tekst og layoutWord (.docx)PDF til Word
Beholde udseendet, men gøre den søgbar/kopierbarSøgbar PDF (tekstlag)OCR (søgbar PDF)
Kun brug for teksten (oversættelse/søgning/AI)Ren tekstPDF til tekst

Anbefalet workflow (mest stabilt)

Rækkefølge: Klarhed → OCR → komprimering

Anbefalet: Reparer (valgfrit) → Organisér sider → Beskær → Sort/hvid (valgfrit) → OCR/Word → Komprimér (til sidst).

Trin 0 (valgfrit): Reparer hvis filen fejler

Reparer PDF

Reparer før konvertering hvis du ser:

  • “Filen er beskadiget / kan ikke læses”
  • upload eller konvertering fejler gentagne gange
  • sider gengives ufuldstændigt eller skrifttyper mangler

Trin 1: Ret rotation og rækkefølge

Organisér PDF‑sider

Gør tre ting:

  • rotér sider der vender forkert (OCR bliver straks dårligere, hvis tekst er “på siden”)
  • slet tomme/reklame‑sider (renere output, lavere omkostning)
  • sorter rækkefølge (almindeligt i scannede kontrakter/materialer)

Trin 2: Beskær kanter og baggrund

Beskær PDF

Beskæring forbedrer ofte:

  • OCR‑nøjagtighed
  • layoutstabilitet i Word
  • behandlingshastighed

Trin 3 (valgfrit): Øg kontrast til tekstscans

Sort/hvid / gråtoner

Hvis scannet har meget støj (papirstruktur, grå baggrund, skygger), kan sort/hvid eller gråtoner:

  • gøre bogstaver mere kontrastfulde
  • reducere “støj” i OCR‑resultatet

Trin 4: Konvertér til Word (med OCR hvis nødvendigt)

PDF til Word

Praktisk tommelfingerregel:

  • kan du markere tekst og søge i den → konvertér ofte uden OCR
  • er det scan/foto → slå OCR til og vælg rigtigt sprog (evt. flere)

Vigtigt: korrekt OCR-sprog

Hvis du kun vælger engelsk for et ikke-engelsk dokument, stiger fejlprocenten markant. Vælg sprog efter indholdet i PDF’en.

Almindelige faldgruber og sikre alternativer

1) For mange fejl i teksten: start med kvalitet og sprog

Hvis du ser:

  • manglende bogstaver/typo’er
  • forveksling af lignende tegn (0/O, 1/I osv.)
  • mærkelige symboler midt i ord

Så hjælper det ofte at:

  • bruge en renere kilde (mindre slør/odsjær)
  • Beskære kanter og baggrund
  • vælge korrekt OCR‑sprog

2) Kolonner/tabeller ødelægger layout: del målet op

For tabeltunge scans (kontoudtog, lister) er det ofte bedre:

PDF til Excel

Hvis du kun skal bruge tekst, er dette tit mere stabilt:

PDF til tekst

3) “Ser skarpt ud, men kan ikke søges”: vektor/lag

Nogle PDF’er ser ud som rigtig tekst, men er vektorformer eller komplekse lag. Her er OCR stadig en fornuftig løsning.

4) Rettigheder: lås op først (kun med tilladelse)

Hvis PDF’en er begrænset (kopi/redigering), prøv:

Lås PDF op

Compliance-note

Brug kun oplåsning, hvis du har tilladelse (autoriseret adgang / kendt kode). Værktøjet knækker ikke ukendte adgangskoder.

God kombination: redigér i Word, aflever som PDF

Word er ofte ikke slutformatet. Tænk i to flows:

  1. Redigering: PDF til Word → (redigér i Word) → Word til PDF
  2. Aflevering (efter behov):

Typisk rækkefølge

  • Normalt: tilbage til PDF → vandmærke (valgfrit) → beskyttelse (valgfrit) → komprimering (valgfrit, sidst).
  • For stærkere “kun visning”: før beskyttelse, tilføj “flatten”: Flatten PDF eller Rasterize PDF (trade-off: tekst bliver billeder; filstørrelse kan stige).

FAQ

Hvorfor er der stadig mange OCR-fejl?

Typisk fordi:

  1. forkert OCR‑sprog
  2. dårlig kildekvalitet (slør/odsjær/skygger)
  3. manglende forbehandling (først Beskær, evt. sort/hvid)

Mine tabeller er skæve i Word. Hvad gør jeg?

Prøv:

PDF til Excel

Er det normalt at layoutet ændrer sig meget i Word?

Ja. Scan → Word er “genkendelse + ombrydning”, så komplekse layouts genskabes sjældent perfekt. Fokuser på redigerbarhed først, finpuds bagefter.

Hurtig tjekliste efter konvertering

  • beløb / datoer / ID-numre (mest fejlfølsomt)
  • forskudte kolonner i tabeller (brug Excel hvis nødvendigt)
  • manglende header/footer/sidenumre (tilføj manuelt ved vigtige afleveringer)
  • manglende linjer/klausuler (især fra mobilfotos)

Relaterede værktøjer