Ef PDF “er ekki breytanlegt” er ástæðan oft einföld: það lítur út eins og texti, en síðurnar eru í raun myndir (skönnun, símafoto eða PDF úr skjámyndum) án textalags. Til að fá breytanlegt Word skaltu fylgja þessu:
- Hreinsa og laga síður (snúningur/röð/jaðrar/hávaði)
- Keyra OCR þegar þarf (mynd → raunverulegur texti)
- Flytja út í Word og yfirfara lykilatriði
10 sekúndur: þarftu OCR?
- Þú getur valið texta og Ctrl+F finnur orð: yfirleitt þarf ekki OCR — breyttu beint í Word.
- Þú getur ekki valið texta (eða bara í blokkum) og Ctrl+F finnur ekkert: líklega skannað/mynd‑PDF — virkjaðu OCR.
- Undantekning: sum PDF hafa “texta” sem vektorlögun (mjög skarpur en ekki leitanlegur). OCR er samt ráðlegt.
Veldu rétt markmið: “breytanlegt” eða “leitanlegt”?
| Markmið | Besti útgangur | Mælt tól |
|---|---|---|
| Breyta texta og uppsetningu | Word (.docx) | PDF í Word |
| Halda útliti en gera leitanlegt/afritanlegt | Leitanlegt PDF (textalag) | OCR (leitanlegt PDF) |
| Þarf bara textann | Hreinn texti | PDF í texta |
Mælt með ferli: skannað PDF → breytanlegt Word
Röð: skýrleiki → greining → þjöppun
Mælt með: Laga (valkvætt) → Skipuleggja síður → Skera → Svart/hvítt/grátónar (valkvætt) → OCR/Word → Þjappa (í lokin).
Að þjappa fyrst getur dregið úr OCR-nákvæmni.
Fyrir umbreytingu: gerðu skjalið OCR-vænt
- 300 DPI skönnun ef mögulegt
- minnka skekkju (skakkar síður rugla greiningu)
- forðast skugga/endurkast á ljósmyndum
Skref 0 (valkvætt): lagaðu ef skjalið opnast ekki/klikkar í umbreytingu
Laga PDFSkref 1: snúningur og röð síðna
Skipuleggja síðurSkref 2: skera jaðra og bakgrunn
Skera PDFSkref 3 (eftir þörfum): svart/hvítt eða grátónar fyrir betri kontrast
Svart/hvítt / grátónarSkref 4: breyta í Word (með OCR ef þarf)
PDF í WordMikilvægt: rétt OCR-tungumál
Ef þú velur bara ensku fyrir skjal á öðru tungumáli, eykst villuhlutfall mikið. Veldu tungumál eftir innihaldinu.
Algengar gildrur og varaleiðir
1) Of margar villur
- bættu uppruna (skýrari skönnun, minna endurkast)
- byrjaðu á skurði
- rétt OCR-tungumál
2) Töflur brotna í Word
PDF í ExcelEf þú þarft bara texta:
PDF í texta3) “Skarpt en ekki leitanlegt”
Getur verið vektor-“texti”. OCR er samt góð leið.
4) Heimildir og takmarkanir
AflæsaAthugasemd
Aflæsingu skal aðeins nota með heimild (leyfilegur aðgangur / þekkt lykilorð). Tólið brýtur ekki óþekkt lykilorð.
Gagnleg samsetning: breyta í Word, skila sem PDF
Eftir þörfum: vatnsmerki, vörn, þjöppun (yfirleitt síðast).
Algengar spurningar (FAQ)
Af hverju eru enn villur eftir OCR?
Algengast er:
- rangt OCR‑tungumál
- lélegur uppruni (óskýrt, skuggar, endurkast)
- engin forvinnsla: skera og (ef þarf) svart/hvítt
Töflur fara úr skorðum í Word. Hvað á ég að gera?
Fyrir töflur er oft betra að nota PDF í Excel. Ef þú þarft bara textann, notaðu PDF í texta.
Er eðlilegt að uppsetningin breytist í Word?
Já. Skannað PDF → Word er “recognize + reflow”, þannig að flókin uppsetning endurtekur sig sjaldan 100%.
Fljótur gátlisti eftir umbreytingu
- upphæðir / dagsetningar / númer
- tilfærðar dálkar í töflum
- vantar haus/fót og blaðsíðutölur
- vantar línur/ákvæði (oft í símafótum)
Tengd tól
PDF í Word
Breyta PDF í breytanlegt Word (OCR fyrir skannanir).
OCR (leitanlegt PDF)
Gerðu skannað PDF leitanlegt áður en þú heldur áfram.
Skera PDF
Fjarlægðu jaðra/bakgrunn fyrir betra OCR.
Svart/hvítt / grátónar
Auka kontrast og minnka hávaða í textaskönnum.
Laga PDF
Lagaðu skemmd PDF áður en þú breytir.
PDF í Excel
Betra þegar skjalið er aðallega töflur.
PDF í texta
Dragðu út texta þegar uppsetning skiptir ekki máli.
Word í PDF
Eftir breytingar: aftur í PDF til skilaaðila og skráningar.
