Skenirani PDF u uređivi Word: potpuni vodič (OCR + raspored)
Blog

Skenirani PDF u uređivi Word: potpuni vodič (OCR + raspored)

Pretvorite skenirani/fotografirani PDF u Word koji se može uređivati: 10‑sekundni OCR test, priprema i brza rješenja.

Hrvatski

Ako “PDF ne možete uređivati”, najčešće je zato što su stranice zapravo slike (sken/fotografija) bez pravog tekstualnog sloja. Za uređivi Word: očistite stranice → uključite OCR po potrebi → izvezite u Word i provjerite ključna polja.

Test u 10 sekundi: treba li OCR?

  • Možete označiti tekst i Ctrl+F pronalazi riječi: obično OCR nije potreban — konvertirajte izravno u Word.
  • Ne možete označiti tekst (ili je označavanje u blokovima) i Ctrl+F ništa ne nalazi: vjerojatno sken/“image PDF” — uključite OCR.
  • Iznimka: neki PDF-ovi koriste vektorske obrise kao “tekst” (izgleda vrlo oštro, ali nije pretraživo). OCR se i dalje preporučuje.

Odaberite pravi cilj: “urediv” ili “pretraživ”?

Vaš ciljNajbolji izlazPreporučeni alat
Uređivanje rečenica/odlomaka, preuređenje rasporedaWord (.docx)PDF u Word
Zadržati izgled, ali omogućiti pretraživanje/kopiranjePretraživ PDF (tekstualni sloj)OCR (pretraživ PDF)
Treba vam samo tekst (prijevod/pretraživanje/AI)Obični tekstPDF u tekst

Ovaj vodič fokusira se na skenirani PDF → urediv Word, uz manje tipfelera, manje “slomljenog” rasporeda i manje ponovnog rada.

Preporučeni proces: skenirani PDF → urediv Word (najveća stopa uspjeha)

Preporučeni redoslijed

Popravi (neobavezno) → Organiziraj → Obreži → Crno-bijelo/Sive nijanse (neobavezno) → OCR/Word → Komprimiraj (na kraju).

Popravi PDF Organiziraj stranice Obreži PDF PDF u Word

Prije pretvorbe: učinite datoteku “OCR-prijateljskom”

Ako je izvor loš, ni dobar OCR ne može sve spasiti. Ovi koraci pripreme često daju najveći dobitak:

  • Dovoljna rezolucija: za skeniranje se preporučuje 300 DPI. Ispod 150 DPI točnost znatno pada.
  • Manje zakrivljenja/nagiba: ako su stranice nagnute (npr. > 5°), detekcija redaka/stupaca se kvari.
  • Bez odsjaja i sjena: kod fotografija izbjegnite direktno svjetlo i držite pozadinu čistom.
  • Bolje skener nego telefon: ako možete, skener daje stabilniji rezultat od fotografije.

Čistiji izvor vrijedi više od bilo koje postavke

Ako možete doći do kvalitetnijeg originala (pravi PDF umjesto screenshotova, ili sken većeg DPI umjesto fotografije), krenite od toga.

Korak 0 (neobavezno): popravite datoteku ako se ne otvara/ne pretvara

Popravak prije pretvorbe ima smisla ako vidite:

  • “Datoteka je oštećena / ne može se pročitati”
  • učitavanje ili pretvorba stalno pada
  • stranice se ne prikazuju potpuno ili fontovi nedostaju
Popravi PDF

Korak 1: sredite rotaciju i redoslijed stranica

Organiziraj stranice

Napravite tri stvari:

  • okrenite pogrešno rotirane stranice (OCR odmah pati ako je tekst “na boku”)
  • izbrišite prazne/reklamne stranice (čišći rezultat i manji trošak)
  • posložite redoslijed (često se pomiješa kod skeniranih ugovora/materijala)

Korak 2 (preporučeno): obrežite rubove i pozadinu

Obreži PDF

Ovo je jedan od najlakših načina da poboljšate:

  • točnost prepoznavanja
  • stabilnost rasporeda u Wordu
  • brzinu obrade

Korak 3 (po potrebi): crno-bijelo / sive nijanse za bolji kontrast

Crno-bijelo / sive nijanse

Ako sken ima puno šuma (tekstura papira, siva pozadina, sjene), prelazak na crno-bijelo ili sive nijanse može:

  • povećati kontrast slova
  • smanjiti “šum” u OCR rezultatu

Korak 4: pretvorite u Word (uključite OCR kad treba)

PDF u Word

Praktičan pristup:

  • ako se tekst može označiti i pretraživati — pretvorite bez OCR-a
  • ako je sken/fotografija — uključite OCR i provjerite jezik(e) dokumenta

Važno: ispravan OCR jezik

Ako odaberete samo engleski za dokument koji nije na engleskom, broj grešaka može višestruko porasti. Odaberite jezik koji odgovara sadržaju PDF-a.

Česte zamke i pouzdani “plan B”

1) Previše grešaka u tekstu: prvo provjerite kvalitetu i jezik

Ako dobijete:

  • mnogo propuštenih slova
  • miješanje sličnih znakova (0/O, 1/I itd.)
  • čudne simbole u riječima

Najčešće pomaže:

  • bolje “čišćenje” izvora (obrezivanje, kontrast, bez odsjaja)
  • odabir ispravnog OCR jezika

2) Stupci/tablice/fusnote lome raspored: razdvojite cilj

Za skenove s puno tablica (izvodi, evidencije), često je bolje:

PDF u Excel

Ako vam treba samo tekst (prijevod/pretraživanje), stabilnije je:

PDF u tekst

3) “Izgleda oštro, ali nije pretraživo”: vektori/slojevi

Ponekad PDF izgleda kao pravi tekst, ali pretraga ne radi jer je:

  • tekst pretvoren u vektorske obrise
  • sadržaj složen iz kompleksnih slojeva

U tim slučajevima OCR je normalan i često najbolji izbor.

4) Ograničenja dozvola: prvo otključajte (samo ako imate pravo)

Ako je PDF zaključan (ne može se kopirati/uređivati), prvo otključajte:

Otključaj PDF

Napomena o usklađenosti

Otključavanje koristite samo ako imate dozvolu (autoriziran pristup / poznata lozinka). Ovaj alat ne razbija nepoznate lozinke.

Visoko vrijedna kombinacija: uredite u Wordu, isporučite kao PDF

U praksi Word često nije završni format — za isporuku (sustavi predaje, klijenti, tenderi) treba “isporučivi PDF”. Razmišljajte o tome kao o dva povezana toka:

  1. Tok uređivanja: PDF u Word → (uređivanje u Wordu) → Word u PDF
  2. Tok isporuke (dodajte po potrebi):

Čest redoslijed

  • Tipično: vrati u PDF → vodeni žig (neobavezno) → zaštita (neobavezno) → kompresija (neobavezno, na kraju).
  • Za jači “samo pregled”: prije zaštite dodajte “spljoštavanje”: Flatten PDF ili Rasterize PDF (kompromis: tekst postaje slika; veličina može porasti).

FAQ

Zašto i dalje ima mnogo OCR grešaka?

Najčešće zbog tri razloga:

  1. Pogrešan jezik: ako odaberete samo engleski za neengleski tekst, greške rastu drastično.
  2. Loš izvor: zamućenje/odsjaj/sjene ograničavaju točnost; čišći sken pomaže više od podešavanja.
  3. Bez pripreme: Obreži uklanja rubove, a Crno-bijelo/Sive nijanse povećava kontrast.

Tablice su “pobjegle” u Wordu. Što da radim?

Za dokumente gdje su tablice ključne, probajte prvo:

PDF u Excel

Ako vam treba samo tekst, često je stabilnije:

PDF u tekst

Je li normalno da se raspored u Wordu dosta razlikuje?

Da. Skenirani PDF → Word je “prepoznavanje + prelom”, pa kompleksni rasporedi rijetko budu identični. Ciljajte prvo na tekst koji se može kopirati/pretraživati/uređivati, pa dotjerajte ključne dijelove ručno u Wordu.

Brza kontrolna lista: što provjeriti nakon pretvorbe?

  • iznosi / datumi / ID brojevi / brojevi ugovora (najosjetljivije)
  • pomaknuti stupci u tablicama (ako treba — Excel)
  • zaglavlja/podnožja/brojevi stranica nedostaju (dodajte ručno kod važnih isporuka)
  • nedostaju redovi/klauzule (posebno kod fotografija)

Povezani alati