Ako “PDF ne možete uređivati”, najčešće je zato što su stranice zapravo slike (sken/fotografija) bez pravog tekstualnog sloja. Za uređivi Word: očistite stranice → uključite OCR po potrebi → izvezite u Word i provjerite ključna polja.
Test u 10 sekundi: treba li OCR?
- Možete označiti tekst i Ctrl+F pronalazi riječi: obično OCR nije potreban — konvertirajte izravno u Word.
- Ne možete označiti tekst (ili je označavanje u blokovima) i Ctrl+F ništa ne nalazi: vjerojatno sken/“image PDF” — uključite OCR.
- Iznimka: neki PDF-ovi koriste vektorske obrise kao “tekst” (izgleda vrlo oštro, ali nije pretraživo). OCR se i dalje preporučuje.
Odaberite pravi cilj: “urediv” ili “pretraživ”?
| Vaš cilj | Najbolji izlaz | Preporučeni alat |
|---|---|---|
| Uređivanje rečenica/odlomaka, preuređenje rasporeda | Word (.docx) | PDF u Word |
| Zadržati izgled, ali omogućiti pretraživanje/kopiranje | Pretraživ PDF (tekstualni sloj) | OCR (pretraživ PDF) |
| Treba vam samo tekst (prijevod/pretraživanje/AI) | Obični tekst | PDF u tekst |
Ovaj vodič fokusira se na skenirani PDF → urediv Word, uz manje tipfelera, manje “slomljenog” rasporeda i manje ponovnog rada.
Preporučeni proces: skenirani PDF → urediv Word (najveća stopa uspjeha)
Preporučeni redoslijed
Popravi (neobavezno) → Organiziraj → Obreži → Crno-bijelo/Sive nijanse (neobavezno) → OCR/Word → Komprimiraj (na kraju).
Prije pretvorbe: učinite datoteku “OCR-prijateljskom”
Ako je izvor loš, ni dobar OCR ne može sve spasiti. Ovi koraci pripreme često daju najveći dobitak:
- Dovoljna rezolucija: za skeniranje se preporučuje 300 DPI. Ispod 150 DPI točnost znatno pada.
- Manje zakrivljenja/nagiba: ako su stranice nagnute (npr. > 5°), detekcija redaka/stupaca se kvari.
- Bez odsjaja i sjena: kod fotografija izbjegnite direktno svjetlo i držite pozadinu čistom.
- Bolje skener nego telefon: ako možete, skener daje stabilniji rezultat od fotografije.
Čistiji izvor vrijedi više od bilo koje postavke
Ako možete doći do kvalitetnijeg originala (pravi PDF umjesto screenshotova, ili sken većeg DPI umjesto fotografije), krenite od toga.
Korak 0 (neobavezno): popravite datoteku ako se ne otvara/ne pretvara
Popravak prije pretvorbe ima smisla ako vidite:
- “Datoteka je oštećena / ne može se pročitati”
- učitavanje ili pretvorba stalno pada
- stranice se ne prikazuju potpuno ili fontovi nedostaju
Korak 1: sredite rotaciju i redoslijed stranica
Organiziraj straniceNapravite tri stvari:
- okrenite pogrešno rotirane stranice (OCR odmah pati ako je tekst “na boku”)
- izbrišite prazne/reklamne stranice (čišći rezultat i manji trošak)
- posložite redoslijed (često se pomiješa kod skeniranih ugovora/materijala)
Korak 2 (preporučeno): obrežite rubove i pozadinu
Obreži PDFOvo je jedan od najlakših načina da poboljšate:
- točnost prepoznavanja
- stabilnost rasporeda u Wordu
- brzinu obrade
Korak 3 (po potrebi): crno-bijelo / sive nijanse za bolji kontrast
Crno-bijelo / sive nijanseAko sken ima puno šuma (tekstura papira, siva pozadina, sjene), prelazak na crno-bijelo ili sive nijanse može:
- povećati kontrast slova
- smanjiti “šum” u OCR rezultatu
Korak 4: pretvorite u Word (uključite OCR kad treba)
PDF u WordPraktičan pristup:
- ako se tekst može označiti i pretraživati — pretvorite bez OCR-a
- ako je sken/fotografija — uključite OCR i provjerite jezik(e) dokumenta
Važno: ispravan OCR jezik
Ako odaberete samo engleski za dokument koji nije na engleskom, broj grešaka može višestruko porasti. Odaberite jezik koji odgovara sadržaju PDF-a.
Česte zamke i pouzdani “plan B”
1) Previše grešaka u tekstu: prvo provjerite kvalitetu i jezik
Ako dobijete:
- mnogo propuštenih slova
- miješanje sličnih znakova (0/O, 1/I itd.)
- čudne simbole u riječima
Najčešće pomaže:
- bolje “čišćenje” izvora (obrezivanje, kontrast, bez odsjaja)
- odabir ispravnog OCR jezika
2) Stupci/tablice/fusnote lome raspored: razdvojite cilj
Za skenove s puno tablica (izvodi, evidencije), često je bolje:
PDF u ExcelAko vam treba samo tekst (prijevod/pretraživanje), stabilnije je:
PDF u tekst3) “Izgleda oštro, ali nije pretraživo”: vektori/slojevi
Ponekad PDF izgleda kao pravi tekst, ali pretraga ne radi jer je:
- tekst pretvoren u vektorske obrise
- sadržaj složen iz kompleksnih slojeva
U tim slučajevima OCR je normalan i često najbolji izbor.
4) Ograničenja dozvola: prvo otključajte (samo ako imate pravo)
Ako je PDF zaključan (ne može se kopirati/uređivati), prvo otključajte:
Otključaj PDFNapomena o usklađenosti
Otključavanje koristite samo ako imate dozvolu (autoriziran pristup / poznata lozinka). Ovaj alat ne razbija nepoznate lozinke.
Visoko vrijedna kombinacija: uredite u Wordu, isporučite kao PDF
U praksi Word često nije završni format — za isporuku (sustavi predaje, klijenti, tenderi) treba “isporučivi PDF”. Razmišljajte o tome kao o dva povezana toka:
- Tok uređivanja: PDF u Word → (uređivanje u Wordu) → Word u PDF
- Tok isporuke (dodajte po potrebi):
- vlasništvo / zaštita od zloupotrebe: Dodaj vodeni žig
- ograniči kopiranje/uređivanje/ispis ili postavi lozinku: Zaštiti PDF
- uklopi se u limit veličine (e-mail/upload): Komprimiraj PDF (obično na kraju)
Čest redoslijed
- Tipično: vrati u PDF → vodeni žig (neobavezno) → zaštita (neobavezno) → kompresija (neobavezno, na kraju).
- Za jači “samo pregled”: prije zaštite dodajte “spljoštavanje”: Flatten PDF ili Rasterize PDF (kompromis: tekst postaje slika; veličina može porasti).
FAQ
Zašto i dalje ima mnogo OCR grešaka?
Najčešće zbog tri razloga:
- Pogrešan jezik: ako odaberete samo engleski za neengleski tekst, greške rastu drastično.
- Loš izvor: zamućenje/odsjaj/sjene ograničavaju točnost; čišći sken pomaže više od podešavanja.
- Bez pripreme: Obreži uklanja rubove, a Crno-bijelo/Sive nijanse povećava kontrast.
Tablice su “pobjegle” u Wordu. Što da radim?
Za dokumente gdje su tablice ključne, probajte prvo:
PDF u ExcelAko vam treba samo tekst, često je stabilnije:
PDF u tekstJe li normalno da se raspored u Wordu dosta razlikuje?
Da. Skenirani PDF → Word je “prepoznavanje + prelom”, pa kompleksni rasporedi rijetko budu identični. Ciljajte prvo na tekst koji se može kopirati/pretraživati/uređivati, pa dotjerajte ključne dijelove ručno u Wordu.
Brza kontrolna lista: što provjeriti nakon pretvorbe?
- iznosi / datumi / ID brojevi / brojevi ugovora (najosjetljivije)
- pomaknuti stupci u tablicama (ako treba — Excel)
- zaglavlja/podnožja/brojevi stranica nedostaju (dodajte ručno kod važnih isporuka)
- nedostaju redovi/klauzule (posebno kod fotografija)
Povezani alati
PDF u Word
Izvoz u uređivi Word (OCR za skenirane datoteke).
OCR (pretraživ PDF)
Učinite skenirani PDF pretraživim prije konverzije.
Obreži PDF
Uklonite rubove/pozadinu za bolji OCR.
Crno-bijelo / sive nijanse
Povećajte kontrast i smanjite šum za tekstualne skenove.
Popravi PDF
Popravite oštećene PDF-ove prije konverzije.
PDF u Excel
Bolje za dokumente koji su uglavnom tablice.
Word u PDF
Nakon uređivanja vratite u PDF za isporuku i arhiviranje.
