Ak „PDF nejde upraviť“, najčastejšie je dôvod jednoduchý: stránka vyzerá ako text, ale je to len obrázok (sken, fotka alebo PDF zo screenshotov) bez textovej vrstvy. Aby ste dostali editovateľný Word, držte sa tohto poradia:
- Upravte kvalitu stránok (otočenie/poradie/okraje/šum)
- Spustite OCR, keď treba (obrázok → skutočný text)
- Exportujte do Wordu a skontrolujte kľúčové polia
10 sekúnd: Potrebujete OCR?
- Dá sa označiť text a Ctrl+F nájde slová: zvyčajne OCR netreba — konvertujte rovno do Wordu.
- Text sa nedá označiť (alebo len po blokoch) a Ctrl+F nič nenájde: pravdepodobne sken/obrázkové PDF — zapnite OCR.
- Výnimka: niektoré PDF majú „text“ ako vektorové tvary (ostrý, ale nehľadateľný). OCR je stále vhodné.
Vyberte správny cieľ: „editovateľné“ alebo „vyhľadávateľné“?
| Váš cieľ | Najlepší výstup | Odporúčaný nástroj |
|---|---|---|
| Upravovať text a rozloženie | Word (.docx) | PDF do Word |
| Zachovať vzhľad, ale umožniť hľadanie/kopírovanie | Vyhľadávateľné PDF (textová vrstva) | OCR (vyhľadávateľné PDF) |
| Potrebujete iba text | Čistý text | PDF do textu |
Odporúčaný postup: sken PDF → editovateľný Word
Poradie: čistota → rozpoznanie → kompresia
Odporúčanie: Opraviť (voliteľné) → Usporiadať stránky → Orezať → ČB/sivé (voliteľné) → OCR/Word → Komprimovať (na konci).
Kompresia na začiatku často zníži presnosť OCR.
Pred konverziou: pripravte súbor pre OCR
- Rozlíšenie: 300 DPI je odporúčané. Pod 150 DPI ide presnosť výrazne dole.
- Menej naklonenia: šikmé strany zhoršujú detekciu riadkov/stĺpcov.
- Bez odleskov a tieňov: pri fotkách sa vyhnite priamemu svetlu.
- Ak sa dá, skener: kvalitný zdroj je najdôležitejší.
Kvalitnejší zdroj porazí akékoľvek nastavenie
Ak viete získať lepší originál (skutočný PDF namiesto screenshotov, alebo sken s vyšším DPI), začnite tým.
Krok 0 (voliteľné): opravte súbor, ak sa nedá otvoriť/konvertovať
Opraviť PDFOprava dáva zmysel, keď:
- súbor hlási poškodenie
- nahranie/konverzia opakovane zlyháva
- stránky sa zobrazujú neúplne alebo chýbajú fonty
Krok 1: otočte a usporiadajte stránky
Usporiadať stránky- otočte zle otočené strany
- vymažte prázdne/reklamné strany
- nastavte správne poradie
Krok 2 (odporúčané): orežte okraje a pozadie
Orezať PDFOrezenie zvyčajne zlepší:
- presnosť OCR
- stabilitu rozloženia vo Worde
- rýchlosť spracovania
Krok 3 (podľa potreby): zvýšte kontrast (ČB / odtiene sivej)
Čiernobiele / odtiene sivejAk je v skene šum (textúra papiera, sivé pozadie), ČB/sivé môže pomôcť.
Krok 4: konvertujte do Wordu (s OCR, keď treba)
PDF do WordDôležité: správny jazyk OCR
Ak vyberiete len angličtinu pre neanglický dokument, chýb bude výrazne viac. Vyberte jazyk podľa obsahu PDF.
Časté problémy a „plán B“
1) Veľa chýb v texte
- zlepšite zdroj (ostrosť, menej odleskov)
- najprv orežte okraje
- nastavte správny jazyk OCR
2) Tabuľky a stĺpce sa rozbijú vo Worde
Pre tabuľky je často lepšie:
PDF do ExcelAk chcete iba text, použite:
PDF do textu3) „Vyzerá ostro, ale nedá sa hľadať“
Môže ísť o vektorový „text“. OCR je stále rozumná voľba.
4) Oprávnenia a obmedzenia
Odomknúť PDFPoznámka k oprávneniam
Odomykanie používajte len s povolením (autorizovaný prístup / známe heslo). Nástroj neláme neznáme heslá.
Praktická kombinácia: upraviť vo Worde, odovzdať ako PDF
- Úpravy: PDF do Word → (úpravy) → Word do PDF
- Odovzdanie podľa potreby:
FAQ
Prečo je stále veľa OCR chýb?
Najčastejšie kvôli nesprávnemu jazyku, slabému zdroju alebo chýbajúcej príprave (orezanie/kontrast).
Tabuľky sú rozhádzané. Čo robiť?
Použite PDF do Excel.
Je normálne, že rozloženie vo Worde je iné?
Áno — pri skene ide o rozpoznanie a „preliatie“ textu. Dôležité časti dolaďte ručne.
Rýchly checklist po konverzii
- sumy / dátumy / ID čísla
- posunuté stĺpce v tabuľkách
- chýbajúce hlavičky/pätičky/čísla strán
- vynechané riadky (najmä pri fotkách)
Súvisiace nástroje
PDF do Word
Konverzia do editovateľného Wordu (OCR pre skeny).
OCR (vyhľadávateľné PDF)
Urobí zo skenu vyhľadávateľné PDF.
Orezať PDF
Odstráni okraje/pozadie a zlepší OCR.
ČB / odtiene sivej
Zvýši kontrast a zníži šum pre textové skeny.
Opraviť PDF
Opraví poškodené PDF pred konverziou.
PDF do Excel
Lepšie pre dokumenty s tabuľkami.
Word do PDF
Po úpravách späť do PDF pre odovzdanie a archív.
