Logo
Naskenované PDF do editovateľného Wordu: kompletný návod (OCR + rozloženie)
Blog

Naskenované PDF do editovateľného Wordu: kompletný návod (OCR + rozloženie)

Premeňte skeny/fotky PDF na editovateľný Word: 10‑sekundová kontrola OCR, predpríprava a rýchle riešenia.

Slovenčina

Ak „PDF nejde upraviť“, najčastejšie je dôvod jednoduchý: stránka vyzerá ako text, ale je to len obrázok (sken, fotka alebo PDF zo screenshotov) bez textovej vrstvy. Aby ste dostali editovateľný Word, držte sa tohto poradia:

  1. Upravte kvalitu stránok (otočenie/poradie/okraje/šum)
  2. Spustite OCR, keď treba (obrázok → skutočný text)
  3. Exportujte do Wordu a skontrolujte kľúčové polia

10 sekúnd: Potrebujete OCR?

  • Dá sa označiť text a Ctrl+F nájde slová: zvyčajne OCR netreba — konvertujte rovno do Wordu.
  • Text sa nedá označiť (alebo len po blokoch) a Ctrl+F nič nenájde: pravdepodobne sken/obrázkové PDF — zapnite OCR.
  • Výnimka: niektoré PDF majú „text“ ako vektorové tvary (ostrý, ale nehľadateľný). OCR je stále vhodné.

Vyberte správny cieľ: „editovateľné“ alebo „vyhľadávateľné“?

Váš cieľNajlepší výstupOdporúčaný nástroj
Upravovať text a rozloženieWord (.docx)PDF do Word
Zachovať vzhľad, ale umožniť hľadanie/kopírovanieVyhľadávateľné PDF (textová vrstva)OCR (vyhľadávateľné PDF)
Potrebujete iba textČistý textPDF do textu

Odporúčaný postup: sken PDF → editovateľný Word

Poradie: čistota → rozpoznanie → kompresia

Odporúčanie: Opraviť (voliteľné) → Usporiadať stránky → Orezať → ČB/sivé (voliteľné) → OCR/Word → Komprimovať (na konci).
Kompresia na začiatku často zníži presnosť OCR.

Pred konverziou: pripravte súbor pre OCR

  • Rozlíšenie: 300 DPI je odporúčané. Pod 150 DPI ide presnosť výrazne dole.
  • Menej naklonenia: šikmé strany zhoršujú detekciu riadkov/stĺpcov.
  • Bez odleskov a tieňov: pri fotkách sa vyhnite priamemu svetlu.
  • Ak sa dá, skener: kvalitný zdroj je najdôležitejší.

Kvalitnejší zdroj porazí akékoľvek nastavenie

Ak viete získať lepší originál (skutočný PDF namiesto screenshotov, alebo sken s vyšším DPI), začnite tým.

Krok 0 (voliteľné): opravte súbor, ak sa nedá otvoriť/konvertovať

Opraviť PDF

Oprava dáva zmysel, keď:

  • súbor hlási poškodenie
  • nahranie/konverzia opakovane zlyháva
  • stránky sa zobrazujú neúplne alebo chýbajú fonty

Krok 1: otočte a usporiadajte stránky

Usporiadať stránky
  • otočte zle otočené strany
  • vymažte prázdne/reklamné strany
  • nastavte správne poradie

Krok 2 (odporúčané): orežte okraje a pozadie

Orezať PDF

Orezenie zvyčajne zlepší:

  • presnosť OCR
  • stabilitu rozloženia vo Worde
  • rýchlosť spracovania

Krok 3 (podľa potreby): zvýšte kontrast (ČB / odtiene sivej)

Čiernobiele / odtiene sivej

Ak je v skene šum (textúra papiera, sivé pozadie), ČB/sivé môže pomôcť.

Krok 4: konvertujte do Wordu (s OCR, keď treba)

PDF do Word

Dôležité: správny jazyk OCR

Ak vyberiete len angličtinu pre neanglický dokument, chýb bude výrazne viac. Vyberte jazyk podľa obsahu PDF.

Časté problémy a „plán B“

1) Veľa chýb v texte

  • zlepšite zdroj (ostrosť, menej odleskov)
  • najprv orežte okraje
  • nastavte správny jazyk OCR

2) Tabuľky a stĺpce sa rozbijú vo Worde

Pre tabuľky je často lepšie:

PDF do Excel

Ak chcete iba text, použite:

PDF do textu

3) „Vyzerá ostro, ale nedá sa hľadať“

Môže ísť o vektorový „text“. OCR je stále rozumná voľba.

4) Oprávnenia a obmedzenia

Odomknúť PDF

Poznámka k oprávneniam

Odomykanie používajte len s povolením (autorizovaný prístup / známe heslo). Nástroj neláme neznáme heslá.

Praktická kombinácia: upraviť vo Worde, odovzdať ako PDF

  1. Úpravy: PDF do Word → (úpravy) → Word do PDF
  2. Odovzdanie podľa potreby:

Časté poradie

  • Zvyčajne: späť do PDF → vodoznak → ochrana → kompresia (posledná).
  • Pre „len na čítanie“: pred ochranou môžete pridať Flatten alebo Rasterize (text sa zmení na obrázky).

FAQ

Prečo je stále veľa OCR chýb?

Najčastejšie kvôli nesprávnemu jazyku, slabému zdroju alebo chýbajúcej príprave (orezanie/kontrast).

Tabuľky sú rozhádzané. Čo robiť?

Použite PDF do Excel.

Je normálne, že rozloženie vo Worde je iné?

Áno — pri skene ide o rozpoznanie a „preliatie“ textu. Dôležité časti dolaďte ručne.

Rýchly checklist po konverzii

  • sumy / dátumy / ID čísla
  • posunuté stĺpce v tabuľkách
  • chýbajúce hlavičky/pätičky/čísla strán
  • vynechané riadky (najmä pri fotkách)

Súvisiace nástroje