Скенирани PDF у уређиви Word: комплетан водич (OCR + распоред)
Блог

Скенирани PDF у уређиви Word: комплетан водич (OCR + распоред)

Претворите скенирани/фотографисани PDF у уређиви Word: 10‑секундни OCR тест, припрема и брза решења.

Српски

Ако “PDF не може да се уређује”, најчешће је зато што су странице у ствари слике (скен/фото) без текстуалног слоја. Да добијете уређиви Word: средите странице → укључите OCR по потреби → извезите у Word и проверите кључна поља.

Тест за 10 секунди: да ли треба OCR?

  • Можете да изаберете текст и Ctrl+F проналази речи: обично OCR није потребан — конвертујте директно у Word.
  • Не можете да изаберете текст (или само блокове) и Ctrl+F не налази ништа: вероватно скениран/“image PDF” — укључите OCR.
  • Изузетак: неки PDF-ови користе векторске контуре као “текст” (изгледа оштро, али није претраживо). OCR се и даље препоручује.

Изаберите прави циљ: “уређиви” или “претраживи”?

Ваш циљНајбољи излазПрепоручени алат
Уређивање текста и распоредWord (.docx)PDF у Word
Задржати изглед, али омогућити претрагу/копирањеПретражив PDF (текстуални слој)OCR (претражив PDF)
Потребан је само текст (превод/претрага/AI)Обичан текстPDF у текст

Овај водич је фокусиран на скенирани PDF → уређиви Word, уз мање грешака, мање “поквареног” распоредa и мање поновног рада.

Препоручени процес: скенирани PDF → уређиви Word (највећа стопа успеха)

Препоручени редослед

Поправи (опционо) → Организуј → Исеци → Црно-бело/Сиве нијансе (опционо) → OCR/Word → Компресуј (на крају).

Поправи PDF Организуј странице Исеци PDF PDF у Word

Пре конверзије: припремите фајл за OCR

Ако је извор лош, ни добар OCR не може све да “спаси”. Ови кораци припреме често највише помажу:

  • Довољна резолуција: за скенирање се препоручује 300 DPI. Испод 150 DPI тачност нагло опада.
  • Мање искривљења: ако су странице накривљене (нпр. > 5°), распознавање редова/колона се квари.
  • Без одсјаја и сенки: код фотографија избегните директно светло и држите позадину чистом.
  • Боље скенер него телефон: ако можете, скенер даје стабилнији резултат од фотографије.

Чистији извор вреди више од било које опције

Ако можете да набавите квалитетнији оригинал (прави PDF уместо screenshot-ова, или скен већег DPI уместо фотографије), крените од тога.

Корак 0 (опционо): поправите фајл ако се не отвара/не конвертује

Поправка пре конверзије има смисла ако видите:

  • “Фајл је оштећен / не може да се прочита”
  • отпремање или конверзија стално пада
  • странице се не приказују потпуно или недостају фонтови
Поправи PDF

Корак 1: средите ротацију и редослед страница

Организуј странице

Урадите три ствари:

  • окрените погрешно ротиране странице (OCR одмах пати ако је текст “са стране”)
  • обришите празне/рекламне странице (чистији резултат и мањи трошак)
  • поређајте редослед (често се помеша код скенираних уговора/материјала)

Корак 2 (препоручено): исеците ивице и позадину

Исеци PDF

Ово је један од најлакших начина да побољшате:

  • тачност распознавања
  • стабилност распореда у Word-у
  • брзину обраде

Корак 3 (по потреби): црно-бело / сиве нијансе за бољи контраст

Црно-бело / сиве нијансе

Ако скен има много шума (текстура папира, сива позадина, сенке), прелазак на црно-бело или сиве нијансе може:

  • повећати контраст слова
  • смањити “шум” у OCR резултату

Корак 4: конвертујте у Word (укључите OCR кад треба)

PDF у Word

Практичан приступ:

  • ако може да се изабере и претражи текст — конвертујте без OCR-а
  • ако је скен/фото — укључите OCR и проверите језик(е) документа

Важно: исправан OCR језик

Ако изаберете само енглески за документ који није на енглеском, број грешака може вишеструко да порасте. Изаберите језик који одговара садржају PDF-а.

Честе замке и поуздан “план Б”

1) Превише грешака у тексту: прво проверите квалитет и језик

Ако добијете:

  • много пропуштених слова
  • мешање сличних знакова (0/O, 1/I итд.)
  • чудне симболе у речима

Најчешће помаже:

  • боље “чишћење” извора (исецање, контраст, без одсјаја)
  • избор исправног OCR језика

2) Колоне/табеле/фусноте кваре распоред: раздвојите циљ

За скенове са пуно табела (изводи, евиденције), често је боље:

PDF у Excel

Ако вам треба само текст (превод/претрага), стабилније је:

PDF у текст

3) “Изгледа оштро, али није претраживо”: вектори/слојеви

Понекад PDF изгледа као прави текст, али претрага не ради јер је:

  • текст претворен у векторске контуре
  • садржај сложен из комплексних слојева

У тим случајевима OCR је нормалан и често најбољи избор.

4) Ограничења дозвола: прво откључајте (само ако имате право)

Ако је PDF закључан (не може да се копира/уређује), прво откључајте:

Откључај PDF

Напомена о усаглашености

Откључавање користите само ако имате дозволу (ауторизован приступ / позната лозинка). Овај алат не “разбија” непознате лозинке.

Вредна комбинација: уредите у Word-у, испоручите као PDF

У пракси Word често није финални формат — за испоруку (системи предаје, клијенти, тендери) треба “испоручив PDF”. Размишљајте о томе као о два повезана тока:

  1. Ток уређивања: PDF у Word → (уређивање у Word-у) → Word у PDF
  2. Ток испоруке (додајте по потреби):

Чест редослед

  • Типично: врати у PDF → водени жиг (опционо) → заштита (опционо) → компресија (опционо, на крају).
  • За јачи “само преглед”: пре заштите додајте “спљоштавање”: Flatten PDF или Rasterize PDF (компромис: текст постаје слика; величина може порасти).

FAQ

Зашто и даље има много OCR грешака?

Најчешће због три разлога:

  1. Погрешан језик: ако изаберете само енглески за неенглески текст, грешке расту драстично.
  2. Лош извор: замућење/одсјај/сенке ограничавају тачност; чистији скен помаже више од подешавања.
  3. Без припреме: Исеци уклања ивице, а Црно-бело/Сиве нијансе повећава контраст.

Табеле су “побегле” у Word-у. Шта да радим?

За документе где су табеле кључне, пробајте прво:

PDF у Excel

Ако вам треба само текст, често је стабилније:

PDF у текст

Да ли је нормално да се распоред у Word-у доста разликује?

Да. Скенирани PDF → Word је “распознавање + прелом”, па комплексни распореди ретко буду идентични. Циљајте прво на текст који може да се копира/претражи/уређује, па дотерајте кључне делове ручно у Word-у.

Брза контролна листа: шта проверити након конверзије?

  • износи / датуми / ID бројеви / бројеви уговора (најосетљивије)
  • померене колоне у табелама (ако треба — Excel)
  • заглавља/подножја/бројеви страница недостају (додајте ручно код важних испорука)
  • недостају редови/клаузуле (посебно код фотографија)

Повезани алати