Ако “PDF не може да се уређује”, најчешће је зато што су странице у ствари слике (скен/фото) без текстуалног слоја. Да добијете уређиви Word: средите странице → укључите OCR по потреби → извезите у Word и проверите кључна поља.
Тест за 10 секунди: да ли треба OCR?
- Можете да изаберете текст и Ctrl+F проналази речи: обично OCR није потребан — конвертујте директно у Word.
- Не можете да изаберете текст (или само блокове) и Ctrl+F не налази ништа: вероватно скениран/“image PDF” — укључите OCR.
- Изузетак: неки PDF-ови користе векторске контуре као “текст” (изгледа оштро, али није претраживо). OCR се и даље препоручује.
Изаберите прави циљ: “уређиви” или “претраживи”?
| Ваш циљ | Најбољи излаз | Препоручени алат |
|---|---|---|
| Уређивање текста и распоред | Word (.docx) | PDF у Word |
| Задржати изглед, али омогућити претрагу/копирање | Претражив PDF (текстуални слој) | OCR (претражив PDF) |
| Потребан је само текст (превод/претрага/AI) | Обичан текст | PDF у текст |
Овај водич је фокусиран на скенирани PDF → уређиви Word, уз мање грешака, мање “поквареног” распоредa и мање поновног рада.
Препоручени процес: скенирани PDF → уређиви Word (највећа стопа успеха)
Препоручени редослед
Поправи (опционо) → Организуј → Исеци → Црно-бело/Сиве нијансе (опционо) → OCR/Word → Компресуј (на крају).
Пре конверзије: припремите фајл за OCR
Ако је извор лош, ни добар OCR не може све да “спаси”. Ови кораци припреме често највише помажу:
- Довољна резолуција: за скенирање се препоручује 300 DPI. Испод 150 DPI тачност нагло опада.
- Мање искривљења: ако су странице накривљене (нпр. > 5°), распознавање редова/колона се квари.
- Без одсјаја и сенки: код фотографија избегните директно светло и држите позадину чистом.
- Боље скенер него телефон: ако можете, скенер даје стабилнији резултат од фотографије.
Чистији извор вреди више од било које опције
Ако можете да набавите квалитетнији оригинал (прави PDF уместо screenshot-ова, или скен већег DPI уместо фотографије), крените од тога.
Корак 0 (опционо): поправите фајл ако се не отвара/не конвертује
Поправка пре конверзије има смисла ако видите:
- “Фајл је оштећен / не може да се прочита”
- отпремање или конверзија стално пада
- странице се не приказују потпуно или недостају фонтови
Корак 1: средите ротацију и редослед страница
Организуј страницеУрадите три ствари:
- окрените погрешно ротиране странице (OCR одмах пати ако је текст “са стране”)
- обришите празне/рекламне странице (чистији резултат и мањи трошак)
- поређајте редослед (често се помеша код скенираних уговора/материјала)
Корак 2 (препоручено): исеците ивице и позадину
Исеци PDFОво је један од најлакших начина да побољшате:
- тачност распознавања
- стабилност распореда у Word-у
- брзину обраде
Корак 3 (по потреби): црно-бело / сиве нијансе за бољи контраст
Црно-бело / сиве нијансеАко скен има много шума (текстура папира, сива позадина, сенке), прелазак на црно-бело или сиве нијансе може:
- повећати контраст слова
- смањити “шум” у OCR резултату
Корак 4: конвертујте у Word (укључите OCR кад треба)
PDF у WordПрактичан приступ:
- ако може да се изабере и претражи текст — конвертујте без OCR-а
- ако је скен/фото — укључите OCR и проверите језик(е) документа
Важно: исправан OCR језик
Ако изаберете само енглески за документ који није на енглеском, број грешака може вишеструко да порасте. Изаберите језик који одговара садржају PDF-а.
Честе замке и поуздан “план Б”
1) Превише грешака у тексту: прво проверите квалитет и језик
Ако добијете:
- много пропуштених слова
- мешање сличних знакова (0/O, 1/I итд.)
- чудне симболе у речима
Најчешће помаже:
- боље “чишћење” извора (исецање, контраст, без одсјаја)
- избор исправног OCR језика
2) Колоне/табеле/фусноте кваре распоред: раздвојите циљ
За скенове са пуно табела (изводи, евиденције), често је боље:
PDF у ExcelАко вам треба само текст (превод/претрага), стабилније је:
PDF у текст3) “Изгледа оштро, али није претраживо”: вектори/слојеви
Понекад PDF изгледа као прави текст, али претрага не ради јер је:
- текст претворен у векторске контуре
- садржај сложен из комплексних слојева
У тим случајевима OCR је нормалан и често најбољи избор.
4) Ограничења дозвола: прво откључајте (само ако имате право)
Ако је PDF закључан (не може да се копира/уређује), прво откључајте:
Откључај PDFНапомена о усаглашености
Откључавање користите само ако имате дозволу (ауторизован приступ / позната лозинка). Овај алат не “разбија” непознате лозинке.
Вредна комбинација: уредите у Word-у, испоручите као PDF
У пракси Word често није финални формат — за испоруку (системи предаје, клијенти, тендери) треба “испоручив PDF”. Размишљајте о томе као о два повезана тока:
- Ток уређивања: PDF у Word → (уређивање у Word-у) → Word у PDF
- Ток испоруке (додајте по потреби):
- власништво / заштита од злоупотребе: Додај водени жиг
- ограничи копирање/уређивање/штампу или постави лозинку: Заштити PDF
- уђи у лимит величине (е-пошта/upload): Компресуј PDF (обично на крају)
Чест редослед
- Типично: врати у PDF → водени жиг (опционо) → заштита (опционо) → компресија (опционо, на крају).
- За јачи “само преглед”: пре заштите додајте “спљоштавање”: Flatten PDF или Rasterize PDF (компромис: текст постаје слика; величина може порасти).
FAQ
Зашто и даље има много OCR грешака?
Најчешће због три разлога:
- Погрешан језик: ако изаберете само енглески за неенглески текст, грешке расту драстично.
- Лош извор: замућење/одсјај/сенке ограничавају тачност; чистији скен помаже више од подешавања.
- Без припреме: Исеци уклања ивице, а Црно-бело/Сиве нијансе повећава контраст.
Табеле су “побегле” у Word-у. Шта да радим?
За документе где су табеле кључне, пробајте прво:
PDF у ExcelАко вам треба само текст, често је стабилније:
PDF у текстДа ли је нормално да се распоред у Word-у доста разликује?
Да. Скенирани PDF → Word је “распознавање + прелом”, па комплексни распореди ретко буду идентични. Циљајте прво на текст који може да се копира/претражи/уређује, па дотерајте кључне делове ручно у Word-у.
Брза контролна листа: шта проверити након конверзије?
- износи / датуми / ID бројеви / бројеви уговора (најосетљивије)
- померене колоне у табелама (ако треба — Excel)
- заглавља/подножја/бројеви страница недостају (додајте ручно код важних испорука)
- недостају редови/клаузуле (посебно код фотографија)
Повезани алати
PDF у Word
Извоз у уређиви Word (OCR за скенове).
OCR (претражив PDF)
Учини скенирани PDF претраживим пре конверзије.
Исеци PDF
Уклони ивице/позадину за бољи OCR.
Црно-бело / сиве нијансе
Повећај контраст и смањи шум за текстуалне скенове.
Поправи PDF
Поправи оштећене PDF‑ове пре конверзије.
PDF у Excel
Боље за документе који су углавном табеле.
Word у PDF
Након уређивања, вратите у PDF за испоруку и архивирање.
