Logo
Na-scan na PDF papuntang editable na Word: kumpletong gabay (OCR + layout)
Blog

Na-scan na PDF papuntang editable na Word: kumpletong gabay (OCR + layout)

Gawing editable sa Word ang scanned/photo PDF: 10‑segundong OCR check, paghahanda, at mabilis na solusyon sa karaniwang problema.

Filipino

Kapag “hindi ma-edit ang PDF”, madalas dahil larawan lang ang bawat pahina (scan/phone photo) at walang tunay na text layer. Para maging editable sa Word: ayusin ang pages → i-on ang OCR kung kailangan → i-convert sa Word at i-check ang mahahalagang field.

10 segundo: kailangan ba ng OCR?

  • Kaya mong i-select ang text at gumagana ang Ctrl+F: kadalasan hindi na kailangan ng OCR — diretso PDF → Word.
  • Hindi ma-select ang text (o blocks lang) at walang mahanap ang Ctrl+F: scanned/“image PDF” ito — i-on ang OCR.

Piliin ang tamang goal: “editable” o “searchable”?

GoalPinakamagandang outputInirerekomendang tool
Mag-edit ng text at ayusin ang layoutWord (.docx)PDF sa Word
Panatilihin ang itsura, pero searchable/kopyaSearchable PDF (text layer)OCR (Searchable PDF)
Text content lang (search/translate/AI)Plain textPDF sa Text

Ang gabay na ito ay nakatuon sa “scanned PDF → editable na Word” para mabawasan ang OCR errors at rework.

Inirerekomendang daloy

Repair (optional) → Organize → Crop → B/W (optional) → OCR/Word → Compress (huli).

Repair PDF Organize Pages Crop PDF B/W / Grayscale PDF sa Word

Bago mag-convert: gawing “OCR‑friendly” ang file

  • Mas malinaw na source: kung may mas magandang original (hindi screenshot), gamitin iyon.
  • DPI: 300 DPI ang recommended; sa 150 DPI pababa, bumababa ang accuracy.
  • Iwasan ang anino/glare: lalo na sa phone photos.
  • Ayusin ang pagkakiling: kung nakatagilid ang text, mas mabilis masira ang OCR/layout.

Mas mahalaga ang source kaysa setting

Kahit mahusay ang OCR, hirap pa rin ito kung sobrang blur o madilim ang scan. Linisin muna ang pages bago mag-convert.

Step 0 (optional): Repair kung may error sa pag-open/convert

Gamitin ang Repair kapag:

  • “corrupted/can’t be read”
  • upload/conversion palaging pumapalya
  • may kulang na pages sa preview
Repair PDF

Step 1: Organize (rotate + order)

Organize Pages

Step 2: Crop (alisin ang border/background)

Crop PDF

Step 3 (depende sa document): B/W o grayscale para tumaas ang contrast

B/W / Grayscale

Step 4: PDF → Word (i-enable ang OCR kung kailangan)

PDF sa Word

Pagkatapos mag-convert, mag-sample check: 2–3 paragraphs + key numbers (amount/date/ID).

Tamang OCR language = malaking difference

Pinaka-common na sanhi ng errors ang maling language. Piliin ang wika ng dokumento (o multiple languages kung mixed).

Realistic expectation sa layout

Scanned PDF → Word ay “recognize + reflow”. Normal lang na hindi 100% kapareho ang layout, lalo na sa tables at multi‑column.

Karaniwang pitfalls at maaasahang solusyon

1) Maraming OCR errors: wika + kalidad muna

Pinaka‑madalas na dahilan:

  • maling OCR language
  • malabo, may anino/reflect
  • hindi na‑crop ang border/background

Subukan: Crop → (kung kailangan) B/W → OCR ulit gamit ang tamang wika.

2) Nalilito ang tables/columns sa Word: ihiwalay ang goal

Para sa table-heavy na docs, mas stable:

PDF sa Excel

Kung text lang ang kailangan:

PDF sa Text

3) “Matalas pero di searchable”: vectors/complex layers

May PDFs na mukhang text pero vectors pala. OCR pa rin ang praktikal na ruta, lalo na kung Word ang target.

4) Permissions: i‑unlock lang kung may karapatan

Unlock PDF

Mahalaga

Gamitin lang ang unlock kung may permiso (authorized access / alam na password). Hindi nito “binabasag” ang unknown passwords.

Useful combo: edit sa Word, submit as PDF

  1. PDF sa Word → (edit) → Word sa PDF
  2. Submission (kung kailangan):

Karaniwang order sa delivery

  • Word → PDF → watermark (optional) → protect (optional) → compress (optional, last).
  • Kung gusto ng mas “view‑only”: bago protect, puwedeng mag-Flatten o Rasterize (trade‑off: text nagiging image; puwedeng lumaki ang file).

FAQ

Bakit marami pa ring OCR errors?

Madalas dahil:

  1. maling OCR language
  2. mahina ang source (blur/glare/shadow)
  3. walang preprocessing: Crop + B/W

Sira ang tables sa Word. Ano ang best na gawin?

Kung table-heavy, mas stable ang:

PDF sa Excel

Kung text lang ang kailangan:

PDF sa Text

Quick checklist pagkatapos mag-convert

  • amounts / dates / IDs / contract numbers
  • table columns shifted (Excel kung kailangan)
  • header/footer/page numbers nawawala
  • missing lines/clauses (common sa phone photos)