Logo
ਸਕੈਨ PDF ਨੂੰ ਐਡੀਟ ਕਰਨ ਯੋਗ Word ਵਿੱਚ ਬਦਲੋ: ਪੂਰਾ ਗਾਈਡ (OCR + ਲੇਆਉਟ)
ਬਲਾਗ

ਸਕੈਨ PDF ਨੂੰ ਐਡੀਟ ਕਰਨ ਯੋਗ Word ਵਿੱਚ ਬਦਲੋ: ਪੂਰਾ ਗਾਈਡ (OCR + ਲੇਆਉਟ)

ਸਕੈਨ/ਫੋਟੋ PDF ਨੂੰ Word ਵਿੱਚ ਐਡੀਟ ਕਰਨ ਯੋਗ ਬਣਾਓ: 10 ਸਕਿੰਟ OCR ਚੈਕ, ਪ੍ਰੀ‑ਪ੍ਰੋਸੈਸਿੰਗ ਅਤੇ ਤੇਜ਼ ਹੱਲ।

ਪੰਜਾਬੀ

ਜੇ “PDF ਐਡੀਟ ਨਹੀਂ ਹੁੰਦਾ”, ਅਕਸਰ ਕਾਰਨ ਇਹ ਹੁੰਦਾ ਹੈ ਕਿ ਅੰਦਰ ਟੈਕਸਟ ਨਹੀਂ, ਸਿਰਫ਼ ਸਕੈਨ/ਤਸਵੀਰ ਹੁੰਦੀ ਹੈ। Word ਵਿੱਚ ਐਡੀਟ ਕਰਨ ਯੋਗ ਬਣਾਉਣ ਲਈ: ਪੇਜ ਠੀਕ ਕਰੋ → ਲੋੜ ਹੋਵੇ ਤਾਂ OCR ਚਲਾਓ → Word ਵਿੱਚ ਕਨਵਰਟ ਕਰਕੇ ਜਰੂਰੀ ਡਾਟਾ ਚੈਕ ਕਰੋ।

10 ਸਕਿੰਟ ਚੈਕ: OCR ਚਾਹੀਦਾ ਹੈ?

  • ਟੈਕਸਟ ਸਿਲੈਕਟ ਹੁੰਦਾ ਹੈ ਅਤੇ Ctrl+F ਮਿਲ ਜਾਂਦਾ ਹੈ: ਆਮ ਤੌਰ ‘ਤੇ OCR ਨਹੀਂ ਚਾਹੀਦਾ — ਸਿੱਧਾ Word ਵਿੱਚ ਬਦਲੋ।
  • ਟੈਕਸਟ ਸਿਲੈਕਟ ਨਹੀਂ ਹੁੰਦਾ/ਬਲਾਕ ਵਾਂਗ ਹੁੰਦਾ ਹੈ ਅਤੇ Ctrl+F ਕੁਝ ਨਹੀਂ ਲੱਭਦਾ: ਸਕੈਨ/ਇਮੇਜ PDF — OCR ਆਨ ਕਰੋ।

ਸਹੀ ਟਾਰਗੇਟ ਚੁਣੋ: “editable” ਜਾਂ “searchable”?

ਤੁਹਾਡਾ ਟੀਚਾਸਭ ਤੋਂ ਵਧੀਆ ਨਤੀਜਾਸਿਫ਼ਾਰਸ਼ੀ ਟੂਲ
ਟੈਕਸਟ/ਪੈਰਾਗ੍ਰਾਫ ਐਡੀਟ ਕਰਨਾ, ਲੇਆਉਟ ਬਦਲਨਾWord (.docx)PDF → Word
ਲੁੱਕ ਰੱਖ ਕੇ ਖੋਜ/ਕਾਪੀ ਯੋਗ ਬਣਾਉਣਾSearchable PDF (text layer)OCR (Searchable PDF)
ਸਿਰਫ਼ ਟੈਕਸਟ ਚਾਹੀਦਾ (ਖੋਜ/ਅਨੁਵਾਦ/AI)Plain textPDF → Text

ਇਹ ਗਾਈਡ “ਸਕੈਨ PDF → ਐਡੀਟ ਕਰਨ ਯੋਗ Word” ’ਤੇ ਫੋਕਸ ਕਰਦੀ ਹੈ, ਤਾਂ ਜੋ OCR ਦੀਆਂ ਗਲਤੀਆਂ, ਟੁੱਟਿਆ ਲੇਆਉਟ ਅਤੇ ਦੁਬਾਰਾ ਕੰਮ ਘੱਟ ਹੋਵੇ।

ਸਿਫ਼ਾਰਸ਼ੀ ਵਰਕਫ਼ਲੋ: ਸਕੈਨ PDF → ਐਡੀਟ ਕਰਨ ਯੋਗ Word (ਵੱਧ ਸਫਲਤਾ)

ਸਿਫ਼ਾਰਸ਼ੀ ਕ੍ਰਮ

Repair (ਚੋਣਵਾਂ) → Organize → Crop → B/W (ਚੋਣਵਾਂ) → OCR/Word → Compress (ਅੰਤ ਵਿੱਚ)।

Repair PDF Organize Pages Crop PDF PDF → Word

ਕਨਵਰਟ ਤੋਂ ਪਹਿਲਾਂ: OCR‑friendly ਬਣਾਓ

ਜੇ ਸੋਰਸ ਕਵਾਲਟੀ ਕਮਜ਼ੋਰ ਹੋਵੇ, ਤਾਂ OCR ਵੀ ਬਿਹਤਰ ਨਹੀਂ ਨਿਕਲਦਾ। ਇਹ ਤਿਆਰੀ ਅਕਸਰ ਸਭ ਤੋਂ ਵੱਧ ਫ਼ਾਇਦਾ ਦਿੰਦੀ ਹੈ:

  • ਠੀਕ DPI: 300 DPI ਸਿਫ਼ਾਰਸ਼ੀ; 150 DPI ਤੋਂ ਹੇਠਾਂ ਅਕੂਰਸੀ ਕਾਫ਼ੀ ਘੱਟ ਹੁੰਦੀ ਹੈ।
  • ਟੇਢਾਪਨ ਘਟਾਓ: ਪੇਜ ਜੇ ਬਹੁਤ ਟੇਢੇ (ਜਿਵੇਂ > 5°) ਹੋਣ ਤਾਂ ਲਾਈਨ/ਕਾਲਮ ਡਿਟੈਕਸ਼ਨ ਗੜਬੜ ਹੁੰਦੀ ਹੈ।
  • ਗਲੇਅਰ/ਛਾਂ ਤੋਂ ਬਚੋ: ਫੋਨ ਫੋਟੋ ਲਈ ਸਿੱਧੀ ਲਾਈਟ ਤੋਂ ਬਚੋ ਅਤੇ ਬੈਕਗ੍ਰਾਊਂਡ ਸਾਫ਼ ਰੱਖੋ।
  • ਸਕੈਨਰ ਵਧੀਆ: ਸੰਭਵ ਹੋਵੇ ਤਾਂ flatbed ਸਕੈਨਰ ਵਰਤੋ।

ਸਾਫ਼ ਸੋਰਸ ਕਿਸੇ ਵੀ ਸੈਟਿੰਗ ਤੋਂ ਵਧੀਆ

ਜੇ “ਅਸਲ PDF” (ਸਕ੍ਰੀਨਸ਼ਾਟ ਦੀ ਥਾਂ) ਜਾਂ ਉੱਚ DPI ਸਕੈਨ ਮਿਲ ਸਕਦਾ ਹੈ, ਤਾਂ ਓਥੋਂ ਹੀ ਸ਼ੁਰੂ ਕਰੋ।

ਕਦਮ 0 (ਚੋਣਵਾਂ): ਫਾਇਲ ਨਾ ਖੁੱਲੇ/ਕਨਵਰਟ ਨਾ ਹੋਵੇ ਤਾਂ Repair ਪਹਿਲਾਂ

ਇਨ੍ਹਾਂ ਹਾਲਤਾਂ ਵਿੱਚ Repair ਕਰੋ:

  • “file corrupted / can’t be read”
  • upload/conversion ਵਾਰ ਵਾਰ ਫੇਲ
  • ਪੇਜ ਅਧੂਰੇ ਰੇਂਡਰ ਹੋਣ
Repair PDF

ਕਦਮ 1: ਪੇਜ ਰੋਟੇਟ ਅਤੇ ਕ੍ਰਮ ਠੀਕ ਕਰੋ

Organize Pages
  • ਗਲਤ ਦਿਸ਼ਾ ਵਾਲੇ ਪੇਜ ਰੋਟੇਟ ਕਰੋ (ਟੈਕਸਟ ਸਿੱਧਾ ਨਾ ਹੋਵੇ ਤਾਂ OCR ਤੁਰੰਤ ਡਿੱਗਦਾ ਹੈ)
  • ਖਾਲੀ/ਬੇਕਾਰ ਪੇਜ ਹਟਾਓ
  • ਸਹੀ ਕ੍ਰਮ ਲਗਾਓ

ਕਦਮ 2 (ਬਹੁਤ ਸਿਫ਼ਾਰਸ਼ੀ): ਕਾਲੇ ਬਾਰਡਰ/ਬੈਕਗ੍ਰਾਊਂਡ Crop ਕਰੋ

Crop PDF

Crop ਕਰਨ ਨਾਲ:

  • OCR ਅਕੂਰਸੀ ਵਧਦੀ ਹੈ
  • Word ਲੇਆਉਟ ਜ਼ਿਆਦਾ ਸਥਿਰ ਰਹਿੰਦਾ ਹੈ
  • ਪ੍ਰੋਸੈਸਿੰਗ ਤੇਜ਼ ਹੁੰਦੀ ਹੈ

ਕਦਮ 3 (ਡੌਕਯੂਮੈਂਟ ਮੁਤਾਬਕ): B/W ਜਾਂ grayscale ਨਾਲ ਕਾਂਟ੍ਰਾਸਟ ਵਧਾਓ

B/W / Grayscale

ਟੈਕਸਟ‑heavy ਫਾਈਲਾਂ (ਕਾਂਟ੍ਰੈਕਟ, ਨੋਟਸ, ਰਸੀਦਾਂ) ਲਈ ਅਕਸਰ ਚੰਗਾ ਕੰਮ ਕਰਦਾ ਹੈ।

ਕਦਮ 4: Word ਵਿੱਚ ਕਨਵਰਟ ਕਰੋ (ਲੋੜ ਹੋਵੇ ਤਾਂ OCR ਆਨ)

PDF → Word

ਪ੍ਰੈਕਟੀਕਲ ਟਿਪਸ:

  • ਸਕੈਨ/ਫੋਟੋ ਲਈ OCR ਆਨ ਕਰੋ ਅਤੇ ਸਹੀ ਭਾਸ਼ਾ(ਆਂ) ਚੁਣੋ
  • ਕਨਵਰਟ ਤੋਂ ਬਾਅਦ 2–3 ਪੈਰਾਗ੍ਰਾਫ + ਮੁੱਖ ਨੰਬਰ (ਰਕਮ/ਤਾਰੀਖ/ID) ਚੈੱਕ ਕਰੋ

OCR ਲਈ ਭਾਸ਼ਾ ਸਹੀ ਚੁਣੋ

ਗਲਤ ਭਾਸ਼ਾ ਚੁਣਨਾ ਸਭ ਤੋਂ ਵੱਡਾ ਕਾਰਨ ਹੈ ਜਿਸ ਨਾਲ ਗਲਤੀਆਂ ਵੱਧਦੀਆਂ ਹਨ। ਕਨਟੈਂਟ ਵਾਲੀ ਭਾਸ਼ਾ (ਜਾਂ mixed ਹੋਵੇ ਤਾਂ ਕਈ ਭਾਸ਼ਾਵਾਂ) ਚੁਣੋ।

ਆਮ ਸਮੱਸਿਆਵਾਂ + ਭਰੋਸੇਯੋਗ ਵਿਕਲਪ

1) ਬਹੁਤ ਟਾਈਪੋ/ਅੱਖਰ ਗਾਇਬ

  • OCR ਭਾਸ਼ਾ ਚੈੱਕ ਕਰੋ (ਕਾਰਨ #1)
  • blur/ਗਲੇਅਰ/ਛਾਂ ਕਾਰਨ ਗਲਤੀਆਂ ਵੱਧ ਸਕਦੀਆਂ ਹਨ
  • fallback: CropB/W → ਮੁੜ ਕਨਵਰਟ

2) ਟੇਬਲ/ਮਲਟੀ‑ਕਾਲਮ ਕਾਰਨ Word ਲੇਆਉਟ ਟੁੱਟਦਾ ਹੈ

  • ਟੇਬਲ ਜ਼ਿਆਦਾ ਹੋਣ ਤੇ ਪਹਿਲਾਂ Excel: PDF → Excel
  • ਸਿਰਫ਼ ਟੈਕਸਟ ਚਾਹੀਦਾ ਹੋਵੇ: PDF → Text

3) ਦਿਖਦਾ sharp, ਪਰ Ctrl+F ਨਾਲ ਕੁਝ ਨਹੀਂ ਮਿਲਦਾ

ਕਈ ਵਾਰੀ “ਟੈਕਸਟ” vector outline ਹੁੰਦਾ ਹੈ (searchable ਨਹੀਂ ਹੁੰਦਾ)। ਕੋਸ਼ਿਸ਼ ਕਰੋ:

4) Permission restriction: unlock ਪਹਿਲਾਂ (ਕੇਵਲ ਅਧਿਕਾਰ ਹੋਵੇ ਤਾਂ)

Unlock PDF

Compliance note

Unlock ਸਿਰਫ਼ ਅਧਿਕਾਰ/ਪਾਸਵਰਡ ਪਤਾ ਹੋਣ ’ਤੇ ਵਰਤੋ। ਇਹ unknown password crack ਨਹੀਂ ਕਰਦਾ।

ਉਪਯੋਗੀ combo: Word ਵਿੱਚ edit → ਅੰਤ ਵਿੱਚ PDF

ਅਕਸਰ Word ਅੰਤਿਮ ਫਾਰਮੈਟ ਨਹੀਂ ਹੁੰਦਾ। ਡਿਲਿਵਰੀ ਲਈ:

  1. Editing: PDF → Word → (Word ਵਿੱਚ edit) → Word → PDF
  2. Delivery (ਲੋੜ ਮੁਤਾਬਕ):

ਇਕ ਆਮ ਕ੍ਰਮ

  • Word → PDF → watermark (ਚੋਣਵਾਂ) → protect (ਚੋਣਵਾਂ) → compress (ਚੋਣਵਾਂ, ਅੰਤ ਵਿੱਚ)।
  • “view‑only” ਹੋਰ ਤਗੜਾ ਚਾਹੀਦਾ ਹੋਵੇ: protect ਤੋਂ ਪਹਿਲਾਂ Flatten PDF ਜਾਂ Rasterize PDF (trade‑off: ਟੈਕਸਟ image ਬਣ ਜਾਂਦਾ; size ਵੱਧ ਸਕਦੀ ਹੈ)।

FAQ

OCR ਬਾਅਦ ਵੀ ਗਲਤੀਆਂ ਕਿਉਂ ਰਹਿੰਦੀਆਂ ਹਨ?

ਅਕਸਰ 3 ਕਾਰਨ:

  1. ਭਾਸ਼ਾ ਗਲਤ
  2. ਸੋਰਸ ਕਵਾਲਟੀ ਕਮਜ਼ੋਰ
  3. preprocessing ਨਹੀਂ: Crop + B/W

Word ਵਿੱਚ ਟੇਬਲ ਕਾਲਮ ਹਿਲ ਜਾਂਦੇ ਹਨ। ਕੀ ਕਰੀਏ?

ਟੇਬਲ‑heavy ਸਕੈਨ ਲਈ:

PDF → Excel

Word ਦਾ ਲੇਆਉਟ ਮੂਲ PDF ਤੋਂ ਕਾਫ਼ੀ ਵੱਖਰਾ ਹੋਣਾ ਨਾਰਮਲ ਹੈ?

ਹਾਂ। ਸਕੈਨ PDF → Word “recognize + reflow” ਹੈ, ਇਸ ਲਈ ਜਟਿਲ ਲੇਆਉਟ 100% ਇੱਕੋ ਜਿਹਾ ਨਹੀਂ ਆਉਂਦਾ। ਪਹਿਲਾਂ copy/search/edit, ਫਿਰ ਮੁੱਖ ਹਿੱਸੇ ਹੱਥੋਂ ਠੀਕ ਕਰੋ।

ਤੇਜ਼ checklist: ਕਨਵਰਟ ਤੋਂ ਬਾਅਦ ਕੀ ਚੈੱਕ ਕਰਨਾ?

  • ਰਕਮ / ਤਾਰੀਖ / ID / ਡੌਕਯੂਮੈਂਟ ਨੰਬਰ
  • ਟੇਬਲ ਕਾਲਮ shift (ਲੋੜ ਹੋਵੇ ਤਾਂ Excel)
  • header/footer/page numbers ਗਾਇਬ
  • ਲਾਈਨ/ਕਲੌਜ਼ ਗਾਇਬ (ਖ਼ਾਸ ਕਰਕੇ ਫੋਨ ਫੋਟੋ)

ਸੰਬੰਧਿਤ ਟੂਲ