Skan qilingan PDF → tahrirlanadigan Word: to‘liq qo‘llanma (OCR + maket)
Blog

Skan qilingan PDF → tahrirlanadigan Word: to‘liq qo‘llanma (OCR + maket)

Skan/foto PDF’ni Word’da tahrirlanadigan qilish: 10 soniyalik OCR tekshiruv, tayyorlash va tezkor yechimlar.

O'zbekcha

Agar “PDF tahrirlanmayapti” bo‘lsa, ko‘pincha sahifalar matn emas, rasm (skan/foto) bo‘ladi. Tahrirlanadigan Word olish uchun: sahifalarni tartibga keltiring → kerak bo‘lsa OCR yoqing → Word’ga o‘tkazib, muhim joylarni tekshiring.

10 soniya: OCR kerakmi?

  • Matnni tanlash mumkin va Ctrl+F so‘z topadi: odatda OCR shart emas — bevosita Word’ga konvert qiling.
  • Matn tanlanmaydi (yoki blok bilan) va Ctrl+F hech narsa topmaydi: skan/“image PDF” — OCR ni yoqing.

To‘g‘ri maqsadni tanlang: “editable” yoki “searchable”?

MaqsadEng yaxshi natijaTavsiya etilgan vosita
Matnni tahrirlash, maketni qayta formatlashWord (.docx)PDF dan Word ga
Ko‘rinishni saqlab, qidiriladigan/kopiyalanadigan qilishSearchable PDF (text layer)OCR (Searchable PDF)
Faqat matn kerak (qidiruv/AI)Plain textPDF dan matn

Bu qo‘llanma “skan PDF → tahrirlanadigan Word” jarayonini to‘liqroq qiladi: xatolar kam, qayta ishlash kam.

Tavsiya etilgan tartib

Repair (ixtiyoriy) → Organize → Crop → B/W (ixtiyoriy) → OCR/Word → Compress (oxirida).

PDF’ni tuzatish Sahifalarni tartiblash PDF’ni kesish (Crop) B/W / Grayscale PDF dan Word ga

Konvertatsiyadan oldin: OCR uchun qulay qiling

  • Aniqroq manba: imkon bo‘lsa screenshot emas, original PDF ishlating.
  • DPI: 300 DPI tavsiya; 150 DPI dan past bo‘lsa xato ko‘payadi.
  • Soya/aks etish: telefon fotosida glare/shadow bo‘lsa OCR yomonlashadi.
  • Qiyalik (skew): sahifa qiyaligi katta bo‘lsa satr/ustunlar buziladi.

Manba sifati eng katta omil

Preprocessing (crop + kontrast) ko‘pincha “setting”lardan ko‘ra ko‘proq yordam beradi.

Step 0 (ixtiyoriy): ochilmasa/convert bo‘lmasa Repair

PDF’ni tuzatish

Step 1: Organize (rotate + order)

Sahifalarni tartiblash

Step 2: Crop (chegara/fonni olib tashlash)

PDF’ni kesish (Crop)

Step 3 (hujjatga qarab): B/W yoki grayscale bilan kontrast

B/W / Grayscale

Step 4: Word’ga konvert (kerak bo‘lsa OCR yoqing)

PDF dan Word ga

Konvertatsiyadan keyin 2–3 paragraf va muhim raqamlarni (summa/sana/ID) tekshiring.

OCR tilini to‘g‘ri tanlang

Noto‘g‘ri til — xatolarning eng ko‘p sababi. Hujjat tilini tanlang (aralash bo‘lsa bir nechta til).

Maket bo‘yicha real kutish

Skan PDF → Word “recognize + reflow”. Murakkab maketlar (jadval, multi‑column) 100% bir xil chiqmasligi normal.

Odatdagi xatolar va ishonchli yechimlar

1) OCR xatolari ko‘p: til va manba sifatini tekshiring

Ko‘p uchraydigan sabablar:

  • OCR tili noto‘g‘ri tanlangan
  • manba loyqa, soya/aks etish bor
  • chegaralar/fon kesilmagan (noise ko‘p)

Tavsiya: Crop → (kerak bo‘lsa) B/W → to‘g‘ri til bilan OCR’ni qayta ishga tushiring.

2) Jadval/ustunlar Word’da buziladi: maqsadni ajrating

Jadvalli hujjatlar uchun ko‘pincha yaxshiroq:

PDF dan Excel ga

Faqat matn kerak bo‘lsa:

PDF dan matn

3) “Juda tiniq, lekin qidirilmaydi”: vektor/qatlamlar

Ba’zi PDF’larda “matn” vektor shaklida bo‘ladi. Bunday holatda ham OCR foydali, ayniqsa Word kerak bo‘lsa.

4) Ruxsatlar: faqat ruxsat bo‘lsa unlock qiling

PDF’ni ochish (Unlock)

Muhim

Unlock’ni faqat ruxsat bilan ishlating (vakolatli kirish / ma’lum parol). Bu vosita noma’lum parollarni “crack” qilmaydi.

Foydali kombinasya: Word’da tahrir, PDF’da topshirish

  1. PDF dan Word ga → (tahrir) → Word dan PDF ga
  2. Kerak bo‘lsa:

Yetkazib berish tartibi (ko‘p uchraydi)

  • Word → PDF → watermark (ixtiyoriy) → himoya (ixtiyoriy) → siqish (ixtiyoriy, oxirida).
  • Kuchli “view‑only” uchun: himoyadan oldin Flatten yoki Rasterize (trade‑off: matn rasmga aylanadi; fayl kattalashishi mumkin).

FAQ

Nega OCR’da hali ham ko‘p xato?

Odatda:

  1. OCR tili noto‘g‘ri
  2. manba sifati past (loyqa/soya/aks)
  3. preprocessing yo‘q: Crop + B/W

Word’da jadval buzilsa nima qilish kerak?

Jadvalli hujjatlar uchun avval:

PDF dan Excel ga

Faqat matn kerak bo‘lsa:

PDF dan matn

Tezkor checklist

  • summa / sana / ID / shartnoma raqami
  • jadval ustunlari siljishi (Excel kerak bo‘lishi mumkin)
  • header/footer/sahifa raqami yo‘qolishi
  • satr/bandlar tushib qolishi (foto’da ko‘p)

Tegishli vositalar