Agar “PDF tahrirlanmayapti” bo‘lsa, ko‘pincha sahifalar matn emas, rasm (skan/foto) bo‘ladi. Tahrirlanadigan Word olish uchun: sahifalarni tartibga keltiring → kerak bo‘lsa OCR yoqing → Word’ga o‘tkazib, muhim joylarni tekshiring.
10 soniya: OCR kerakmi?
- Matnni tanlash mumkin va Ctrl+F so‘z topadi: odatda OCR shart emas — bevosita Word’ga konvert qiling.
- Matn tanlanmaydi (yoki blok bilan) va Ctrl+F hech narsa topmaydi: skan/“image PDF” — OCR ni yoqing.
To‘g‘ri maqsadni tanlang: “editable” yoki “searchable”?
| Maqsad | Eng yaxshi natija | Tavsiya etilgan vosita |
|---|---|---|
| Matnni tahrirlash, maketni qayta formatlash | Word (.docx) | PDF dan Word ga |
| Ko‘rinishni saqlab, qidiriladigan/kopiyalanadigan qilish | Searchable PDF (text layer) | OCR (Searchable PDF) |
| Faqat matn kerak (qidiruv/AI) | Plain text | PDF dan matn |
Bu qo‘llanma “skan PDF → tahrirlanadigan Word” jarayonini to‘liqroq qiladi: xatolar kam, qayta ishlash kam.
Tavsiya etilgan tartib
Repair (ixtiyoriy) → Organize → Crop → B/W (ixtiyoriy) → OCR/Word → Compress (oxirida).
Konvertatsiyadan oldin: OCR uchun qulay qiling
- Aniqroq manba: imkon bo‘lsa screenshot emas, original PDF ishlating.
- DPI: 300 DPI tavsiya; 150 DPI dan past bo‘lsa xato ko‘payadi.
- Soya/aks etish: telefon fotosida glare/shadow bo‘lsa OCR yomonlashadi.
- Qiyalik (skew): sahifa qiyaligi katta bo‘lsa satr/ustunlar buziladi.
Manba sifati eng katta omil
Preprocessing (crop + kontrast) ko‘pincha “setting”lardan ko‘ra ko‘proq yordam beradi.
Step 0 (ixtiyoriy): ochilmasa/convert bo‘lmasa Repair
PDF’ni tuzatishStep 1: Organize (rotate + order)
Sahifalarni tartiblashStep 2: Crop (chegara/fonni olib tashlash)
PDF’ni kesish (Crop)Step 3 (hujjatga qarab): B/W yoki grayscale bilan kontrast
B/W / GrayscaleStep 4: Word’ga konvert (kerak bo‘lsa OCR yoqing)
PDF dan Word gaKonvertatsiyadan keyin 2–3 paragraf va muhim raqamlarni (summa/sana/ID) tekshiring.
OCR tilini to‘g‘ri tanlang
Noto‘g‘ri til — xatolarning eng ko‘p sababi. Hujjat tilini tanlang (aralash bo‘lsa bir nechta til).
Maket bo‘yicha real kutish
Skan PDF → Word “recognize + reflow”. Murakkab maketlar (jadval, multi‑column) 100% bir xil chiqmasligi normal.
Odatdagi xatolar va ishonchli yechimlar
1) OCR xatolari ko‘p: til va manba sifatini tekshiring
Ko‘p uchraydigan sabablar:
- OCR tili noto‘g‘ri tanlangan
- manba loyqa, soya/aks etish bor
- chegaralar/fon kesilmagan (noise ko‘p)
Tavsiya: Crop → (kerak bo‘lsa) B/W → to‘g‘ri til bilan OCR’ni qayta ishga tushiring.
2) Jadval/ustunlar Word’da buziladi: maqsadni ajrating
Jadvalli hujjatlar uchun ko‘pincha yaxshiroq:
PDF dan Excel gaFaqat matn kerak bo‘lsa:
PDF dan matn3) “Juda tiniq, lekin qidirilmaydi”: vektor/qatlamlar
Ba’zi PDF’larda “matn” vektor shaklida bo‘ladi. Bunday holatda ham OCR foydali, ayniqsa Word kerak bo‘lsa.
4) Ruxsatlar: faqat ruxsat bo‘lsa unlock qiling
PDF’ni ochish (Unlock)Muhim
Unlock’ni faqat ruxsat bilan ishlating (vakolatli kirish / ma’lum parol). Bu vosita noma’lum parollarni “crack” qilmaydi.
Foydali kombinasya: Word’da tahrir, PDF’da topshirish
- PDF dan Word ga → (tahrir) → Word dan PDF ga
- Kerak bo‘lsa:
- watermark: Watermark qo‘shish
- himoya/parol: PDF’ni himoyalash
- hajm: PDF’ni siqish (odatda oxirida)
FAQ
Nega OCR’da hali ham ko‘p xato?
Odatda:
Word’da jadval buzilsa nima qilish kerak?
Jadvalli hujjatlar uchun avval:
PDF dan Excel gaFaqat matn kerak bo‘lsa:
PDF dan matnTezkor checklist
- summa / sana / ID / shartnoma raqami
- jadval ustunlari siljishi (Excel kerak bo‘lishi mumkin)
- header/footer/sahifa raqami yo‘qolishi
- satr/bandlar tushib qolishi (foto’da ko‘p)
Tegishli vositalar
PDF dan Word ga
Skanlar uchun OCR bilan Word’ga o‘tkazish.
OCR (Searchable PDF)
Avval skanni searchable qiling, so‘ng konvert qiling.
Crop PDF
Chegaralar/fonni olib tashlab, OCR ni yaxshilang.
B/W / Grayscale
Kontrastni oshirib, text-heavy skanlarda noise’ni kamaytiradi.
Repair PDF
Nosoz PDF’ni konvertatsiyadan oldin tuzating.
PDF dan Excel ga
Jadvallar uchun barqarorroq yechim.
PDF dan matn
Faqat matn kerak bo‘lsa, sodda va barqaror yo‘l.
Word dan PDF ga
Tahrirdan keyin qayta PDF’ga qaytaring.
