Агар “PDF таҳрир намешавад”, бисёр вақт он танҳо тасвир аст (скан/акс) бе қабати матн. Барои гирифтани Word-и таҳриршаванда: саҳифаҳоро танзим кунед → OCR-ро ҳангоми лозим фаъол кунед → ба Word содир кунед ва қисмҳои муҳимро санҷед.
10 сония: OCR лозим аст?
- Матн интихоб мешавад ва Ctrl+F калимаҳоро меёбад: одатан OCR лозим нест — рост ба Word табдил диҳед.
- Матн интихоб намешавад (ё танҳо блокӣ) ва Ctrl+F ҳеҷ чиз намеёбад: эҳтимол скан/“image PDF” — OCR-ро фаъол кунед.
- Истисно: баъзе PDF‑ҳо “матн”-ро ҳамчун вектор доранд (равшан, аммо ҷустуҷӯ намешавад). Дар ин ҳолат ҳам OCR кӯмак мекунад.
Тартиби тавсияшуда
Repair (ихтиёрӣ) → Organize → Crop → B/W (ихтиёрӣ) → OCR/Word → Compress (дар охир).
Ҳадафи дурустро интихоб кунед: “editable” ё “searchable”?
| Ҳадаф | Натиҷаи беҳтарин | Асбоби тавсияшуда |
|---|---|---|
| Таҳрири ҷумла/параграф, тағйири тарҳ | Word (.docx) | PDF ба Word |
| Нигоҳ доштани намуди аслӣ, аммо ҷустуҷӯшаванда/нусхабардор | Searchable PDF (text layer) | OCR (Searchable PDF) |
| Танҳо матн лозим (ҷустуҷӯ/AI) | Plain text | PDF ба матн |
Ин гайд “PDF-и сканшуда → Word-и таҳриршаванда”-ро мукаммал мекунад, то хатогиҳои OCR ва кори такрорӣ кам шавад.
Раванди тавсияшуда: PDF-и сканшуда → Word
Аввал тозагӣ, баъд фишурдан
Агар аввал Compress кунед, дақиқии OCR аксар вақт паст мешавад. Compress-ро ба охир гузоред.
Пеш аз табдил: файлеро барои OCR қулай кунед
- DPI кофӣ: 300 DPI тавсия мешавад; аз 150 DPI поён хатогӣ зиёд мешавад.
- Кам кардани каҷӣ (skew): агар саҳифа хеле каҷ бошад (масалан > 5°), шинохти хат/сутун вайрон мешавад.
- Аз соя/инъикос дурӣ ҷӯед: барои аксҳои телефон glare ва соя OCR‑ро бад мекунад.
- Сканер беҳтар: агар имкон бошад, flatbed scanner устувортар аст.
Манбаи тоза аз ҳар гуна танзим беҳтар аст
Агар PDF-и аслӣ (на screenshot) ё скани DPI баланд дошта бошед, аз ҳамон оғоз кунед.
Қадам 0 (ихтиёрӣ): агар файл мушкил бошад Repair кунед
Repair лозим аст, агар:
- “corrupted / can’t be read”
- upload/conversion зуд‑зуд ноком шавад
- саҳифаҳо пурра намоиш дода нашаванд
Қадам 1: гардиш (rotate) ва тартиби саҳифаҳо
Танзими саҳифаҳо- саҳифаҳои каҷ/ба паҳлӯро гардонед
- саҳифаҳои холӣ/зиёдатиро хориҷ кунед
- тартибро дуруст кунед
Қадам 2 (хеле муҳим): буридани канор/замина
Буридани PDF (Crop)Crop аксаран:
- дақиқии OCR‑ро зиёд мекунад
- тарҳи Word‑ро устувортар месозад
- noise‑ро кам мекунад
Қадам 3 (вобаста ба ҳуҷҷат): сиёҳ/сафед ё хокистарӣ барои контраст
Сиёҳ/сафед / хокистарӣБарои ҳуҷҷатҳои матнӣ (шартнома, қайд, расид) ва сканҳои контрасти паст муфид аст.
Қадам 4: ба Word табдил диҳед (OCR‑ро ҳангоми лозим фаъол кунед)
PDF ба WordМаслиҳати амалӣ:
- барои скан/акс: OCR фаъол, забони дуруст(ҳо) интихоб кунед
- пас аз табдил: 2–3 параграф + рақамҳои муҳим (маблағ/сана/ID)‑ро санҷед
Забони OCR‑ро дуруст интихоб кунед
Забони нодуруст сабаби асосии хатогиҳост. Забони ҳуҷҷатро (ё чанд забон, агар омехта бошад) интихоб кунед.
Хатоҳои маъмул ва роҳҳалҳои боэътимод
1) Хатои OCR зиёд: забон ва сифати манбаъ
Сабабҳои маъмул:
- забони OCR нодуруст
- манбаъ норавшан, соя/инъикос
- канор/замина бурида нашудааст
Кӯшиш кунед: Буридан → (агар лозим) Сиёҳ/сафед → OCR‑ро бо забони дуруст дубора иҷро кунед.
2) Ҷадвалҳо дар Word “мепошанд”: мақсадро ҷудо кунед
Барои ҷадвалҳо аксаран беҳтар:
PDF ба ExcelАгар танҳо матн лозим бошад:
PDF ба матн3) Иҷозат: unlock танҳо бо иҷозат
Кушодани PDFМуҳим
Unlock‑ро танҳо бо иҷозат истифода баред (дастрасии иҷозатдор / пароли маълум). Ин восита паролҳои номаълумро “шикан” намекунад.
Комбои хуб: дар Word таҳрир кунед, ҳамчун PDF супоред
- PDF ба Word → (таҳрир) → Word ба PDF
- Агар лозим бошад:
- watermark: Иловаи watermark
- муҳофизат/парол: Муҳофизати PDF
- андоза: Фишурдани PDF (одатан охир)
FAQ
Чаро баъд аз OCR ҳам хатогиҳо мемонанд?
Одатан 3 сабаб:
- Забон нодуруст
- Сифати манбаъ паст (норавшан/соя/инъикос)
- Омодасозӣ нест: Crop + Сиёҳ/сафед
Ҷадвал дар Word вайрон шуд. Чӣ кор кунам?
Барои ҳуҷҷатҳои ҷадвалдор:
PDF ба ExcelНормалӣ аст, ки тарҳи Word аз асл фарқ кунад?
Бале. PDF-и сканшуда → Word “recognize + reflow” аст, бинобар ин тарҳи мураккаб 100% такрор намешавад. Аввал copy/search/edit, баъд қисмҳои муҳимро дастӣ ислоҳ кунед.
Рӯйхати санҷиши зуд
- маблағ/сана/ID/рақамҳои шартнома
- ҷадвалҳо ҷойиваз шуданд (Excel истифода баред)
- header/footer/рақами саҳифа намерасад
- хат/бандҳо гум шудаанд (дар аксҳо маъмул)
Асбобҳои вобаста
PDF ба Word
Табдил ба Word-и таҳриршаванда (OCR барои сканҳо).
OCR (Searchable PDF)
Сканро аввал searchable кунед, баъд идома диҳед.
Crop PDF
Канор/заминаро тоза кунед, то OCR беҳтар шавад.
Сиёҳ/сафед
Контрастро зиёд карда, noise-ро кам мекунад.
Repair PDF
PDF-и мушкилро пеш аз табдил ислоҳ кунед.
PDF ба Excel
Барои ҷадвалҳо устувортар.
PDF ба матн
Танҳо матн лозим бошад — роҳи содда.
Word ба PDF
Пас аз таҳрир, ба PDF баргардонед.
