“PDF सम्पादन गर्न मिल्दैन” भन्ने धेरैजसो कारण: फाइल भित्र वास्तविक टेक्स्ट होइन, तस्वीर/स्क्यान हुन्छ। Word मा सम्पादनयोग्य बनाउन: पेज सफा‑सुधार → आवश्यक भए OCR चलाउनुहोस् → Word मा निकालेर महत्त्वपूर्ण फाँटहरू जाँच्नुहोस्।
10 सेकेन्ड जाँच: OCR चाहिन्छ?
- टेक्स्ट छान्न मिल्छ र Ctrl+F ले खोज्छ: सामान्यतया OCR चाहिँदैन — सिधै Word मा रूपान्तरण।
- टेक्स्ट छान्न मिल्दैन (वा ब्लक मात्र) र Ctrl+F ले केही फेला पार्दैन: स्क्यान/इमेज PDF — OCR अन गर्नुहोस्।
सही लक्ष्य छान्नुहोस्: “editable” कि “searchable”?
| तपाईंको लक्ष्य | सबैभन्दा राम्रो आउटपुट | सिफारिस गरिएको टूल |
|---|---|---|
| वाक्य/परिच्छेद सम्पादन, लेआउट परिमार्जन | Word (.docx) | PDF → Word |
| देखावट जोगाएर खोज्न/कपी गर्न मिल्ने बनाउने | Searchable PDF (text layer) | OCR (Searchable PDF) |
| केवल टेक्स्ट चाहिन्छ (खोज/अनुवाद/AI) | Plain text | PDF → Text |
यो गाइड “स्क्यान PDF → सम्पादनयोग्य Word” मा केन्द्रित छ — OCR गल्ती, बिग्रिएको लेआउट, र पुन: काम कम गर्न।
सिफारिस गरिएको प्रक्रिया: स्क्यान PDF → सम्पादनयोग्य Word (उच्च सफलता दर)
सिफारिस गरिएको क्रम
Repair (वैकल्पिक) → Organize → Crop → B/W (वैकल्पिक) → OCR/Word → Compress (अन्त्यमा)।
कनभर्ट गर्नु अघि: OCR‑friendly बनाउनुहोस्
स्रोतको गुणस्तर कमजोर भए OCR ले पनि राम्रो नतिजा दिन गाह्रो हुन्छ। यी तयारीहरू धेरै उपयोगी हुन्छन्:
- पर्याप्त DPI: 300 DPI सिफारिस; 150 DPI तल अचूकता धेरै घट्छ।
- टिल्ट/स्क्यू कम गर्नुहोस्: पेज धेरै तिरछो (जस्तै > 5°) भए लाइन/कॉलम पहिचान बिग्रन्छ।
- ग्लेयर/छाया हटाउनुहोस्: फोन फोटो भए सीधा प्रकाश टार्नुहोस् र पृष्ठभूमि सफा राख्नुहोस्।
- स्क्यानर राम्रो: सम्भव भए flatbed scanner प्रयोग गर्नुहोस्।
सफा स्रोत = राम्रो नतिजा
Screenshot भन्दा वास्तविक PDF, वा उच्च‑DPI स्क्यान उपलब्ध छ भने त्यहीँबाट सुरु गर्नुहोस्।
चरण 0 (वैकल्पिक): फाइल नखुल्ने/कनभर्ट नहुने भए Repair पहिले
यी अवस्थामा Repair गर्नुहोस्:
- “file corrupted / can’t be read”
- upload/conversion बारम्बार फेल
- पेजहरू अपूरो render हुने
चरण 1: पेजको घुमाइ (rotate) र क्रम मिलाउनुहोस्
Organize Pages- साइडमा भएका पेज घुमाउनुहोस् (टेक्स्ट तेर्सो नभए OCR तुरुन्तै बिग्रन्छ)
- खाली/अनावश्यक पेज हटाउनुहोस्
- क्रम मिलाउनुहोस् (स्क्यान प्याकेजमा यो सामान्य हो)
चरण 2 (धेरै सिफारिस): कालो किनारा/पृष्ठभूमि Crop गर्नुहोस्
Crop PDFCrop ले:
- OCR अचूकता बढाउँछ
- Word लेआउट स्थिर बनाउँछ
- प्रोसेसिङ छिटो हुन्छ
चरण 3 (कागजात अनुसार): B/W वा grayscale ले contrast बढाउनुहोस्
B/W / Grayscaleटेक्स्ट धेरै भएका कागजात (सम्झौता/नोट/रसिद) वा हल्का‑रङ कागजमा उपयोगी।
चरण 4: Word मा कनभर्ट गर्नुहोस् (आवश्यक भए OCR अन)
PDF → Wordप्र्याक्टिकल टिप्स:
- स्क्यान/फोटो भए OCR अन गरेर सही भाषा(हरू) छान्नुहोस्
- कनभर्ट पछि 2–3 परिच्छेद + महत्वपूर्ण नम्बर (रकम/मिति/ID) जाँच्नुहोस्
OCR भाषा सही छान्नुहोस्
गलत भाषा छनौटले गल्ती धेरै बढाउँछ। सामग्री जुन भाषामा छ, त्यहीँ (वा mixed भए धेरै भाषा) छान्नुहोस्।
सामान्य समस्या + भरपर्दो विकल्प
1) धेरै टाइपो/अक्षर छुट्ने
2) multi‑column/तालिका/footnote ले लेआउट बिगार्छ
- तालिका धेरै भए Excel पहिले: PDF → Excel
- केवल टेक्स्ट चाहिँदा: PDF → Text
3) देखिन्छ sharp, तर Ctrl+F ले केही फेला पार्दैन
कहिलेकाहीँ टेक्स्ट vector outline हुन्छ (searchable हुँदैन)। प्रयास गर्नुहोस्:
- Word + OCR: PDF → Word
- पहिले rasterize: Rasterize PDF
4) Permission restriction: unlock पहिले (अधिकृत भए मात्र)
Unlock PDFCompliance note
Unlock केवल अनुमति/पासवर्ड थाहा भएको अवस्थामा मात्र प्रयोग गर्नुहोस्। Unknown password crack हुँदैन।
उपयोगी combo: Word मा edit → अन्त्यमा PDF
अक्सर Word अन्तिम फर्म्याट हुँदैन। डेलिभरीका लागि:
- Editing: PDF → Word → (Word मा edit) → Word → PDF
- Delivery (आवश्यक अनुसार):
- watermark: Add Watermark
- protect (copy/edit/print सीमित): Protect PDF
- size घटाउन: Compress PDF (अन्त्यमा)
सामान्य क्रम
- Word → PDF → watermark (वैकल्पिक) → protect (वैकल्पिक) → compress (वैकल्पिक, अन्त्यमा)।
- “view‑only” कडा चाहिँदा: protect अघि Flatten PDF वा Rasterize PDF थप्नुहोस् (trade‑off: टेक्स्ट image हुन्छ; file size बढ्न सक्छ)।
FAQ
OCR पछि पनि गल्ती किन हुन्छ?
मुख्य 3 कारण:
Word मा तालिका बिग्रियो। के गर्ने?
तालिका‑heavy स्क्यानका लागि:
PDF → ExcelWord लेआउट मूलसँग धेरै फरक हुनु सामान्य हो?
हो। स्क्यान PDF → Word “recognize + reflow” हो, जटिल लेआउट 100% उस्तै आउँदैन। पहिले copy/search/edit, त्यसपछि महत्वपूर्ण भाग हातैले मिलाउनुहोस्।
छिटो checklist: कनभर्ट पछि के जाँच्ने?
- रकम / मिति / ID / कागजात नम्बर
- तालिका कॉलम shift (आवश्यक भए Excel)
- header/footer/page number हराउनु
- लाइन/क्लज छुट्नु (फोन फोटोमा बढी)
सम्बन्धित टूलहरू
PDF → Word
स्क्यानका लागि OCR सहित Word मा रूपान्तरण।
OCR (Searchable PDF)
स्क्यान PDF लाई पहिले searchable बनाउनुहोस्।
Crop PDF
किनारा/पृष्ठभूमि हटाएर OCR सुधार्नुहोस्।
B/W / Grayscale
contrast बढाएर टेक्स्ट‑heavy स्क्यानको noise घटाउनुहोस्।
Repair PDF
बिग्रिएको PDF पहिले मर्मत गर्नुहोस्।
PDF → Excel
टेबल भएका कागजातमा बढी स्थिर।
Word → PDF
सम्पादनपछि फेरि PDF मा फर्काउनुहोस्।
