स्क्यान गरिएको PDF लाई सम्पादनयोग्य Word बनाउने: पूर्ण गाइड (OCR + लेआउट)

“PDF सम्पादन गर्न मिल्दैन” भन्ने धेरैजसो कारण: फाइल भित्र वास्तविक टेक्स्ट होइन, तस्वीर/स्क्यान हुन्छ। Word मा सम्पादनयोग्य बनाउन: पेज सफा‑सुधार → आवश्यक भए OCR चलाउनुहोस् → Word मा निकालेर महत्त्वपूर्ण फाँटहरू जाँच्नुहोस्।

10 सेकेन्ड जाँच: OCR चाहिन्छ?

टेक्स्ट छान्न मिल्छ र Ctrl+F ले खोज्छ: सामान्यतया OCR चाहिँदैन — सिधै Word मा रूपान्तरण।
टेक्स्ट छान्न मिल्दैन (वा ब्लक मात्र) र Ctrl+F ले केही फेला पार्दैन: स्क्यान/इमेज PDF — OCR अन गर्नुहोस्।

सही लक्ष्य छान्नुहोस्: “editable” कि “searchable”?

तपाईंको लक्ष्य	सबैभन्दा राम्रो आउटपुट	सिफारिस गरिएको टूल
वाक्य/परिच्छेद सम्पादन, लेआउट परिमार्जन	Word (.docx)	PDF → Word
देखावट जोगाएर खोज्न/कपी गर्न मिल्ने बनाउने	Searchable PDF (text layer)	OCR (Searchable PDF)
केवल टेक्स्ट चाहिन्छ (खोज/अनुवाद/AI)	Plain text	PDF → Text

यो गाइड “स्क्यान PDF → सम्पादनयोग्य Word” मा केन्द्रित छ — OCR गल्ती, बिग्रिएको लेआउट, र पुन: काम कम गर्न।

सिफारिस गरिएको प्रक्रिया: स्क्यान PDF → सम्पादनयोग्य Word (उच्च सफलता दर)

सिफारिस गरिएको क्रम

Repair (वैकल्पिक) → Organize → Crop → B/W (वैकल्पिक) → OCR/Word → Compress (अन्त्यमा)।

Repair PDF Organize Pages Crop PDF PDF → Word

कनभर्ट गर्नु अघि: OCR‑friendly बनाउनुहोस्

स्रोतको गुणस्तर कमजोर भए OCR ले पनि राम्रो नतिजा दिन गाह्रो हुन्छ। यी तयारीहरू धेरै उपयोगी हुन्छन्:

पर्याप्त DPI: 300 DPI सिफारिस; 150 DPI तल अचूकता धेरै घट्छ।
टिल्ट/स्क्यू कम गर्नुहोस्: पेज धेरै तिरछो (जस्तै > 5°) भए लाइन/कॉलम पहिचान बिग्रन्छ।
ग्लेयर/छाया हटाउनुहोस्: फोन फोटो भए सीधा प्रकाश टार्नुहोस् र पृष्ठभूमि सफा राख्नुहोस्।
स्क्यानर राम्रो: सम्भव भए flatbed scanner प्रयोग गर्नुहोस्।

सफा स्रोत = राम्रो नतिजा

Screenshot भन्दा वास्तविक PDF, वा उच्च‑DPI स्क्यान उपलब्ध छ भने त्यहीँबाट सुरु गर्नुहोस्।

चरण 0 (वैकल्पिक): फाइल नखुल्ने/कनभर्ट नहुने भए Repair पहिले

यी अवस्थामा Repair गर्नुहोस्:

“file corrupted / can’t be read”
upload/conversion बारम्बार फेल
पेजहरू अपूरो render हुने

Repair PDF

चरण 1: पेजको घुमाइ (rotate) र क्रम मिलाउनुहोस्

Organize Pages

साइडमा भएका पेज घुमाउनुहोस् (टेक्स्ट तेर्सो नभए OCR तुरुन्तै बिग्रन्छ)
खाली/अनावश्यक पेज हटाउनुहोस्
क्रम मिलाउनुहोस् (स्क्यान प्याकेजमा यो सामान्य हो)

चरण 2 (धेरै सिफारिस): कालो किनारा/पृष्ठभूमि Crop गर्नुहोस्

Crop PDF

Crop ले:

OCR अचूकता बढाउँछ
Word लेआउट स्थिर बनाउँछ
प्रोसेसिङ छिटो हुन्छ

चरण 3 (कागजात अनुसार): B/W वा grayscale ले contrast बढाउनुहोस्

B/W / Grayscale

टेक्स्ट धेरै भएका कागजात (सम्झौता/नोट/रसिद) वा हल्का‑रङ कागजमा उपयोगी।

चरण 4: Word मा कनभर्ट गर्नुहोस् (आवश्यक भए OCR अन)

PDF → Word

प्र्याक्टिकल टिप्स:

स्क्यान/फोटो भए OCR अन गरेर सही भाषा(हरू) छान्नुहोस्
कनभर्ट पछि 2–3 परिच्छेद + महत्वपूर्ण नम्बर (रकम/मिति/ID) जाँच्नुहोस्

OCR भाषा सही छान्नुहोस्

गलत भाषा छनौटले गल्ती धेरै बढाउँछ। सामग्री जुन भाषामा छ, त्यहीँ (वा mixed भए धेरै भाषा) छान्नुहोस्।

सामान्य समस्या + भरपर्दो विकल्प

1) धेरै टाइपो/अक्षर छुट्ने

OCR भाषा जाँच (कारण #1)
blur/glare/छाया जाँच
fallback: Crop → B/W → पुन: कनभर्ट

2) multi‑column/तालिका/footnote ले लेआउट बिगार्छ

तालिका धेरै भए Excel पहिले: PDF → Excel
केवल टेक्स्ट चाहिँदा: PDF → Text

3) देखिन्छ sharp, तर Ctrl+F ले केही फेला पार्दैन

कहिलेकाहीँ टेक्स्ट vector outline हुन्छ (searchable हुँदैन)। प्रयास गर्नुहोस्:

Word + OCR: PDF → Word
पहिले rasterize: Rasterize PDF

4) Permission restriction: unlock पहिले (अधिकृत भए मात्र)

Unlock PDF

Compliance note

Unlock केवल अनुमति/पासवर्ड थाहा भएको अवस्थामा मात्र प्रयोग गर्नुहोस्। Unknown password crack हुँदैन।

उपयोगी combo: Word मा edit → अन्त्यमा PDF

अक्सर Word अन्तिम फर्म्याट हुँदैन। डेलिभरीका लागि:

Editing: PDF → Word → (Word मा edit) → Word → PDF
Delivery (आवश्यक अनुसार):

watermark: Add Watermark
protect (copy/edit/print सीमित): Protect PDF
size घटाउन: Compress PDF (अन्त्यमा)

सामान्य क्रम

Word → PDF → watermark (वैकल्पिक) → protect (वैकल्पिक) → compress (वैकल्पिक, अन्त्यमा)।
“view‑only” कडा चाहिँदा: protect अघि Flatten PDF वा Rasterize PDF थप्नुहोस् (trade‑off: टेक्स्ट image हुन्छ; file size बढ्न सक्छ)।

FAQ

OCR पछि पनि गल्ती किन हुन्छ?

मुख्य 3 कारण:

गलत भाषा
स्रोत गुणस्तर खराब
preprocessing छैन: Crop + B/W

Word मा तालिका बिग्रियो। के गर्ने?

तालिका‑heavy स्क्यानका लागि:

PDF → Excel

Word लेआउट मूलसँग धेरै फरक हुनु सामान्य हो?

हो। स्क्यान PDF → Word “recognize + reflow” हो, जटिल लेआउट 100% उस्तै आउँदैन। पहिले copy/search/edit, त्यसपछि महत्वपूर्ण भाग हातैले मिलाउनुहोस्।

छिटो checklist: कनभर्ट पछि के जाँच्ने?

रकम / मिति / ID / कागजात नम्बर
तालिका कॉलम shift (आवश्यक भए Excel)
header/footer/page number हराउनु
लाइन/क्लज छुट्नु (फोन फोटोमा बढी)