Logo
स्क्यान गरिएको PDF लाई सम्पादनयोग्य Word बनाउने: पूर्ण गाइड (OCR + लेआउट)
ब्लग

स्क्यान गरिएको PDF लाई सम्पादनयोग्य Word बनाउने: पूर्ण गाइड (OCR + लेआउट)

स्क्यान/फोटो PDF लाई Word मा सम्पादनयोग्य बनाउनुहोस्: 10‑सेकेन्ड OCR जाँच, प्रि‑प्रोसेसिङ र छिटो समाधानहरू।

नेपाली

“PDF सम्पादन गर्न मिल्दैन” भन्ने धेरैजसो कारण: फाइल भित्र वास्तविक टेक्स्ट होइन, तस्वीर/स्क्यान हुन्छ। Word मा सम्पादनयोग्य बनाउन: पेज सफा‑सुधार → आवश्यक भए OCR चलाउनुहोस् → Word मा निकालेर महत्त्वपूर्ण फाँटहरू जाँच्नुहोस्।

10 सेकेन्ड जाँच: OCR चाहिन्छ?

  • टेक्स्ट छान्न मिल्छ र Ctrl+F ले खोज्छ: सामान्यतया OCR चाहिँदैन — सिधै Word मा रूपान्तरण।
  • टेक्स्ट छान्न मिल्दैन (वा ब्लक मात्र) र Ctrl+F ले केही फेला पार्दैन: स्क्यान/इमेज PDF — OCR अन गर्नुहोस्।

सही लक्ष्य छान्नुहोस्: “editable” कि “searchable”?

तपाईंको लक्ष्यसबैभन्दा राम्रो आउटपुटसिफारिस गरिएको टूल
वाक्य/परिच्छेद सम्पादन, लेआउट परिमार्जनWord (.docx)PDF → Word
देखावट जोगाएर खोज्न/कपी गर्न मिल्ने बनाउनेSearchable PDF (text layer)OCR (Searchable PDF)
केवल टेक्स्ट चाहिन्छ (खोज/अनुवाद/AI)Plain textPDF → Text

यो गाइड “स्क्यान PDF → सम्पादनयोग्य Word” मा केन्द्रित छ — OCR गल्ती, बिग्रिएको लेआउट, र पुन: काम कम गर्न।

सिफारिस गरिएको प्रक्रिया: स्क्यान PDF → सम्पादनयोग्य Word (उच्च सफलता दर)

सिफारिस गरिएको क्रम

Repair (वैकल्पिक) → Organize → Crop → B/W (वैकल्पिक) → OCR/Word → Compress (अन्त्यमा)।

Repair PDF Organize Pages Crop PDF PDF → Word

कनभर्ट गर्नु अघि: OCR‑friendly बनाउनुहोस्

स्रोतको गुणस्तर कमजोर भए OCR ले पनि राम्रो नतिजा दिन गाह्रो हुन्छ। यी तयारीहरू धेरै उपयोगी हुन्छन्:

  • पर्याप्त DPI: 300 DPI सिफारिस; 150 DPI तल अचूकता धेरै घट्छ।
  • टिल्ट/स्क्यू कम गर्नुहोस्: पेज धेरै तिरछो (जस्तै > 5°) भए लाइन/कॉलम पहिचान बिग्रन्छ।
  • ग्लेयर/छाया हटाउनुहोस्: फोन फोटो भए सीधा प्रकाश टार्नुहोस् र पृष्ठभूमि सफा राख्नुहोस्।
  • स्क्यानर राम्रो: सम्भव भए flatbed scanner प्रयोग गर्नुहोस्।

सफा स्रोत = राम्रो नतिजा

Screenshot भन्दा वास्तविक PDF, वा उच्च‑DPI स्क्यान उपलब्ध छ भने त्यहीँबाट सुरु गर्नुहोस्।

चरण 0 (वैकल्पिक): फाइल नखुल्ने/कनभर्ट नहुने भए Repair पहिले

यी अवस्थामा Repair गर्नुहोस्:

  • “file corrupted / can’t be read”
  • upload/conversion बारम्बार फेल
  • पेजहरू अपूरो render हुने
Repair PDF

चरण 1: पेजको घुमाइ (rotate) र क्रम मिलाउनुहोस्

Organize Pages
  • साइडमा भएका पेज घुमाउनुहोस् (टेक्स्ट तेर्सो नभए OCR तुरुन्तै बिग्रन्छ)
  • खाली/अनावश्यक पेज हटाउनुहोस्
  • क्रम मिलाउनुहोस् (स्क्यान प्याकेजमा यो सामान्य हो)

चरण 2 (धेरै सिफारिस): कालो किनारा/पृष्ठभूमि Crop गर्नुहोस्

Crop PDF

Crop ले:

  • OCR अचूकता बढाउँछ
  • Word लेआउट स्थिर बनाउँछ
  • प्रोसेसिङ छिटो हुन्छ

चरण 3 (कागजात अनुसार): B/W वा grayscale ले contrast बढाउनुहोस्

B/W / Grayscale

टेक्स्ट धेरै भएका कागजात (सम्झौता/नोट/रसिद) वा हल्का‑रङ कागजमा उपयोगी।

चरण 4: Word मा कनभर्ट गर्नुहोस् (आवश्यक भए OCR अन)

PDF → Word

प्र्याक्टिकल टिप्स:

  • स्क्यान/फोटो भए OCR अन गरेर सही भाषा(हरू) छान्नुहोस्
  • कनभर्ट पछि 2–3 परिच्छेद + महत्वपूर्ण नम्बर (रकम/मिति/ID) जाँच्नुहोस्

OCR भाषा सही छान्नुहोस्

गलत भाषा छनौटले गल्ती धेरै बढाउँछ। सामग्री जुन भाषामा छ, त्यहीँ (वा mixed भए धेरै भाषा) छान्नुहोस्।

सामान्य समस्या + भरपर्दो विकल्प

1) धेरै टाइपो/अक्षर छुट्ने

  • OCR भाषा जाँच (कारण #1)
  • blur/glare/छाया जाँच
  • fallback: CropB/W → पुन: कनभर्ट

2) multi‑column/तालिका/footnote ले लेआउट बिगार्छ

  • तालिका धेरै भए Excel पहिले: PDF → Excel
  • केवल टेक्स्ट चाहिँदा: PDF → Text

3) देखिन्छ sharp, तर Ctrl+F ले केही फेला पार्दैन

कहिलेकाहीँ टेक्स्ट vector outline हुन्छ (searchable हुँदैन)। प्रयास गर्नुहोस्:

4) Permission restriction: unlock पहिले (अधिकृत भए मात्र)

Unlock PDF

Compliance note

Unlock केवल अनुमति/पासवर्ड थाहा भएको अवस्थामा मात्र प्रयोग गर्नुहोस्। Unknown password crack हुँदैन।

उपयोगी combo: Word मा edit → अन्त्यमा PDF

अक्सर Word अन्तिम फर्म्याट हुँदैन। डेलिभरीका लागि:

  1. Editing: PDF → Word → (Word मा edit) → Word → PDF
  2. Delivery (आवश्यक अनुसार):

सामान्य क्रम

  • Word → PDF → watermark (वैकल्पिक) → protect (वैकल्पिक) → compress (वैकल्पिक, अन्त्यमा)।
  • “view‑only” कडा चाहिँदा: protect अघि Flatten PDF वा Rasterize PDF थप्नुहोस् (trade‑off: टेक्स्ट image हुन्छ; file size बढ्न सक्छ)।

FAQ

OCR पछि पनि गल्ती किन हुन्छ?

मुख्य 3 कारण:

  1. गलत भाषा
  2. स्रोत गुणस्तर खराब
  3. preprocessing छैन: Crop + B/W

Word मा तालिका बिग्रियो। के गर्ने?

तालिका‑heavy स्क्यानका लागि:

PDF → Excel

Word लेआउट मूलसँग धेरै फरक हुनु सामान्य हो?

हो। स्क्यान PDF → Word “recognize + reflow” हो, जटिल लेआउट 100% उस्तै आउँदैन। पहिले copy/search/edit, त्यसपछि महत्वपूर्ण भाग हातैले मिलाउनुहोस्।

छिटो checklist: कनभर्ट पछि के जाँच्ने?

  • रकम / मिति / ID / कागजात नम्बर
  • तालिका कॉलम shift (आवश्यक भए Excel)
  • header/footer/page number हराउनु
  • लाइन/क्लज छुट्नु (फोन फोटोमा बढी)

सम्बन्धित टूलहरू