অনেক সময় “PDF এডিট করা যাচ্ছে না” — এর মানে হলো: ফাইলটা দেখতে টেক্সটের মতো হলেও ভেতরে আসলে প্রতিটি পেজ ছবি (স্ক্যান/মোবাইল ফটো/স্ক্রিনশট দিয়ে বানানো)। Word‑এ এডিটেবল করতে মূল কাজগুলো হলো:
- পেজ ক্লিন‑আপ (রোটেশন/অর্ডার/বর্ডার/নয়েজ)
- দরকার হলে OCR (ছবির লেখাকে আসল টেক্সটে)
- Word এ এক্সপোর্ট করে গুরুত্বপূর্ণ অংশ যাচাই
১০ সেকেন্ড টেস্ট: OCR দরকার কি?
- টেক্সট সিলেক্ট হয় এবং Ctrl+F কাজ করে: সাধারণত OCR দরকার নেই — সরাসরি Word।
- টেক্সট সিলেক্ট হয় না/ব্লক হিসেবে সিলেক্ট হয়, Ctrl+F খুঁজে পায় না: স্ক্যান/ইমেজ PDF — OCR অন করুন।
- ব্যতিক্রম: কিছু PDF‑এ “টেক্সট” ভেক্টর শেপ (খুব শার্প কিন্তু সার্চ হয় না) — এ ক্ষেত্রেও OCR উপকারী।
লক্ষ্য ঠিক করুন: “এডিটেবল” নাকি “সার্চেবল”?
| প্রয়োজন | রেকমেন্ডেড আউটপুট | রেকমেন্ডেড টুল |
|---|---|---|
| লেখা/প্যারাগ্রাফ বদলানো, রি‑ফরম্যাট | Word (.docx) | PDF → Word |
| লে‑আউট একই রেখে সার্চ/কপি | Searchable PDF (টেক্সট লেয়ার) | OCR (Searchable PDF) |
| শুধু টেক্সট কনটেন্ট | Text | PDF → Text |
রেকমেন্ডেড ওয়ার্কফ্লো (সাকসেস রেট বেশি)
সবচেয়ে স্টেবল: পরিষ্কার → রিকগনিশন → কমপ্রেস
সাজেশন: Repair (ঐচ্ছিক) → Organize → Crop → B/W বা Gray (ঐচ্ছিক) → OCR/Word → Compress (প্রয়োজনে)।
OCR‑এর আগে কমপ্রেস করলে একিউরেসি কমতে পারে।
Step 0 (ঐচ্ছিক): ফাইল ওপেন/কনভার্ট ফেল করলে আগে Repair
Repair PDFStep 1: পেজ রোটেশন/অর্ডার ঠিক করুন
Organize PagesStep 2: কালো বর্ডার/ব্যাকগ্রাউন্ড Crop করুন
Crop PDFStep 3: টেক্সট ডকুমেন্টে কনট্রাস্ট বাড়াতে B/W বা Gray
Black & White / GrayscaleStep 4: Word এ কনভার্ট (প্রয়োজনে OCR অন)
PDF → Wordকনভার্টের পরে দ্রুত যাচাই করুন: ২–৩ প্যারাগ্রাফ + গুরুত্বপূর্ণ সংখ্যা (অ্যামাউন্ট/ডেট/আইডি)।
কমন সমস্যা ও সমাধান
1) ভুল বেশি: ভাষা ও সোর্স‑কোয়ালিটি চেক
- ভুল ভাষা সিলেক্ট করা সবচেয়ে কমন কারণ।
- ব্লার/গ্লেয়ার/শেডো হলে ভালো সোর্স ব্যবহার করুন।
- ব্যাকআপ পথ: Crop → B/W → আবার কনভার্ট।
2) টেবিল/কলাম এলোমেলো: Excel বা Text ব্যবহার করুন
- টেবিল বেশি হলে: PDF → Excel
- শুধু লেখা দরকার হলে: PDF → Text
3) শার্প কিন্তু সার্চ হয় না: Rasterize করে নিন
Rasterize PDF4) পারমিশন লিমিট: অথরাইজড হলে Unlock
Unlock PDFকমপ্লায়েন্স
কেবল অনুমতি/জানা পাসওয়ার্ড থাকলে Unlock ব্যবহার করুন। অজানা পাসওয়ার্ড ভাঙা সমর্থিত নয়।
এডিট করে আবার “ডেলিভারেবল PDF” বানান
PDF → Word → (Word এ এডিট) → Word → PDF
ডেলিভারির সময় (ক্লায়েন্ট/সাবমিশন/টেন্ডার) সাধারণত দরকার হতে পারে:
- মালিকানা/অ্যান্টি‑মিসইউজ: Add Watermark
- কপি/এডিট/প্রিন্ট সীমা বা ওপেন পাসওয়ার্ড: Protect PDF
- সাইজ লিমিট: Compress PDF (সাধারণত শেষ ধাপে)
FAQ
OCR করার পরও ভুল কেন থাকে?
সাধারণত ৩ কারণে:
Word‑এ টেবিল/কলাম নষ্ট হলে কী করব?
টেবিল বেশি হলে আগে:
PDF → ExcelLayout অনেক বদলে গেলে কি এটা স্বাভাবিক?
হ্যাঁ। স্ক্যান PDF → Word হলো “recognize + reflow”, তাই জটিল লে‑আউট 100% একরকম নাও হতে পারে।
কুইক চেকলিস্ট (কনভার্টের পরে)
- অ্যামাউন্ট/ডেট/ID/কনট্র্যাক্ট নম্বর
- টেবিল কলাম শিফট (প্রয়োজনে Excel)
- header/footer/page number মিসিং
- লাইন/ক্লজ মিসিং (ফোন ফটোতে বেশি)
PDF → Word
স্ক্যান হলে OCR সহ Word এ এক্সপোর্ট।
OCR (Searchable PDF)
স্ক্যান PDF কে সার্চেবল বানান।
Crop PDF
বর্ডার/ব্যাকগ্রাউন্ড বাদ দিয়ে একিউরেসি বাড়ান।
B/W বা Gray
কনট্রাস্ট বাড়িয়ে নয়েজ কমান।
Repair PDF
ড্যামেজড PDF আগে Repair করুন।
PDF → Excel
টেবিল‑হেভি ডকুমেন্টে বেশি স্থিতিশীল।
PDF → Text
শুধু টেক্সট কনটেন্ট দরকার হলে।
Word → PDF
এডিটের পরে আবার PDF এ ফিরুন।
