অনেক ব্যাংক, কার্ড ইস্যুয়ার এবং পেমেন্ট প্ল্যাটফর্ম PDF‑এ স্টেটমেন্ট দেয়। এগুলোকে স্ট্রাকচার্ড Excel‑এ রূপান্তর করলে মিলানো, হিসাব, ট্যাক্স বা রিস্ক অ্যানালাইসিস সহজ হয়। এই গাইডে পুনরাবৃত্তিযোগ্য ধাপ: কুইক স্টার্ট → বেশি নির্ভুলতা → কম্প্লায়েন্স ও ব্যাচ।
দ্রুত শুরু: ৩ ধাপ
- খুলুন PDF থেকে Excel
- আপনার স্টেটমেন্ট PDF আপলোড করুন (মাল্টি‑পেজ/মাল্টি‑ফাইল সাপোর্ট)
- স্ক্যান/ফটো হলে OCR চালু করুন, কনভার্ট করে
.xlsxডাউনলোড করুন
কোন ফাইলগুলো সবচেয়ে স্থিতিশীলভাবে কনভার্ট হয়?
- নেটিভ e‑স্টেটমেন্ট (সিলেক্টেবল/সার্চেবল টেক্সট): সবচেয়ে স্টেবল; টেবিল স্ট্রাকচার ভালো থাকে।
- স্ক্যান/ফটো (টেক্সট সিলেক্টেবল নয়): OCR চালু করুন; আগে ক্ল্যারিটি বাড়াতে পারেন।
নির্ভুলতা বাড়ানোর গুরুত্বপূর্ণ সেটিংস
1) কনভার্টের আগে পেজ গুছিয়ে নিন
- দিক/অর্ডার ঠিক করুন: পেজ অর্গানাইজ → ভুল রোটেশন ঠিক করুন, অপ্রয়োজনীয়/ফাঁকা পেজ বাদ দিন।
- টেক্সট‑ভিত্তিক স্টেটমেন্ট হলে কনট্রাস্ট বাড়ান: ব্ল্যাক/হোয়াইট (গ্রে) → কালার নয়েজ কমে, OCR আরও স্টেবল হয়।
স্ক্যান ঝাপসা হলে আগে পড়ার মতো করুন
কম DPI/ঝাপসা স্ক্যানে OCR সহজেই 8/0/6 বা 1/I/l গুলিয়ে ফেলে। সম্ভব হলে ≈300 DPI ব্যবহার করুন, বা আরও পরিষ্কার সোর্স নিন।
2) OCR ভাষা ও লেআউট সঠিকভাবে বাছুন
- ভাষা: যে ভাষায় স্টেটমেন্ট (বাংলা/ইংরেজি/মিশ্র) ঠিক সেটাই/সেটাইগুলো নির্বাচন করুন।
- টেবিল স্ট্রাকচার: টেবিল‑ভিত্তিক স্টেটমেন্টে টেবিল‑স্ট্রাকচার রক্ষা করা অপশন থাকলে সেটাই ব্যবহার করুন।
3) স্ক্যান স্টেটমেন্টে “স্টেবল” ওয়ার্কফ্লো
- ব্যাকগ্রাউন্ড/ভেক্টর ডিস্টার্ব করলে আগে Rasterize PDF করে তারপর OCR দিন।
- আউটপুট বড় হলে শেষে কমপ্রেস PDF ব্যবহার করুন (আগে কমপ্রেস করলে OCR খারাপ হতে পারে)।
সাধারণ সমস্যা (FAQ)
Q1: টাকা/তারিখ কলাম এলোমেলো হচ্ছে?
A: সম্ভব হলে নেটিভ e‑স্টেটমেন্ট ব্যবহার করুন। স্ক্যান হলে আগে অর্গানাইজ ও B/W করে তারপর OCR দিন।
Q2: মুদ্রা চিহ্ন/হেডার ঠিক থাকছে না?
A: OCR ভাষা ঠিক আছে কি দেখুন। দরকার হলে Rasterize করে আবার ট্রাই করুন।
Q3: একাধিক স্টেটমেন্ট একসাথে কিভাবে?
A: একসাথে বহু ফাইল আপলোড করে কনভার্ট করুন; বা আগে Merge PDF করে নিন।
Q4: শুধু নির্দিষ্ট মাস/পেজ দরকার?
A: আগে Split PDF করে প্রয়োজনীয় অংশ নিন, তারপর কনভার্ট করুন।
প্রাইভেসি ও কম্প্লায়েন্স
- স্টেটমেন্টে ব্যক্তিগত তথ্য থাকে—শুধু অনুমতি থাকলে প্রক্রিয়াকরণ করুন।
- এক্সপোর্টের পর কার্ড নম্বর/অ্যাকাউন্ট/রেফারেন্স ইত্যাদি সংবেদনশীল কলাম মুছে দিন বা মাস্ক করুন।
প্রস্তাবিত ওয়ার্কফ্লো
- নেটিভ PDF → PDF থেকে Excel → যাচাই/সামারি
- স্ক্যান → অর্গানাইজ → B/W → OCR সহ কনভার্ট → কুইক ভ্যালিডেশন
