Logo
ব্যাংক স্টেটমেন্ট PDF থেকে Excel — নির্ভুল এক্সট্রাকশন, OCR ও ডেটা গোপনকরণ
ব্লগ

ব্যাংক স্টেটমেন্ট PDF থেকে Excel — নির্ভুল এক্সট্রাকশন, OCR ও ডেটা গোপনকরণ

ব্যাংক স্টেটমেন্ট/অ্যাকাউন্ট স্টেটমেন্ট/বিলিং PDF উচ্চ‑নির্ভুলতায় এডিটেবল Excel‑এ রূপান্তর করুন। স্ক্যানের জন্য OCR, হেডার অ্যালাইনমেন্ট, মুদ্রা/তারিখ শনাক্তকরণ, ব্যাচ ওয়ার্কফ্লো এবং প্রাইভেসি কভার করা হয়েছে।

বাংলা

অনেক ব্যাংক, কার্ড ইস্যুয়ার এবং পেমেন্ট প্ল্যাটফর্ম PDF‑এ স্টেটমেন্ট দেয়। এগুলোকে স্ট্রাকচার্ড Excel‑এ রূপান্তর করলে মিলানো, হিসাব, ট্যাক্স বা রিস্ক অ্যানালাইসিস সহজ হয়। এই গাইডে পুনরাবৃত্তিযোগ্য ধাপ: কুইক স্টার্ট → বেশি নির্ভুলতা → কম্প্লায়েন্স ও ব্যাচ।

দ্রুত শুরু: ৩ ধাপ

  1. খুলুন PDF থেকে Excel
  2. আপনার স্টেটমেন্ট PDF আপলোড করুন (মাল্টি‑পেজ/মাল্টি‑ফাইল সাপোর্ট)
  3. স্ক্যান/ফটো হলে OCR চালু করুন, কনভার্ট করে .xlsx ডাউনলোড করুন

কোন ফাইলগুলো সবচেয়ে স্থিতিশীলভাবে কনভার্ট হয়?

  • নেটিভ e‑স্টেটমেন্ট (সিলেক্টেবল/সার্চেবল টেক্সট): সবচেয়ে স্টেবল; টেবিল স্ট্রাকচার ভালো থাকে।
  • স্ক্যান/ফটো (টেক্সট সিলেক্টেবল নয়): OCR চালু করুন; আগে ক্ল্যারিটি বাড়াতে পারেন।

নির্ভুলতা বাড়ানোর গুরুত্বপূর্ণ সেটিংস

1) কনভার্টের আগে পেজ গুছিয়ে নিন

  • দিক/অর্ডার ঠিক করুন: পেজ অর্গানাইজ → ভুল রোটেশন ঠিক করুন, অপ্রয়োজনীয়/ফাঁকা পেজ বাদ দিন।
  • টেক্সট‑ভিত্তিক স্টেটমেন্ট হলে কনট্রাস্ট বাড়ান: ব্ল্যাক/হোয়াইট (গ্রে) → কালার নয়েজ কমে, OCR আরও স্টেবল হয়।

স্ক্যান ঝাপসা হলে আগে পড়ার মতো করুন

কম DPI/ঝাপসা স্ক্যানে OCR সহজেই 8/0/6 বা 1/I/l গুলিয়ে ফেলে। সম্ভব হলে ≈300 DPI ব্যবহার করুন, বা আরও পরিষ্কার সোর্স নিন।

2) OCR ভাষা ও লেআউট সঠিকভাবে বাছুন

  • ভাষা: যে ভাষায় স্টেটমেন্ট (বাংলা/ইংরেজি/মিশ্র) ঠিক সেটাই/সেটাইগুলো নির্বাচন করুন।
  • টেবিল স্ট্রাকচার: টেবিল‑ভিত্তিক স্টেটমেন্টে টেবিল‑স্ট্রাকচার রক্ষা করা অপশন থাকলে সেটাই ব্যবহার করুন।

3) স্ক্যান স্টেটমেন্টে “স্টেবল” ওয়ার্কফ্লো

  • ব্যাকগ্রাউন্ড/ভেক্টর ডিস্টার্ব করলে আগে Rasterize PDF করে তারপর OCR দিন।
  • আউটপুট বড় হলে শেষে কমপ্রেস PDF ব্যবহার করুন (আগে কমপ্রেস করলে OCR খারাপ হতে পারে)।

সাধারণ সমস্যা (FAQ)

Q1: টাকা/তারিখ কলাম এলোমেলো হচ্ছে?
A: সম্ভব হলে নেটিভ e‑স্টেটমেন্ট ব্যবহার করুন। স্ক্যান হলে আগে অর্গানাইজB/W করে তারপর OCR দিন।

Q2: মুদ্রা চিহ্ন/হেডার ঠিক থাকছে না?
A: OCR ভাষা ঠিক আছে কি দেখুন। দরকার হলে Rasterize করে আবার ট্রাই করুন।

Q3: একাধিক স্টেটমেন্ট একসাথে কিভাবে?
A: একসাথে বহু ফাইল আপলোড করে কনভার্ট করুন; বা আগে Merge PDF করে নিন।

Q4: শুধু নির্দিষ্ট মাস/পেজ দরকার?
A: আগে Split PDF করে প্রয়োজনীয় অংশ নিন, তারপর কনভার্ট করুন।

প্রাইভেসি ও কম্প্লায়েন্স

  • স্টেটমেন্টে ব্যক্তিগত তথ্য থাকে—শুধু অনুমতি থাকলে প্রক্রিয়াকরণ করুন।
  • এক্সপোর্টের পর কার্ড নম্বর/অ্যাকাউন্ট/রেফারেন্স ইত্যাদি সংবেদনশীল কলাম মুছে দিন বা মাস্ক করুন।

প্রস্তাবিত ওয়ার্কফ্লো

  1. নেটিভ PDF → PDF থেকে Excel → যাচাই/সামারি
  2. স্ক্যান → অর্গানাইজB/W → OCR সহ কনভার্ট → কুইক ভ্যালিডেশন