कई बैंक, क्रेडिट‑कार्ड प्रदाता और पेमेंट प्लेटफ़ॉर्म PDF में स्टेटमेंट देते हैं। इन्हें स्ट्रक्चर्ड Excel में बदलने से रीकंसिलेशन, बुक‑कीपिंग, टैक्स या रिस्क विश्लेषण आसान होता है। यह गाइड “क्विक‑स्टार्ट → उच्च सटीकता → अनुपालन+बैच” तक दोहराए जा सकने वाले वर्कफ़्लो देता है।
क्विक‑स्टार्ट: 3 चरणों में कन्वर्ट
- खोलें PDF से Excel
- अपना बैंक स्टेटमेंट PDF अपलोड करें (मल्टी‑पेज और मल्टी‑फ़ाइल समर्थित)
- अगर स्कैन/फ़ोटो है, तो OCR ऑन करें, फिर कन्वर्ट कर
.xlsx
डाउनलोड करें
कौन‑सी फाइलें सबसे स्थिरता से कन्वर्ट होती हैं?
- नैटिव ई‑स्टेटमेंट (टेक्स्ट सेलेक्ट/सर्च हो): सबसे स्थिर; टेबल संरचना सर्वोत्तम रहती है।
- स्कैन/फ़ोटो (टेक्स्ट सेलेक्ट न हो): OCR ऑन करें; पहले स्पष्टता बढ़ाने पर विचार करें।
सटीकता बढ़ाने की प्रमुख सेटिंग्स
1) पहचान से पहले पेज “संवारें”
-
दिशा/क्रम सुधारें:
PDF पेज ऑर्गनाइज़ → साइड‑वे पेज बैच‑रोटेट करें, ड्रैग‑एंड‑ड्रॉप से री‑ऑर्डर करें, खाली/विज्ञापन पेज हटाएँ। -
ब्लैक‑एंड‑व्हाइट / हाई कॉन्ट्रास्ट (टेक्स्ट‑हेवी स्टेटमेंट):
ब्लैक/व्हाइट / ग्रेस्केल → कलर नॉइज़ घटेगा, OCR सटीकता बढ़ेगी।
इमेज धुंधली? पहले पठनीयता बढ़ाएँ
लो‑क्वालिटी स्कैन में OCR 8/0/6 जैसे मिलते‑जुलते अंकों में गड़बड़ा सकता है। ~300 DPI लक्ष्य रखें; ज़रूरत हो तो उच्च गुणवत्ता से फिर स्कैन करें।
2) सही OCR भाषा और लेआउट चुनें
- भाषा: दस्तावेज़ के अनुसार (हिंदी/अंग्रेज़ी/पारंपरिक चीनी/जापानी…); मिश्रित भाषा में सभी सम्बंधित भाषाएँ चुनें।
- लेआउट: टेबल‑सेंट्रिक स्टेटमेंट में टेबल संरचना रखें; बहुत जटिल लेआउट हो तो पहले टेक्स्ट में बदलकर Excel में क्लीन‑अप करें।
3) जटिल स्कैन के लिए स्थिर रास्ता
- भारी वेक्टर/व्यस्त बैकग्राउंड OCR को बिगाड़ते हैं?
रैस्टराइज़ PDF → शार्प इमेज में बदलें, फिर OCR करें। - आउटपुट बहुत बड़ा है?
PDF कंप्रेस → ईमेल/अपलोड आसान होगा।
फ़ील्ड और फ़ॉर्मैट — आम समस्याएँ
प्र1: अमाउंट/तारीखें गलत कॉलम में या मिसअलाइंड?
उ: स्कैन की जगह नैटिव ई‑स्टेटमेंट (सेलेक्टेबल टेक्स्ट) को प्राथमिकता दें; पेज क्रम/दिशा ठीक करें और ब्लैक/व्हाइट से कॉन्ट्रास्ट बढ़ाएँ, फिर OCR करें।
प्र2: चीनी हेडर/मुद्रा प्रतीक गड़बड़ दिखते हैं?
उ: OCR में चीनी भाषा टिक होना चाहिए। एम्बेडेड फ़ॉन्ट समस्या दे रहे हों तो रैस्टराइज़ कर OCR करें, या टेक्स्ट एक्सपोर्ट कर Excel में हेडर री‑मैप करें।
प्र3: कई स्टेटमेंट्स को एक Excel में कैसे जोड़ें?
उ: कई PDF एक साथ अपलोड करें; या पहले PDF मर्ज कर लें, फिर Excel में बदलें ताकि हेडर/कॉलम ऑर्डर एक‑सा रहे।
प्र4: मुझे सिर्फ पिछले 3 महीनों का डेटा चाहिए?
उ: पेज स्प्लिट/एक्सट्रैक्ट कर ज़रूरी रेंज रखें, फिर OCR/कन्वर्ट करें ताकि क्लीन‑अप कम हो।
गोपनीयता और अनुपालन — गंभीरता से लें
- संवेदनशील निजी/लेन‑देन डेटा के लिए उचित प्राधिकरण ज़रूरी है। प्रोसेसिंग के लिए स्थानीय/विश्वसनीय एन्वायरनमेंट प्राथमिकता दें।
- सिर्फ़ ज़रूरी चीज़ें रखें या रिडैक्ट करें: Excel एक्सपोर्ट के बाद कार्ड नंबर/नोट्स हटाएँ या केवल आवश्यक कॉलम (तारीख/विवरण/आवक/जावक/बैलेंस) रखें।
- बाहरी भेजने से पहले, ज़रूरत हो तो रीड‑ओनली सुरक्षा जोड़ें:
एन्क्रिप्शन/परमिशन।
सुझाए गए वर्कफ़्लो
- ई‑स्टेटमेंट (सेलेक्टेबल टेक्स्ट) → Excel में बदलें → फ़ील्ड जाँचें / पिवट
- स्कैन → ऑर्गनाइज़ → ब्लैक/व्हाइट → OCR से Excel → क्लीन‑अप और वैलिडेशन
- कई स्टेटमेंट → मर्ज → Excel → कॉलम‑नेम/फ़ॉर्मैट एक‑सा करें