بانکها، صادرکنندگان کارت و پلتفرمهای پرداخت معمولاً صورتحسابها را به صورت PDF ارائه میکنند. تبدیل آنها به اکسل ساختاریافته، تطبیق، حسابداری، مالیات و تحلیل ریسک را سادهتر میکند. این راهنما مسیرهای عملیِ قابل تکرار از شروع سریع → دقت بالاتر → انطباق و پردازش دستهای را ارائه میدهد.
شروع سریع: تبدیل در ۳ گام
- PDF به اکسل را باز کنید
- PDF صورتحساب(ها) را بارگذاری کنید (پشتیبانی از چندصفحهای و چندفایلی)
- اگر اسکن/عکس است، OCR را فعال کنید؛ سپس تبدیل و
.xlsx
را دانلود کنید
کدام فایلها پایدارتر تبدیل میشوند؟
- صورتحسابهای الکترونیکی بومی (متن قابل انتخاب/جستجو): پایدارترین؛ بهترین حفظ ساختار جدول.
- اسکن/عکس (متن غیرقابل انتخاب): OCR را فعال کنید؛ در صورت نیاز ابتدا وضوح را بهبود دهید.
تنظیمات کلیدی برای بیشینهسازی دقت
1) صفحهها را پیش از تشخیص مرتب کنید
-
اصلاح جهت/ترتیب:
سازماندهی صفحات PDF → چرخش دستهای صفحات افقی، کشیدن برای مرتبسازی، حذف صفحات خالی/تبلیغاتی. -
سیاهوسفید / کنتراست بالاتر (برای صورتحسابهای متنی):
سیاهوسفید / خاکستری → نویز رنگ را میکاهد و دقت OCR را بهبود میدهد.
تصویر تار؟ ابتدا خوانایی را بهبود دهید
در اسکنهای کمکیفیت، OCR ممکن است 8/0/6 را اشتباه بگیرد. به ≈۳۰۰ DPI هدفگذاری کنید؛ در صورت لزوم با کیفیت بالاتر دوباره اسکن کنید.
2) زبان و چیدمان صحیح OCR را برگزینید
- زبان: مطابق سند (فارسی/انگلیسی/چینی سنتی/ژاپنی و...)؛ در چندزبانه، همه زبانهای مرتبط را انتخاب کنید.
- چیدمان: برای بیانیههای جدولمحور، ساختار جدول را نگه دارید؛ اگر بسیار پیچیده است، ابتدا به متن تبدیل و سپس در اکسل پاکسازی کنید.
3) مسیر پایدار برای اسکنهای پیچیده
- بردارهای تزئینی یا زمینههای شلوغ OCR را مختل میکنند؟
Rasterize PDF → به تصاویر شارپ تبدیل و سپس OCR کنید. - اگر خروجی بزرگ است:
فشردهسازی PDF → ارسال و بارگذاری سادهتر میشود.
فیلدها و قالببندی — مسائل رایج
پ۱: مبالغ/تاریخها در ستون اشتباه یا ناهماهنگاند؟
پاسخ: صورتحسابهای بومیِ متنی را به اسکن ترجیح دهید؛ پیش از OCR با مرتبسازی صفحات و سیاهوسفید کنتراست را افزایش دهید.
پ۲: سرستونهای چینی/نمادهای ارز بههمریختهاند؟
پاسخ: زبان چینی را در OCR فعال کنید. اگر فونتهای توکار مسئلهسازند، Rasterize سپس OCR، یا خروجی متن و نگاشت مجدد سرستونها در اکسل.
پ۳: چند صورتحساب را چگونه در یک اکسل ادغام کنم؟
پاسخ: چند PDF را همزمان بارگذاری کنید؛ یا ابتدا ادغام PDF سپس به اکسل تبدیل تا سرستون/ترتیب ستونها یکدست شود.
پ۴: فقط ۳ ماه اخیر را میخواهم؟
پاسخ: با تقسیم/استخراج صفحات محدوده لازم را نگه دارید، سپس OCR/تبدیل کنید تا پاکسازی کمتر شود.
حریم خصوصی و انطباق — جدی بگیرید
- دادههای حساس شخصی/تراکنشی نیازمند مجوز و رسیدگی مناسباند. پردازش را در محیطهای محلی یا قابل اعتماد انجام دهید.
- فقط موارد ضروری را نگه دارید یا حذف اطلاعات حساس انجام دهید: پس از خروجی اکسل، شماره کارت/یادداشتها را حذف کنید یا فقط ستونهای ضروری (تاریخ/شرح/ورودی/خروجی/مانده) را نگه دارید.
- پیش از ارسال بیرونی، در صورت نیاز حالت فقطخواندنی بیفزایید:
رمزنگاری/مجوزها.
جریانهای پیشنهادی
- صورتحساب بومی (متن قابل انتخاب) → تبدیل به اکسل → بازبینی فیلدها / Pivot
- اسکن → مرتبسازی → سیاهوسفید → OCR به اکسل → پاکسازی و اعتبارسنجی
- چند صورتحساب → ادغام → اکسل → یکسانسازی نام/قالب ستونها
PDF به اکسل
صورتحسابها/فاکتورها را به اکسل قابل ویرایش تبدیل کنید.
OCR (متن قابل جستجو)
برای اسکن/عکس OCR را فعال کنید تا دقت بالاتر رود.
سازماندهی صفحات
چرخش/مرتبسازی/حذف صفحات خالی برای آمادگی OCR.
سیاهوسفید / خاکستری
نویز رنگ را کم و کنتراست متن را برای OCR افزایش دهید.
فشردهسازی PDF
کوچکسازی برای ایمیل/آپلود آسانتر.