Banyak bank, pengeluar kad dan platform pembayaran menyediakan penyata dalam PDF. Menukarnya kepada Excel berstruktur memudahkan penyesuaian, perakaunan, cukai dan analisis risiko. Panduan ini memberi aliran kerja boleh diulang: mula pantas → ketepatan lebih tinggi → pematuhan & pukal.
Mula pantas: 3 langkah
- Buka PDF ke Excel
- Muat naik PDF penyata (sokong berbilang halaman/berbilang fail)
- Jika imbasan/foto, hidupkan OCR, kemudian tukar dan muat turun
.xlsx
Fail mana paling stabil untuk ditukar?
- e‑penyata asli (teks boleh pilih/cari): paling stabil; struktur jadual terpelihara.
- Imbasan/foto (teks tidak boleh pilih): hidupkan OCR; pertimbang tingkatkan kejelasan dahulu.
Tetapan penting untuk maksimum ketepatan
1) Kemas kini halaman sebelum pengecaman
-
Betulkan orientasi/turutan:
Urus Halaman PDF → putar pukal halaman melintang, seret untuk susun semula, buang kosong/iklan. -
Hitam putih / kontras lebih tinggi (penyata berat teks):
Hitam Putih / Kelabu → kurangkan hingar warna, tingkatkan OCR.
Imej kabur? Tingkatkan kebolehbacaan dahulu
OCR boleh keliru 8/0/6 pada imbasan berkualiti rendah. Sasarkan ≈300 DPI; imbas semula dengan kualiti lebih tinggi jika perlu.
2) Pilih bahasa dan susun atur OCR yang betul
- Bahasa: padankan dokumen (ms/en/zh‑Hant/ja dll.); jika bercampur, pilih semua yang berkaitan.
- Susun atur: untuk penyata berjadual, kekalkan struktur; jika terlalu kompleks, tukar ke teks dahulu dan kemas di Excel.
3) Laluan stabil untuk imbasan kompleks
- Vektor/latarmuka yang ‘sibuk’ mengganggu OCR?
Rasterize PDF → tukar ke imej tajam, kemudian OCR. - Hasil terlalu besar?
Mampatkan PDF → lebih mudah e‑mel/muat naik.