หลายธนาคาร ผู้ออกบัตร และแพลตฟอร์มชำระเงินให้สเตทเมนต์เป็น PDF การแปลงเป็น Excel แบบมีโครงสร้างช่วยให้ง่ายต่อการกระทบยอด บัญชี ภาษี หรือวิเคราะห์ความเสี่ยง บทความนี้ให้เวิร์กโฟลว์ที่ทำซ้ำได้: เริ่มเร็ว → แม่นขึ้น → รองรับและทำแบบแบตช์
เริ่มเร็ว: 3 ขั้นตอน
- เปิด PDF เป็น Excel
- อัปโหลดไฟล์ PDF สเตทเมนต์ (รองรับหลายหน้า/หลายไฟล์)
- ถ้าเป็นสแกน/รูปภาพ ให้เปิด OCR แล้วแปลงและดาวน์โหลด
.xlsx
ไฟล์ไหนแปลงได้เสถียรที่สุด?
- e‑statement ต้นฉบับ (ข้อความเลือก/ค้นหาได้): เสถียรที่สุด; โครงสร้างตารางคงดีที่สุด
- สแกน/รูปภาพ (เลือกข้อความไม่ได้): เปิด OCR; ปรับความคมชัดก่อนตามเหมาะสม
การตั้งค่าสำคัญเพื่อความแม่นยำ
1) จัดหน้าให้เรียบร้อยก่อนรู้จำ
-
แก้ทิศทาง/ลำดับ:
จัดหน้า PDF → หมุนหน้าตะแคงแบบแบตช์ ลากเพื่อจัดลำดับ ลบหน้าว่าง/โฆษณา -
ขาว‑ดำ / คอนทราสต์สูง (เอกสารเน้นข้อความ):
ขาว‑ดำ/ระดับเทา → ลดสัญญาณรบกวนสีและเพิ่มความแม่นยำ OCR
ภาพเบลอ? เพิ่มความอ่านง่ายก่อน
OCR อาจสับสน 8/0/6 ในสแกนคุณภาพต่ำ เล็ง ≈300 DPI; จำเป็นให้สแกนใหม่คุณภาพสูงขึ้น
2) เลือกภาษาและเลย์เอาต์ OCR ให้ถูกต้อง
- ภาษา: ให้ตรงกับเอกสาร (ไทย/อังกฤษ/จีนตัวเต็ม/ญี่ปุ่น ฯลฯ); ถ้าภาษาผสม ให้เลือกทั้งหมดที่เกี่ยวข้อง
- เลย์เอาต์: แบบตารางให้คงโครงสร้าง; หากซับซ้อนมาก แปลงเป็นข้อความแล้วค่อยจัดใน Excel
3) เส้นทางเสถียรสำหรับสแกนซับซ้อน
- เวกเตอร์/พื้นหลังรบกวน OCR?
Rasterize PDF → แปลงเป็นภาพคม แล้ว OCR - ผลลัพธ์ใหญ่เกินไป?
บีบอัด PDF → ส่งเมล/อัปโหลดง่ายขึ้น
ช่องข้อมูลและรูปแบบ — ปัญหาพบบ่อย
ถาม: จำนวนเงิน/วันที่ไปคอลัมน์ผิดหรือไม่ตรงกัน?
ตอบ: ให้ใช้ e‑statement ต้นฉบับก่อนสแกน; จัดหน้า/ทิศทางด้วย จัดหน้า และเพิ่มคอนทราสต์ด้วย ขาว‑ดำ ก่อน OCR
ถาม: ส่วนหัวภาษาจีน/สัญลักษณ์สกุลเงินเพี้ยน?
ตอบ: เปิดภาษาจีนใน OCR ถ้า font ฝังมีปัญหา ใช้ Rasterize แล้ว OCR หรือส่งออกเป็นข้อความและแม็พหัวคอลัมน์ใน Excel
ถาม: รวมหลายสเตทเมนต์เป็นไฟล์ Excel เดียวอย่างไร?
ตอบ: อัปโหลดหลาย PDF พร้อมกัน; หรือ รวม PDF ก่อนแล้วค่อยแปลงเป็น Excel เพื่อให้หัว/ลำดับคอลัมน์สอดคล้อง
ถาม: ต้องการเฉพาะ 3 เดือนล่าสุด?
ตอบ: แยก/ดึงหน้า เฉพาะช่วงที่ต้องการ แล้วทำ OCR/แปลง ลดงานเก็บกวาด
ความเป็นส่วนตัวและการปฏิบัติตาม — สำคัญมาก
- ข้อมูลส่วนบุคคล/ธุรกรรมต้องได้รับอนุญาตและดูแลอย่างเหมาะสม ให้ประมวลผลในเครื่องหรือสภาพแวดล้อมที่เชื่อถือได้
- เก็บเฉพาะที่จำเป็นหรือปกปิด: หลังส่งออก Excel ให้ลบเลขบัตร/โน้ต หรือคงไว้เฉพาะ (วันที่/คำอธิบาย/รับเข้า/จ่ายออก/ยอดคงเหลือ)
- ก่อนส่งภายนอก อาจเพิ่มโหมดอ่านอย่างเดียว:
การเข้ารหัส/สิทธิ์