เวลาบอกว่า “PDF แก้ไม่ได้” สาเหตุที่พบบ่อยคือไฟล์ดูเหมือนตัวอักษร แต่จริง ๆ แล้วเป็นรูปภาพในแต่ละหน้า (สแกน/รูปจากมือถือ/ทำจากภาพหน้าจอ) ถ้าต้องการให้แก้ไขได้ใน Word แนวทางหลักคือ:
- จัดหน้าให้เรียบร้อย (หมุน/เรียง/ขอบ/สัญญาณรบกวน)
- ทำ OCR เมื่อจำเป็น (ตัวอักษรในรูป → ข้อความจริง)
- ส่งออกเป็น Word และตรวจจุดสำคัญ
เช็ก 10 วินาที: ต้องใช้ OCR ไหม?
- เลือกข้อความได้ และ Ctrl+F ค้นหาได้: ส่วนใหญ่ไม่ต้อง OCR — แปลงเป็น Word ได้เลย
- เลือกข้อความไม่ได้/เลือกได้เป็นบล็อก และ Ctrl+F หาไม่เจอ: น่าจะเป็น PDF สแกน/รูป — เปิด OCR
เลือกเป้าหมายให้ถูก: “แก้ไขได้” หรือ “ค้นหาได้”?
| เป้าหมาย | ผลลัพธ์ | เครื่องมือ |
|---|---|---|
| แก้เนื้อหา/จัดรูปแบบ | Word (.docx) | PDF เป็น Word |
| คงหน้าตาเดิม แต่ค้นหา/คัดลอกได้ | PDF ค้นหาได้ | OCR (PDF ค้นหาได้) |
| เอาแค่ข้อความ | ข้อความ | PDF เป็นข้อความ |
เวิร์กโฟลว์ที่แนะนำ
ลำดับที่เสถียร: ชัด → OCR → บีบอัด
Repair (ทางเลือก) → Organize → Crop → ขาวดำ/เทา (ทางเลือก) → OCR/Word → Compress (ถ้าจำเป็น)
บีบอัดก่อน OCR มักลดความแม่นยำ
จุดที่มักพลาด และทางเลือกที่ไว้ใจได้
1) OCR ผิดเยอะ: เช็กภาษาและคุณภาพต้นฉบับก่อน
สาเหตุที่พบบ่อย:
- เลือกภาษา OCR ไม่ตรงกับเอกสาร
- ต้นฉบับเบลอ มีเงา/สะท้อนแสง
- ยังไม่ได้ครอปขอบ/พื้นหลัง ทำให้มี noise เยอะ
ลองตามลำดับนี้: ครอป → (ถ้าจำเป็น) ขาวดำ → รัน OCR ใหม่ด้วยภาษาที่ถูกต้อง
2) ตาราง/คอลัมน์เพี้ยนใน Word: แยกเป้าหมาย
เอกสารที่เน้นตาราง (เช่น statement/รายการ) มักเหมาะกว่า:
PDF เป็น Excelถ้าต้องการแค่ข้อความ:
PDF เป็นข้อความ3) “คมมากแต่ค้นหาไม่ได้”: เวกเตอร์/เลเยอร์ซับซ้อน
บางไฟล์ดูเหมือนมีตัวอักษร แต่จริง ๆ เป็นเวกเตอร์หรือเลเยอร์พิเศษ ทำให้ค้นหาไม่ได้ ในกรณีนี้ OCR ยังเป็นทางเลือกที่ใช้งานได้ โดยเฉพาะถ้าต้องการ Word
4) สิทธิ์/การจำกัดการใช้งาน: ปลดล็อกเฉพาะเมื่อได้รับอนุญาต
ปลดล็อก PDFสำคัญ
ใช้การปลดล็อกเฉพาะเมื่อมีสิทธิ์ (เข้าถึงได้โดยชอบ / รหัสผ่านที่ทราบ) เครื่องมือนี้ไม่ทำการ “แคร็ก” รหัสผ่านที่ไม่รู้
คอมโบที่คุ้ม: แก้ใน Word แล้วส่งเป็น PDF
- PDF เป็น Word → (แก้ใน Word) → Word เป็น PDF
- ส่งงาน/ป้องกัน (ถ้าจำเป็น):
- ใส่ลายน้ำ: ใส่ลายน้ำ
- ตั้งรหัส/จำกัดการคัดลอก: ป้องกัน PDF
- ลดขนาดไฟล์: บีบอัด PDF (มักทำท้ายสุด)
ลำดับที่ใช้บ่อย
- โดยทั่วไป: กลับเป็น PDF → ลายน้ำ (ทางเลือก) → ป้องกัน (ทางเลือก) → บีบอัด (ทางเลือก, ท้ายสุด)
- ถ้าต้องการ “ดูอย่างเดียว” ที่เข้มขึ้น: ก่อนป้องกัน เพิ่มขั้นตอน “flatten”: Flatten PDF หรือ Rasterize PDF (แลกกับ: ตัวอักษรจะกลายเป็นรูป; ไฟล์อาจใหญ่ขึ้น)
คำถามที่พบบ่อย (FAQ)
ทำไมทำ OCR แล้วก็ยังผิดเยอะ?
สาเหตุที่พบบ่อย:
- เลือกภาษา OCR ไม่ตรงกับเอกสาร
- ไฟล์ต้นฉบับเบลอ/มีเงา/สะท้อนแสง
- ไม่ได้ทำ pre‑process: ครอป และ (ถ้าจำเป็น) ขาวดำ
ตารางใน Word เพี้ยน/คอลัมน์เลื่อน ควรทำยังไง?
ถ้าเอกสารเน้นตาราง ให้ลอง PDF เป็น Excel ก่อน แล้วค่อยคัดลอกไป Word ตามต้องการ
ถ้าอยากได้ “ข้อความอย่างเดียว” ไม่สนใจรูปแบบ?
ใช้ PDF เป็นข้อความ มักเสถียรกว่า
เช็กลิสต์หลังแปลง
- จำนวนเงิน/วันที่/เลขบัตร/เลขสัญญา (ผิดง่ายสุด)
- ตารางเลื่อน/คอลัมน์ไม่ตรง (ใช้ Excel แทนถ้าจำเป็น)
- header/footer/เลขหน้า หาย
- บรรทัด/เงื่อนไขหาย (พบบ่อยกับรูปถ่าย)
เครื่องมือที่เกี่ยวข้อง
PDF เป็น Word
ส่งออกเป็น Word ที่แก้ไขได้ (เปิด OCR สำหรับสแกน)
OCR (PDF ค้นหาได้)
ทำให้สแกนค้นหาได้ก่อน แล้วค่อยแปลง/ดึงข้อความ
ครอป PDF
ตัดขอบ/พื้นหลังเพื่อเพิ่มความแม่นยำของ OCR
ขาวดำ/เทา
เพิ่มคอนทราสต์ ลด noise สำหรับเอกสารตัวอักษร
ซ่อม PDF
แก้ไฟล์เสีย/อัปโหลดล้มเหลวก่อนแปลง
PDF เป็น Excel
เหมาะกับเอกสารที่เป็นตารางเป็นหลัก
PDF เป็นข้อความ
ดึงข้อความออกมาเป็นข้อความล้วนเพื่อค้นหา/แปล/ใช้งานต่อ
Word เป็น PDF
แก้ไขเสร็จแล้วแปลงกลับเป็น PDF เพื่อส่งงาน/เก็บ
