Apabila orang kata “PDF ini tak boleh diedit”, punca paling biasa ialah: ia nampak seperti teks, tetapi sebenarnya setiap halaman ialah imej (imbasan, foto telefon, atau PDF daripada tangkapan skrin). Untuk jadikan ia boleh diedit dalam Word:
- Kemas halaman (orientasi/urutan/bingkai/noise)
- Jalankan OCR jika perlu (teks dalam imej → teks sebenar)
- Eksport ke Word dan semak bahagian kritikal
Ujian 10 saat: perlu OCR?
- Boleh pilih teks dan Ctrl+F boleh cari: biasanya tak perlu OCR — terus tukar ke Word.
- Tak boleh pilih teks (atau pilih berblok) dan Ctrl+F tak jumpa: kemungkinan PDF imbas/imej — aktifkan OCR.
- Pengecualian: sesetengah PDF gunakan “teks” sebagai bentuk vektor (tajam tetapi tidak boleh dicari). OCR masih disyorkan.
Pilih hasil yang betul: “boleh diedit” atau “boleh dicari”?
| Keperluan | Output | Alat |
|---|---|---|
| Edit teks & susun atur | Word (.docx) | PDF ke Word |
| Kekalkan rupa, boleh cari/salin | PDF boleh dicari (lapisan teks) | OCR (Searchable PDF) |
| Hanya teks | Teks | PDF ke teks |
Aliran kerja disyorkan
Urutan stabil: jelas → pengecaman → mampat
Repair (opsyen) → Organize → Crop → Hitam/Putih atau kelabu (opsyen) → OCR/Word → Compress (jika perlu).
Mampat sebelum OCR biasanya menurunkan ketepatan.
Perangkap biasa dan alternatif yang boleh diharap
1) Banyak ralat OCR: semak kualiti dan bahasa
Punca paling biasa:
- bahasa OCR salah
- sumber kabur/berbayang/berkilat
- tiada pra‑proses (bingkai/latar tidak dibuang)
Cuba urutan ini: Potong → (jika perlu) Hitam‑putih → jalankan OCR semula dengan bahasa yang betul.
2) Jadual/kolum rosak di Word: asingkan matlamat
Untuk dokumen bertabular, biasanya lebih stabil:
PDF ke ExcelJika hanya perlukan teks:
PDF ke teks3) “Nampak tajam tapi tak boleh cari”: vektor/lapisan kompleks
Ada PDF yang nampak seperti teks, tetapi sebenarnya vektor. OCR masih masuk akal, terutamanya jika sasaran ialah Word.
4) Kebenaran/sekatan: buka kunci hanya jika dibenarkan
Buka kunci PDFPenting
Gunakan buka kunci hanya jika anda ada kebenaran (akses sah / kata laluan diketahui). Alat ini tidak memecahkan kata laluan yang tidak diketahui.
Kombinasi bernilai: edit di Word, hantar sebagai PDF
- PDF ke Word → (edit) → Word ke PDF
- Penghantaran (jika perlu):
- watermark: Tambah watermark
- perlindungan/kata laluan: Lindungi PDF
- saiz: Mampatkan PDF (biasanya terakhir)
FAQ
Kenapa masih banyak ralat selepas OCR?
Biasanya kerana:
- bahasa OCR tidak tepat
- sumber kabur / ada bayang / glare
- tiada pra‑proses: Crop + Hitam‑putih
Kalau saya cuma perlukan teks (tak kisah susun atur)?
Guna PDF ke teks untuk hasil yang lebih stabil.
Normal ke susun atur Word berbeza daripada PDF asal?
Ya. Imbasan → Word ialah “recognize + reflow”, jadi layout kompleks jarang sama 100%.
Senarai semak ringkas selepas penukaran
- jumlah / tarikh / ID / nombor kontrak
- kolum jadual tersasar (guna Excel jika perlu)
- header/footer/nombor halaman hilang
- baris/klausa tertinggal (biasa pada foto)
Alat berkaitan
PDF ke Word
Tukar kepada Word boleh diedit (aktifkan OCR untuk imbasan).
OCR (Searchable PDF)
Jadikan PDF imbasan boleh dicari dahulu.
Crop PDF
Buang bingkai/latar untuk OCR lebih baik.
B/W / kelabu
Tingkatkan kontras, kurangkan noise untuk dokumen teks.
Repair PDF
Baiki PDF rosak sebelum ditukar.
PDF ke Excel
Lebih stabil untuk jadual dan penyata.
PDF ke teks
Ekstrak teks sahaja bila format tidak penting.
Word ke PDF
Selepas edit, tukar semula ke PDF.
