PDF escanejat a Word editable: guia completa (OCR i maquetació)
Blog

PDF escanejat a Word editable: guia completa (OCR i maquetació)

Converteix un PDF escanejat/fotografiat en Word editable: test d’OCR en 10 segons, preprocés, errors típics i alternatives fiables.

Català

Quan algú diu “aquest PDF no es pot editar”, sovint és perquè el document sembla text però en realitat són imatges (escaneig, foto del mòbil o PDF fet de captures). Per convertir‑lo en Word editable, el flux bàsic és:

  1. Netejar pàgines (orientació/ordre/marges/soroll)
  2. Fer OCR si cal (text dins d’imatges → text real)
  3. Exportar a Word i revisar camps crítics

Test en 10 segons: necessites OCR?

  • Pots seleccionar text i Ctrl+F troba paraules: normalment no cal OCR — converteix directament a Word.
  • No pots seleccionar text (o selecciona per blocs) i Ctrl+F no troba res: probablement és un PDF escanejat/imatge — activa l’OCR.
  • Excepció: alguns PDFs tenen “text” com a formes vectorials (molt nítid però no cercable). OCR també ajuda.

Tria bé l’objectiu: “editable” o “cercable”?

NecessitatResultat recomanatEina recomanada
Editar frases/paràgrafs i remaquetarWord (.docx)PDF a Word
Mantenir l’aspecte però poder cercar/copiarPDF cercable (capa de text)OCR (PDF cercable)
Només el contingut de textTextPDF a text

Flux recomanat (més fiable)

Ordre més estable: nitidesa → reconeixement → compressió

Suggerit: Reparar (opcional) → Organitzar → Retallar → B/N o grisos (opcional) → OCR/Word → Comprimir (si cal).
Comprimir abans de l’OCR sovint baixa la precisió.

Pas 0 (opcional): si falla, repara primer

Reparar PDF

Pas 1: corregeix orientació i ordre

Organitzar pàgines

Pas 2 (molt recomanat): retalla vores i fons

Retallar PDF

Pas 3 (segons el document): B/N o grisos per augmentar contrast

B/N o escala de grisos

Pas 4: converteix a Word (activa OCR si cal)

PDF a Word

Després, valida ràpid: 2–3 paràgrafs + números clau (imports/dates/IDs).

Problemes típics i solucions

Molts errors: revisa idioma i qualitat

  • Idioma mal triat = causa #1.
  • Font borrosa/ombres: un origen millor ajuda més.
  • Alternativa: RetallarB/N → reconvertir.

Taules/columnes desquadren: separa l’objectiu

Drets/permís: desbloqueja només si tens autorització

Desbloquejar PDF

Nota de compliment

Fes servir el desbloqueig només si tens permís (accés autoritzat / contrasenya coneguda). Aquesta eina no trenca contrasenyes desconegudes.

Combinació d’alt valor: edita a Word, lliura en PDF

En molts casos Word no és el format final. Pensa en dos fluxos:

  1. Edició: PDF a Word → (edites a Word) → Word a PDF
  2. Lliurament (si cal):

Ordre habitual

  • Normal: tornar a PDF → marca d’aigua (opcional) → protecció (opcional) → compressió (opcional, últim).
  • Per a “només lectura” més fort: abans de protegir, afegeix un pas de “flatten”: Flatten PDF o Rasterize PDF (compromís: el text es converteix en imatge; el fitxer pot augmentar).

FAQ

Per què encara hi ha tants errors després de l’OCR?

Sovint per idioma OCR incorrecte o origen de poca qualitat. Comença amb Retallar i tria la llengua correcta.

Les taules queden desalineades a Word. Què faig?

Prova PDF a Excel. Si només necessites text, usa PDF a text.

És normal que el disseny a Word sigui molt diferent?

Sí. Escaneig → Word és “reconeixement + reflow”, i els dissenys complexos rarament queden idèntics. Prioritza l’edició i ajusta manualment el que sigui crític.

Checklist ràpida després de la conversió

  • imports / dates / IDs / números de contracte
  • columnes de taules desplaçades (Excel si cal)
  • capçaleres/peus/números de pàgina absents
  • línies o clàusules que falten (freqüent en fotos)

Eines relacionades