Muitos PDFs são, na verdade, imagens — por exemplo, fotografias de documentos em papel, digitalizações de impressos ou PDFs compostos por imagens. Nesse tipo de ficheiro, o texto não pode ser seleccionado, pesquisado ou copiado. É necessário OCR (Reconhecimento Óptico de Caracteres) para reconhecer os caracteres na imagem e convertê‑los em texto real.
Precisa mesmo de OCR?
- Abra o PDF no navegador/leitor e tente seleccionar o texto: se conseguir realçar palavras, é um “PDF de texto”. Se a selecção for por blocos ou não funcionar, provavelmente é um “PDF de imagem/digitalização”.
- Se o “texto” se mantém nítido ao ampliar mas não é editável, pode ser vectorial em vez de texto. Ainda assim pode executar OCR para o tornar editável/pesquisável.
Início rápido: OCR online
Para o caminho mais simples, utilize:
OCR (tornar PDF pesquisável)Qual saída devo escolher?
- Manter o layout e só precisar de pesquisa/cópia: escolha “PDF pesquisável” (camada de texto sobre a imagem original).
- Precisa de edição profunda: PDF para Word ou PDF para Texto.
Passos-chave para melhorar a precisão
1) Pré‑processamento: orientação, ordem e ruído
Antes do reconhecimento, organize as páginas para melhorar significativamente a precisão:
-
Orientação/ordem: Organizar Páginas para rodar em lote páginas horizontais, reordenar por arrastar e eliminar páginas em branco/publicidade.
-
Preto e branco/Escala de cinzentos (ideal para documentos monocromáticos): Preto e Branco / Cinzentos melhora o contraste e reduz o ruído de cor, ajudando o OCR e a compressão.
-
Rasterizar (quando conteúdo vectorial/CAD complexo confunde o OCR): Rasterizar PDF vectorial converte vectores em bitmap para reduzir interferências.
Resolução e nitidez
- Recomendado: ~300 DPI para documentos de texto; para tipos pequenos/baixa qualidade de impressão, 400–600 DPI.
- Evite compressão excessiva/desfocagem: demasiado ruído/blur provoca erros de reconhecimento.
2) Línguas e layout
- Ajuste as línguas de OCR ao conteúdo (pt/en/zh/ja/ko/zh‑Hant, etc.). Para conteúdo misto, seleccione todas as relevantes.
- Layouts complexos (multicoluna, tabelas, notas, vertical) reduzem a precisão; considere zonar a página e reconhecer em separado, ou exportar para Word e ajustar manualmente.
3) Escolha o formato de saída certo
- PDF pesquisável: ideal para arquivo/pesquisa/anotações; mantém o aspecto, mas torna o texto pesquisável/copiável.
- Word: melhor para edição profunda; layouts complexos podem exigir correcções manuais.
- Texto simples: o mais leve; fácil de processar, sem layout.
Fluxos típicos
Digitalizações de texto (contratos/apontamentos/relatórios)
- Organize páginas: Organizar → rodar/reordenar/remover branco.
- Opcional preto e branco/cinzentos para clareza: Preto e Branco / Cinzentos.
- OCR: OCR (escolha as línguas correctas).
- Ficheiro grande? Use: Comprimir PDF.
Mistura texto + imagem (páginas a cores)
- Corrija primeiro orientação/ordem; evite PB agressivo para preservar detalhes.
- Execute OCR; se o tamanho importar, comprima depois (prefira “forte/MRC” para documentos a cores).
Conteúdo CAD/vectorial a causar problemas
- Rasterize: Rasterizar PDF
- Opcional: PB para maior contraste
- Execute OCR novamente
FAQ
P: Demasiados erros de reconhecimento?
R: Melhore nitidez/contraste; verifique línguas; tente PB/cinzentos; para multicoluna/tabelas, exporte para Word e corrija manualmente.
P: Reconhecimento de tabelas fraco?
R: Para tabelas complexas, experimente PDF para Excel para extracção estruturada, ou ajuste manual pós‑OCR.
P: Ficheiro demasiado grande para enviar?
R: Após OCR, use Comprimir PDF. Para texto monocromático, PB primeiro e depois comprimir.
P: Documento sensível — OCR online é seguro?
R: Prefira processamento local ou serviços de confiança. Para partilhar, “exporte apenas as páginas necessárias” ou crie uma cópia achatada via impressão virtual.
P: PDF com restrições de edição/cópia — como fazer OCR?
R: Se tiver permissão legal, primeiro Desbloquear PDF e depois executar OCR.
Dicas
- Ordem recomendada: “organizar → OCR → comprimir”.
- Conteúdo pt/en misto? Active ambas as línguas.
- Muitas páginas com orientação errada? Rode em lote; ordem correcta facilita pesquisa/estruturação.
- “Fusão multi‑fonte”: use Organizar Páginas para uniformizar ordem; combine com PB e Compressão para equilibrar clareza e tamanho.
Ligações rápidas de ferramentas
OCR
Torne as digitalizações pesquisáveis; suporte multi‑língua.
PDF para Word
Exporte para documento editável para edições profundas.
PDF para Texto
Extraia texto simples — o arquivo mais leve.
Preto e Branco / Cinzentos
Aumente o contraste e reduza o ruído para ajudar o OCR.
Rasterizar PDF
Converta vector/CAD em bitmap para reduzir interferências.
Comprimir PDF
Reduza o tamanho mantendo a legibilidade.