Nozioni di base sui PDF
Prima di comprimere un PDF, è fondamentale comprendere la struttura di base dei file PDF e determinare lo scopo della compressione, che ci aiuterà a scegliere la strategia di compressione più appropriata.
Diversi tipi di PDF richiedono diversi metodi di compressione
Scansioni di testo in bianco e nero: L'algoritmo di compressione JBIG2 può ridurre le dimensioni del file del 95-98% mantenendo il testo chiaro e leggibile
Scansioni di testo a colori: La tecnologia di compressione MRC può ridurre le dimensioni del file del 70-85% preservando i colori
PDF basati su testo: Il contenuto testuale nativo è già altamente ottimizzato; la compressione si ottiene principalmente ottimizzando le immagini incorporate, riducendo tipicamente le dimensioni del file del 10-30%
Documenti grafici vettoriali: Come i disegni CAD, possono essere compressi rasterizzando in formato bitmap, quindi applicando codifica in bianco e nero o scala di grigi, riducendo le dimensioni del file del 60-80%
Scegliere il metodo di compressione giusto è la chiave per garantire sia la riduzione delle dimensioni del file che la conservazione della qualità del documento.
Differenza tra PDF basati su testo e PDF basati su immagini
I file PDF contengono vari elementi, principalmente testo, immagini e grafica vettoriale. A volte, un contenuto che sembra essere testo potrebbe in realtà essere un'immagine o una grafica vettoriale.
Consigli rapidi per identificare i tipi di PDF
Utilizza il browser Chrome o Edge per aprire il PDF; il contenuto che può essere selezionato e evidenziato è costituito da elementi di testo effettivi.
PDF basati su testo: Il contenuto è costituito da elementi di testo effettivi che possono essere selezionati e ricercati
PDF basati su immagini: Il contenuto esiste come immagini, come documenti scansionati o testo presentato come immagini/vettori
Elementi PDF adatti alla compressione
Diversi elementi nei PDF hanno potenziale di compressione variabile:
- Elementi di testo: Il formato PDF ha già compresso questi inizialmente, con spazio di compressione aggiuntivo limitato (tipicamente solo 5-10% di riduzione)
- Oggetti ripetuti, allegati e font: La maggior parte degli strumenti di compressione può gestirli efficacemente, ma lo spazio di compressione è limitato (generalmente 10-20% di riduzione)
- Immagini e vettori: Oggetti centrali per la compressione PDF, offrendo il maggiore potenziale di compressione (comunemente 50-90% di riduzione del volume)
Strategie di compressione
Compressione di PDF basati su testo
Per i PDF che sono principalmente testo:
- Pulire dati ridondanti: Rimuovere commenti, campi modulo, oggetti ripetuti
- Ottimizzazione dei font: Utilizzare subset di font o font standard
- Regolazione della qualità delle immagini: Ridurre appropriatamente la qualità delle immagini nel documento
Strumento consigliato: Strumento di compressione PDF
Nota che i PDF basati su testo sono solitamente già ottimizzati durante la creazione, con spazio di compressione aggiuntivo proveniente principalmente da immagini ed elementi vettoriali nel documento.
Compressione di grafica vettoriale
La grafica vettoriale rimane nitida anche quando ingrandita ed è essenzialmente una serie di istruzioni di dati che descrivono la grafica.
I disegni CAD sono esempi tipici contenenti grandi quantità di vettori. Sebbene i vettori stessi siano difficili da comprimere, una compressione significativa può essere ottenuta convertendoli in bitmap (specialmente immagini in bianco e nero). La conversione in bitmap in bianco e nero tipicamente riduce il file originale del 60-85%, mentre la conversione in scala di grigi può ridurlo del 50-70%.
Passaggi operativi:
-
Rasterizzare i disegni CAD in bitmap
Rasterizza PDF -
Convertire le bitmap in immagini in bianco e nero (applicando l'algoritmo JBIG2)
PDF in bianco e nero
Considerazioni sulla conversione di disegni CAD
I vettori complessi nei PDF possono influenzare i risultati della conversione di formato.
I PDF contenenti disegni CAD sono soggetti a errori durante la conversione in formati Office perché il gran numero di vettori nei disegni CAD interferisce con il processo di conversione.
La soluzione è prima rasterizzare le pagine contenenti CAD in immagini, quindi eseguire la conversione di formato.
Tecniche di compressione delle immagini
Il PDF supporta molteplici algoritmi di compressione delle immagini; scegli l'algoritmo appropriato in base a diversi scenari.
Compressione di documenti in bianco e nero
Adatta per documenti che possono essere presentati in bianco e nero (come scansioni di testo puro), l'algoritmo JBIG2 non memorizza informazioni sui colori e può raggiungere tassi di compressione superiori al 98%.
Ideale per: Scansioni di testo, disegni al tratto
Rapporto di compressione: 2-5% delle dimensioni originali del file (riduzione del 95-98%)
Passaggi di elaborazione:
Conversione in bianco e nero Elaborazione della compressioneCompressione di documenti in scala di grigi
Adatta per documenti utilizzati principalmente per la stampa in bianco e nero o in scala di grigi, la compressione si ottiene abbandonando le informazioni sui colori.
Ideale per: Documenti per la stampa, contenuti che non necessitano di preservare i colori
Rapporto di compressione: 15-30% delle dimensioni originali del file (riduzione del 70-85%)
Passaggi di elaborazione:
Conversione in scala di grigi Elaborazione della compressioneCompressione di documenti a colori
Per i documenti digitali che devono preservare i colori, la tecnologia Mixed Raster Content (MRC) è la scelta migliore. MRC elabora le immagini dividendole in tre strati:
- Strato di primo piano: Contiene testo e linee, elaborati ad alta risoluzione
- Strato di sfondo: Contiene foto o sfondi delle immagini, elaborati a risoluzione inferiore
- Strato di maschera: Definisce le aree di confine tra primo piano e sfondo
MRC semplifica le informazioni dell'immagine unendo aree di pixel simili, particolarmente adatto per le scansioni a colori, riducendo significativamente le dimensioni del file mantenendo la chiarezza. Rispetto ai metodi di compressione tradizionali, la tecnologia MRC tipicamente produce risultati di compressione del 30-50% migliori per i documenti a colori.
Ideale per: Scansioni a colori, documenti misti contenenti testo e immagini
Rapporto di compressione: 15-40% delle dimensioni originali del file (riduzione del 60-85%)
Strumento consigliato: Compressione potente (Seleziona il livello "Compressione potente" per abilitare la tecnologia MRC)
Confronto degli effetti di compressione
La seguente tabella riassume gli effetti previsti di vari metodi di compressione per diversi tipi di documenti:
Tipo di documento | Metodo di compressione consigliato | Rapporto di compressione previsto | Impatto sulla qualità | Scenari applicabili |
---|---|---|---|---|
PDF di solo testo | Compressione standard | 90-95% delle dimensioni originali | Quasi nessun impatto | Documenti elettronici contenenti principalmente testo |
PDF di testo con poche immagini | Compressione standard | 70-90% delle dimensioni originali | Impatto lieve | Rapporti, articoli |
Scansioni di testo in bianco e nero | Algoritmo JBIG2 | 2-5% delle dimensioni originali | I bordi del testo possono essere leggermente sfocati | Documenti scansionati, contratti |
Documenti in scala di grigi | Conversione in scala di grigi + compressione | 15-30% delle dimensioni originali | Perdita di informazioni sul colore | Documenti per la stampa |
Documenti scansionati a colori | Tecnologia MRC | 15-40% delle dimensioni originali | Leggera perdita di dettaglio | Riviste scansionate, rapporti a colori |
Disegni CAD | Rasterizzazione + conversione in bianco e nero | 15-40% delle dimensioni originali | Perdita delle proprietà vettoriali, non modificabile | Disegni tecnici solo per visualizzazione |
PDF con principalmente foto | Compressione standard delle immagini | 30-60% delle dimensioni originali | Dipende dal livello di compressione | Collezioni di foto, cataloghi di prodotti |
Scegliere la soluzione migliore
In base alle caratteristiche e allo scopo del documento PDF, segui questo flusso decisionale per scegliere la soluzione migliore:
- Documenti contenenti principalmente testo: Utilizza la compressione standard, regola manualmente la risoluzione dell'immagine e il metodo di compressione se necessario
- Documenti contenenti numerosi vettori CAD: Prima rasterizza le pagine vettoriali, poi converti in bianco e nero o scala di grigi
- Documenti scansionati in bianco e nero: Applica l'algoritmo JBIG2
- Documenti per stampa in scala di grigi: Converti in immagini in scala di grigi
- Documenti che richiedono la conservazione del colore: Utilizza la tecnologia MRC (compressione potente)
Considerazioni sulla compressione
Avviso importante sui rischi
Compromesso tra compressione e qualità: Tassi di compressione più elevati generalmente significano qualità dell'immagine inferiore; trova un equilibrio tra dimensioni del file e qualità
Backup dei file originali: È consigliabile conservare i file originali prima di applicare tassi di compressione elevati
Scegli la strategia in base allo scopo: Seleziona diverse strategie di compressione in base allo scopo finale del documento (lettura a schermo, stampa o archiviazione)
Riepilogo
La compressione PDF è un'arte di equilibrio, che richiede la selezione del migliore metodo di compressione basato sul tipo di documento e sullo scopo. Comprendendo la composizione di base dei PDF e le caratteristiche dei diversi algoritmi di compressione, possiamo massimizzare la riduzione delle dimensioni del file mantenendo un'adeguata chiarezza.
Strategie consigliate:
- PDF basati su testo: Utilizza la compressione standard
- Scansioni in bianco e nero: Applica l'algoritmo JBIG2
- Documenti a colori importanti: Utilizza la tecnologia MRC
Strumenti pratici
Strumento di rasterizzazione vettori PDF
Converti grafica vettoriale complessa in formato bitmap, risolvendo problemi di conversione CAD
Strumento di conversione PDF in bianco e nero/scala di grigi
Converti PDF a colori in formato bianco e nero o scala di grigi per ridurre le dimensioni del file
Strumento di compressione intelligente PDF
Rileva automaticamente il tipo di documento e applica il miglior algoritmo di compressione