Conceptes bàsics del PDF
Abans de comprimir un PDF, és essencial entendre l'estructura bàsica dels fitxers PDF i definir la finalitat de la compressió. Això ens ajudarà a escollir l'estratègia de compressió més adequada.
Els diferents tipus de PDF requereixen mètodes de compressió diferents
Escaneigs de text en blanc i negre: l'algoritme de compressió JBIG2 pot reduir la mida fins a un 95–98% mantenint el text clar i llegible
Escaneigs de text en color: la tecnologia MRC pot reduir la mida un 70–85% preservant els colors
PDF basats en text: el contingut de text nadiu ja està molt optimitzat; la compressió s'aconsegueix principalment optimitzant les imatges incrustades, habitualment amb una reducció del 10–30%
Documents amb gràfics vectorials: com els plànols CAD, es poden comprimir rasteritzant-los a mapa de bits i aplicant codificació en blanc i negre o en escala de grisos, reduint la mida un 60–80%
Escollir el mètode de compressió adequat és clau per reduir la mida i mantenir la qualitat del document.
Diferència entre PDF de text i PDF basat en imatges
Els fitxers PDF contenen diversos elements, principalment text, imatges i gràfics vectorials. De vegades, allò que sembla text en realitat pot ser una imatge o un gràfic vectorial.
Consells ràpids per identificar el tipus de PDF
Obriu el PDF al navegador Chrome o Edge; el contingut que es pot seleccionar i ressaltar és text real.
PDF basat en text: el contingut consisteix en elements de text reals que es poden seleccionar i cercar
PDF basat en imatges: el contingut existeix com a imatges, com ara documents escanejats o text presentat com a imatges/vector
Elements de PDF adequats per a la compressió
Els diferents elements del PDF tenen un potencial de compressió diferent:
- Elements de text: el format PDF ja els comprimeix inicialment; l'espai addicional de compressió és limitat (normalment 5–10%)
- Objectes repetits, fitxers adjunts i tipografies: la majoria d'eines de compressió els gestionen bé, però el marge és limitat (generalment 10–20%)
- Imatges i vectors: són el nucli de la compressió del PDF i ofereixen el potencial més gran (reduccions de volum del 50–90% habituals)
Estratègies de compressió
Compressió de PDF basat en text
Per a PDF on predomina el text:
- Netegeu dades redundants: elimineu comentaris, camps de formulari i objectes repetits
- Optimització de tipografies: useu fonts amb subest (subset) o fonts estàndard
- Ajust de la qualitat de la imatge: reduïu adequadament la qualitat de les imatges del document
Eina recomanada: Eina de compressió de PDF
Tingueu en compte que els PDF basats en text sovint ja estan optimitzats durant la creació; l'espai addicional de compressió prové principalment de les imatges i els elements vectorials del document.
Compressió de gràfics vectorials
Els gràfics vectorials es mantenen nítids fins i tot en augmentar-los, i bàsicament són instruccions de dades que descriuen gràfics.
Els plànols CAD en són l'exemple típic, amb una gran quantitat de vectors. Tot i que els vectors són difícils de comprimir, es pot aconseguir una reducció significativa convertint-los en mapes de bits (especialment en blanc i negre). La conversió a blanc i negre sol reduir un 60–85% la mida original; a escala de grisos, un 50–70%.
Passos d'operació:
-
Rasteritzar plànols CAD a mapes de bits
Rasteritza PDF -
Convertir mapes de bits a imatges en blanc i negre (aplicant JBIG2)
PDF a blanc i negre
Consideracions de conversió de plànols CAD
Els vectors complexos dels PDF poden afectar el resultat de la conversió de format.
Els PDF amb plànols CAD són propensos a errors en convertir-los a formats d'Office, perquè el gran nombre de vectors interfereix en el procés.
La solució és rasteritzar primer les pàgines amb CAD a imatges i, després, fer la conversió de format.
Tècniques de compressió d'imatges
El PDF admet múltiples algorismes de compressió d'imatges; trieu l'algorisme adequat segons l'escenari.
Compressió de documents en blanc i negre
Adequat per a documents que es poden presentar en blanc i negre (com escaneigs de text pur). L'algoritme JBIG2 no emmagatzema informació de color i pot assolir taxes de compressió superiors al 98%.
Millor per a: escaneigs de text, dibuixos de línies
Relació de compressió: 2–5% de la mida original (reducció del 95–98%)
Passos de processament:
Conversió a blanc i negre Processament de compressióCompressió de documents en escala de grisos
Adequat per a documents orientats a la impressió en blanc i negre o en escala de grisos; la compressió s'aconsegueix renunciant a la informació de color.
Millor per a: documents per a impressió; contingut que no necessita conservar el color
Relació de compressió: 15–30% de la mida original (reducció del 70–85%)
Passos de processament:
Conversió a escala de grisos Processament de compressióCompressió de documents en color
Per a documents digitals on cal preservar els colors, la tecnologia MRC (Mixed Raster Content) és la millor opció. MRC processa les imatges dividint-les en tres capes:
- Capa de primer pla: conté text i línies, processada a alta resolució
- Capa de fons: conté fotografies o fons d'imatge, processada a resolució inferior
- Capa màscara: defineix els límits entre primer pla i fons
MRC simplifica la informació de la imatge fusionant àrees de píxels similars; és especialment adequada per a escaneigs en color, ja que redueix significativament la mida mantenint la nitidesa. En comparació amb mètodes tradicionals, MRC sol oferir un 30–50% més d'eficiència en documents en color.
Millor per a: escaneigs en color; documents mixtos amb text i imatges
Relació de compressió: 15–40% de la mida original (reducció del 60–85%)
Eina recomanada: Compressió potent (seleccioneu el nivell "Compressió potent" per activar la tecnologia MRC)
Comparativa d'efectes de compressió
La taula següent resumeix els efectes esperats de diversos mètodes de compressió segons el tipus de document:
Tipus de document | Mètode de compressió recomanat | Relació de compressió esperada | Impacte en la qualitat | Escenaris aplicables |
---|---|---|---|---|
PDF de text pur | Compressió estàndard | 90–95% de la mida original | Gairebé sense impacte | Documents electrònics principalment de text |
PDF de text amb poques imatges | Compressió estàndard | 70–90% de la mida original | Impacte lleu | Informes, articles |
Escaneigs de text en blanc i negre | Algoritme JBIG2 | 2–5% de la mida original | Les vores del text poden esdevenir lleugerament borroses | Documents escanejats, contractes |
Documents en escala de grisos | Conversió a grisos + compressió | 15–30% de la mida original | Pèrdua d'informació de color | Documents per a impressió |
Documents escanejats en color | Tecnologia MRC | 15–40% de la mida original | Lleugera pèrdua de detall | Revistes escanejades, informes en color |
Plànols CAD | Rasterització + blanc i negre | 15–40% de la mida original | Pèrdua de propietats vectorials, no editable | Plànols d'enginyeria només per a visualització |
PDF principalment amb fotografies | Compressió d'imatge estàndard | 30–60% de la mida original | Depèn del nivell de compressió | Col·leccions de fotos, catàlegs de producte |
Elecció de la millor solució
En funció de les característiques i la finalitat del PDF, seguiu aquest flux de decisió per triar la millor solució:
- Documents principalment de text: useu compressió estàndard; ajusteu manualment la resolució de les imatges i el mètode de compressió si cal
- Documents amb molts vectors CAD: rasteritzeu primer les pàgines vectorials i convertiu després a blanc i negre o grisos
- Documents escanejats en blanc i negre: apliqueu l'algoritme JBIG2
- Documents destinats a impressió en grisos: convertiu a imatges en escala de grisos
- Documents on cal preservar el color: empreu la tecnologia MRC (compressió potent)
Consideracions sobre la compressió
Avís important de risc
Equilibri entre compressió i qualitat: taxes de compressió més altes solen implicar menor qualitat d'imatge; busqueu l'equilibri entre mida i qualitat
Còpia de seguretat: és recomanable conservar els fitxers originals abans d'aplicar compressions elevades
Estratègia segons la finalitat: trieu estratègies diferents segons la destinació del document (lectura en pantalla, impressió o arxiu)
Resum
La compressió de PDF és un art d'equilibri que demana triar el millor mètode segons el tipus i la finalitat del document. Entenent la composició dels PDF i les característiques dels diferents algorismes, podem reduir al màxim la mida mantenint una claredat adequada.
Estratègies recomanades:
- PDF basats en text: utilitzeu compressió estàndard
- Escaneigs en blanc i negre: apliqueu JBIG2
- Documents en color importants: utilitzeu tecnologia MRC
Eines pràctiques
Eina de rasterització de vectors PDF
Converteix gràfics vectorials complexos a mapa de bits, resolent problemes de conversió CAD
Eina de conversió a blanc i negre/grisos
Converteix PDF en color a blanc i negre o a escala de grisos per reduir la mida
Eina de compressió intel·ligent de PDF
Detecta automàticament el tipus de document i aplica l'algorisme de compressió més adient