Основи на PDF
Преди да компресирате PDF, е важно да разберете основната структура на PDF файловете и да определите целта на компресирането, което ще ни помогне да изберем най-подходящата стратегия за компресиране.
Различните видове PDF изискват различни методи на компресиране
Черно-бели сканирания на текст: JBIG2 алгоритъмът за компресиране може да намали размера на файла с 95-98%, като същевременно запазва текста ясен и четлив
Цветни сканирания на текст: MRC технологията за компресиране може да намали размера на файла със 70-85%, като същевременно запазва цветовете
PDF файлове, базирани на текст: Естественото текстово съдържание вече е силно оптимизирано; компресирането се постига главно чрез оптимизиране на вградените изображения, като обикновено намалява размера на файла с 10-30%
Документи с векторна графика: Като например CAD чертежи, могат да бъдат компресирани чрез растеризиране до битмап, след което прилагане на черно-бяло или сиво кодиране, намалявайки размера на файла с 60-80%
Изборът на правилния метод за компресиране е ключът към осигуряването както на намален размер на файла, така и на запазено качество на документа.
Разлика между PDF файлове, базирани на текст и на изображения
PDF файловете съдържат различни елементи, главно текст, изображения и векторни графики. Понякога съдържание, което изглежда като текст, всъщност може да бъде изображение или векторна графика.
Бързи съвети за идентифициране на типовете PDF
Използвайте Chrome или Edge браузър, за да отворите PDF; съдържанието, което може да бъде избрано и маркирано, са действителни текстови елементи.
PDF файлове, базирани на текст: Съдържанието се състои от действителни текстови елементи, които могат да бъдат избрани и търсени
PDF файлове, базирани на изображения: Съдържанието съществува като изображения, като например сканирани документи или текст, представен като изображения/вектори
PDF елементи, подходящи за компресиране
Различните елементи в PDF файловете имат различен потенциал за компресиране:
- Текстови елементи: PDF форматът вече ги е компресирал първоначално, с ограничено допълнително пространство за компресиране (обикновено само 5-10% намаление)
- Повтарящи се обекти, прикачени файлове и шрифтове: Повечето инструменти за компресиране могат да се справят с тях ефективно, но пространството за компресиране е ограничено (обикновено 10-20% намаление)
- Изображения и вектори: Основни обекти за PDF компресиране, предлагащи най-голям потенциал за компресиране (обикновено 50-90% намаление на обема)
Стратегии за компресиране
Компресиране на PDF, базирано на текст
За PDF файлове, които са предимно текст:
- Почистете излишните данни: Премахнете коментари, полета на формуляри, повтарящи се обекти
- Оптимизация на шрифтовете: Използвайте подмножества на шрифтове или стандартни шрифтове
- Регулиране на качеството на изображенията: Подходящо намалете качеството на изображенията в документа
Препоръчан инструмент: Инструмент за компресиране на PDF
Имайте предвид, че PDF файловете, базирани на текст, обикновено вече са оптимизирани по време на създаването им, като допълнителното пространство за компресиране идва главно от изображенията и векторните елементи в документа.
Компресиране на векторни графики
Векторните графики остават ясни дори когато се увеличават и по същество представляват серия от данни, описващи графиките.
CAD чертежите са типични примери, съдържащи голямо количество вектори. Въпреки че самите вектори са трудни за компресиране, значително компресиране може да бъде постигнато чрез конвертирането им в битмапи (особено черно-бели изображения). Конвертирането в черно-бели битмапи обикновено намалява оригиналния файл с 60-85%, докато конвертирането в сиво може да го намали с 50-70%.
Стъпки на операцията:
-
Растеризирайте CAD чертежите в битмапи
Растеризиране на PDF -
Конвертирайте битмапите в черно-бели изображения (прилагане на JBIG2 алгоритъм)
PDF в черно-бяло
Съображения при конвертиране на CAD чертежи
Сложните вектори в PDF файловете могат да повлияят на резултатите от конвертирането на формата.
PDF файловете, съдържащи CAD чертежи, са склонни към грешки при конвертиране в Office формати, защото големият брой вектори в CAD чертежите пречат на процеса на конвертиране.
Решението е първо да се растеризират страниците, съдържащи CAD, в изображения, а след това да се извърши конвертиране на формата.
Техники за компресиране на изображения
PDF поддържа множество алгоритми за компресиране на изображения; изберете подходящия алгоритъм според различните сценарии.
Компресиране на черно-бели документи
Подходящо за документи, които могат да бъдат представени в черно-бяло (като например чисти текстови сканирания), JBIG2 алгоритъмът не съхранява информация за цветовете и може да постигне коефициенти на компресиране над 98%.
Най-добро за: Текстови сканирания, линейни рисунки
Коефициент на компресиране: 2-5% от оригиналния размер на файла (95-98% намаление)
Стъпки на обработка:
Черно-бяло конвертиране Обработка на компресиранеКомпресиране на документи в сиво
Подходящо за документи, предимно използвани за черно-бяло или сиво отпечатване, компресирането се постига чрез изоставяне на информация за цветовете.
Най-добро за: Документи за печат, съдържание, което не се нуждае от запазване на цветовете
Коефициент на компресиране: 15-30% от оригиналния размер на файла (70-85% намаление)
Стъпки на обработка:
Конвертиране в сиво Обработка на компресиранеКомпресиране на цветни документи
За дигитални документи, които трябва да запазят цветовете, технологията за смесено растерно съдържание (MRC) е най-добрият избор. MRC обработва изображенията, като ги разделя на три слоя:
- Преден план: Съдържа текст и линии, обработен с висока резолюция
- Фон: Съдържа снимки или фонове на изображения, обработен с по-ниска резолюция
- Маска: Определя граничните области между предния план и фона
MRC опростява информацията за изображението чрез обединяване на подобни пикселни области, особено подходящ за цветни сканирания, значително намалявайки размера на файла, като същевременно поддържа яснота. В сравнение с традиционните методи за компресиране, MRC технологията обикновено произвежда 30-50% по-добри резултати от компресирането за цветни документи.
Най-добро за: Цветни сканирания, смесени документи, съдържащи текст и изображения
Коефициент на компресиране: 15-40% от оригиналния размер на файла (60-85% намаление)
Препоръчан инструмент: Мощно компресиране (Изберете ниво "Мощно компресиране", за да активирате MRC технологията)
Сравнение на ефекта от компресиране
Следната таблица обобщава очакваните ефекти от различните методи за компресиране за различни типове документи:
Тип документ | Препоръчан метод на компресиране | Очакван коефициент на компресиране | Въздействие върху качеството | Приложими сценарии |
---|---|---|---|---|
Чист текстов PDF | Стандартно компресиране | 90-95% от оригиналния размер | Почти никакво въздействие | Електронни документи, предимно съдържащи текст |
Текстов PDF с малко изображения | Стандартно компресиране | 70-90% от оригиналния размер | Леко въздействие | Доклади, статии |
Черно-бели текстови сканирания | JBIG2 алгоритъм | 2-5% от оригиналния размер | Ръбовете на текста може леко да се замъглят | Сканирани документи, договори |
Документи в сиво | Конвертиране в сиво + компресиране | 15-30% от оригиналния размер | Загуба на информация за цветовете | Документи за печат |
Цветни сканирани документи | MRC технология | 15-40% от оригиналния размер | Леко загуба на детайли | Сканирани списания, цветни доклади |
CAD чертежи | Растеризиране + черно-бяло конвертиране | 15-40% от оригиналния размер | Загуба на векторни свойства, не може да се редактира | Инженерни чертежи само за преглед |
PDF с предимно снимки | Стандартно компресиране на изображения | 30-60% от оригиналния размер | Зависи от нивото на компресиране | Колекции от снимки, продуктови каталози |
Избор на най-доброто решение
Въз основа на характеристиките и целта на PDF документа, следвайте този поток на решение, за да изберете най-доброто решение:
- Документи, съдържащи предимно текст: Използвайте стандартно компресиране, ръчно регулирайте резолюцията на изображението и метода на компресиране, ако е необходимо
- Документи, съдържащи множество CAD вектори: Първо растеризирайте векторните страници, след това конвертирайте в черно-бяло или сиво
- Черно-бели сканирани документи: Приложете JBIG2 алгоритъм
- Документи за сив печат: Конвертирайте в сиви изображения
- Документи, изискващи запазване на цветовете: Използвайте MRC технология (мощно компресиране)
Съображения при компресиране
Важно известие за риск
Баланс между компресиране и качество: По-високите коефициенти на компресиране обикновено означават по-ниско качество на изображението; намерете баланс между размер на файла и качество
Архивирайте оригиналните файлове: Препоръчително е да запазите оригиналните файлове преди прилагане на високи коефициенти на компресиране
Изберете стратегия според целта: Изберете различни стратегии за компресиране според крайната цел на документа (четене на екран, отпечатване или архивиране)
Обобщение
Компресирането на PDF е изкуство на баланса, изискващо избора на най-добрия метод за компресиране въз основа на типа и целта на документа. Разбирайки основния състав на PDF файловете и характеристиките на различните алгоритми за компресиране, можем да максимизираме намаляването на размера на файла, като същевременно запазваме подходяща яснота.
Препоръчани стратегии:
- PDF файлове, базирани на текст: Използвайте стандартно компресиране
- Черно-бели сканирания: Приложете JBIG2 алгоритъм
- Важни цветни документи: Използвайте MRC технология
Практически инструменти
Инструмент за растеризиране на PDF вектори
Конвертирайте сложни векторни графики в битмап формат, решавайки проблеми с CAD конвертирането
Инструмент за конвертиране на PDF в черно-бяло/сиво
Конвертирайте цветни PDF файлове в черно-бял или сив формат, за да намалите размера на файла
Интелигентен инструмент за компресиране на PDF
Автоматично разпознаване на типа на документа и прилагане на най-добрия алгоритъм за компресиране