Основи PDF
Перед стисненням PDF важливо розуміти базову структуру PDF-файлів і визначити мету стиснення, що допоможе нам вибрати найбільш відповідну стратегію стиснення.
Різні типи PDF вимагають різних методів стиснення
Чорно-білі скановані тексти: Алгоритм стиснення JBIG2 може зменшити розмір файлу на 95-98%, зберігаючи текст чітким і читабельним
Кольорові скановані тексти: Технологія стиснення MRC може зменшити розмір файлу на 70-85%, зберігаючи кольори
PDF на основі тексту: Вихідний текстовий вміст уже високо оптимізований; стиснення досягається головним чином шляхом оптимізації вбудованих зображень, зазвичай зменшуючи розмір файлу на 10-30%
Документи з векторною графікою: Наприклад, креслення CAD, можуть бути стиснуті шляхом растеризації в растрове зображення з подальшим застосуванням чорно-білого або сірого кодування, зменшуючи розмір файлу на 60-80%
Вибір правильного методу стиснення є ключем до забезпечення як зменшеного розміру файлу, так і збереженої якості документа.
Різниця між PDF на основі тексту та на основі зображень
PDF-файли містять різні елементи, переважно текст, зображення та векторну графіку. Іноді вміст, який виглядає як текст, насправді може бути зображенням або векторною графікою.
Швидкі поради для визначення типів PDF
Використовуйте браузер Chrome або Edge для відкриття PDF; вміст, який можна виділити та підсвітити, є справжніми текстовими елементами.
PDF на основі тексту: Вміст складається з справжніх текстових елементів, які можна вибрати та шукати
PDF на основі зображень: Вміст існує як зображення, наприклад, скановані документи або текст, представлений як зображення/вектори
Елементи PDF, придатні для стиснення
Різні елементи в PDF мають різний потенціал стиснення:
- Текстові елементи: Формат PDF вже стиснув їх початково, з обмеженим додатковим простором для стиснення (зазвичай лише 5-10% зменшення)
- Повторювані об'єкти, вкладення та шрифти: Більшість інструментів стиснення можуть ефективно обробляти їх, але простір для стиснення обмежений (зазвичай 10-20% зменшення)
- Зображення та вектори: Основні об'єкти для стиснення PDF, що пропонують найбільший потенціал стиснення (зазвичай 50-90% зменшення обсягу)
Стратегії стиснення
Стиснення PDF на основі тексту
Для PDF, які переважно складаються з тексту:
- Очистити надлишкові дані: Видалити коментарі, поля форм, повторювані об'єкти
- Оптимізація шрифтів: Використовувати підмножини шрифтів або стандартні шрифти
- Регулювання якості зображення: Відповідно зменшити якість зображень у документі
Рекомендований інструмент: Інструмент стиснення PDF
Зауважте, що PDF на основі тексту зазвичай уже оптимізовані під час створення, з додатковим простором для стиснення, що походить переважно від зображень та векторних елементів у документі.
Стиснення векторної графіки
Векторна графіка залишається чіткою навіть при збільшенні і по суті являє собою серію даних інструкцій, що описують графіку.
Креслення CAD є типовими прикладами, що містять велику кількість векторів. Хоча самі вектори важко стиснути, значне стиснення можна досягти, перетворивши їх на растрові зображення (особливо чорно-білі). Перетворення на чорно-білі растрові зображення зазвичай зменшує оригінальний файл на 60-85%, тоді як перетворення на сірий відтінок може зменшити його на 50-70%.
Кроки операції:
-
Растеризувати креслення CAD у растрові зображення
Растеризувати PDF -
Перетворити растрові зображення на чорно-білі (застосовуючи алгоритм JBIG2)
PDF у чорно-білий
Особливості перетворення креслень CAD
Складні вектори в PDF можуть впливати на результати перетворення формату.
PDF-файли, що містять креслення CAD, схильні до помилок при перетворенні в формати Office, оскільки велика кількість векторів в кресленнях CAD перешкоджає процесу перетворення.
Рішення полягає в тому, щоб спочатку растеризувати сторінки з CAD у зображення, а потім виконати перетворення формату.
Техніки стиснення зображень
PDF підтримує кілька алгоритмів стиснення зображень; оберіть відповідний алгоритм на основі різних сценаріїв.
Стиснення чорно-білих документів
Підходить для документів, які можна представити в чорно-білому форматі (наприклад, чисті текстові сканування), алгоритм JBIG2 не зберігає інформацію про колір і може досягти ступеня стиснення понад 98%.
Найкраще для: Сканування тексту, лінійних малюнків
Коефіцієнт стиснення: 2-5% від оригінального розміру файлу (зменшення на 95-98%)
Кроки обробки:
Чорно-біле перетворення Обробка стисненняСтиснення документів у відтінках сірого
Підходить для документів, які використовуються переважно для чорно-білого або сірого друку, стиснення досягається шляхом відмови від інформації про колір.
Найкраще для: Документів для друку, вмісту, який не потребує збереження кольорів
Коефіцієнт стиснення: 15-30% від оригінального розміру файлу (зменшення на 70-85%)
Кроки обробки:
Перетворення в сірий Обробка стисненняСтиснення кольорових документів
Для цифрових документів, які потребують збереження кольорів, технологія Mixed Raster Content (MRC) є найкращим вибором. MRC обробляє зображення, розділяючи їх на три шари:
- Передній план: Містить текст і лінії, оброблені з високою роздільною здатністю
- Фон: Містить фотографії або фони зображень, оброблені з нижчою роздільною здатністю
- Маска: Визначає граничні області між переднім планом і фоном
MRC спрощує інформацію про зображення, об'єднуючи подібні піксельні області, особливо підходить для кольорових сканувань, значно зменшуючи розмір файлу, зберігаючи чіткість. Порівняно з традиційними методами стиснення, технологія MRC зазвичай дає на 30-50% кращі результати стиснення для кольорових документів.
Найкраще для: Кольорові сканування, змішані документи, що містять текст і зображення
Коефіцієнт стиснення: 15-40% від оригінального розміру файлу (зменшення на 60-85%)
Рекомендований інструмент: Потужне стиснення (Оберіть рівень "Потужне стиснення", щоб увімкнути технологію MRC)
Порівняння ефекту стиснення
Наступна таблиця підсумовує очікувані ефекти різних методів стиснення для різних типів документів:
Тип документа | Рекомендований метод стиснення | Очікуваний коефіцієнт стиснення | Вплив на якість | Придатні сценарії |
---|---|---|---|---|
Чистий текстовий PDF | Стандартне стиснення | 90-95% від оригінального розміру | Майже немає впливу | Електронні документи, які містять переважно текст |
Текстовий PDF з кількома зображеннями | Стандартне стиснення | 70-90% від оригінального розміру | Незначний вплив | Звіти, статті |
Чорно-білі скановані тексти | Алгоритм JBIG2 | 2-5% від оригінального розміру | Краї тексту можуть бути трохи розмиті | Скановані документи, контракти |
Документи в сірому | Перетворення в сірий + стиснення | 15-30% від оригінального розміру | Втрата інформації про колір | Документи для друку |
Кольорові скановані документи | Технологія MRC | 15-40% від оригінального розміру | Незначна втрата деталей | Скановані журнали, кольорові звіти |
Креслення CAD | Растеризація + чорно-біле перетворення | 15-40% від оригінального розміру | Втрата векторних властивостей, неможливо редагувати | Інженерні креслення лише для перегляду |
PDF переважно з фотографіями | Стандартне стиснення зображень | 30-60% від оригінального розміру | Залежить від рівня стиснення | Колекції фотографій, каталоги продукції |
Вибір найкращого рішення
На основі характеристик і мети PDF-документа дотримуйтесь цього потоку рішень для вибору найкращого рішення:
- Документи, що переважно містять текст: Використовуйте стандартне стиснення, вручну налаштуйте роздільну здатність зображення та метод стиснення за необхідності
- Документи, що містять численні вектори CAD: Спочатку растеризуйте векторні сторінки, потім перетворіть на чорно-білий або сірий
- Чорно-білі скановані документи: Застосуйте алгоритм JBIG2
- Документи для сірого друку: Перетворіть на сірі зображення
- Документи, що потребують збереження кольору: Використовуйте технологію MRC (потужне стиснення)
Міркування щодо стиснення
Важливе повідомлення про ризик
Компроміс між стисненням і якістю: Вищі коефіцієнти стиснення зазвичай означають нижчу якість зображення; знайдіть баланс між розміром файлу та якістю
Резервне копіювання оригінальних файлів: Рекомендується зберігати оригінальні файли перед застосуванням високих коефіцієнтів стиснення
Вибирайте стратегію на основі мети: Обирайте різні стратегії стиснення на основі кінцевої мети документа (читання на екрані, друк або архівування)
Підсумок
Стиснення PDF — це мистецтво балансу, що вимагає вибору найкращого методу стиснення на основі типу та мети документа. Розуміючи основний склад PDF та характеристики різних алгоритмів стиснення, ми можемо максимізувати зменшення розміру файлу, зберігаючи відповідну чіткість.
Рекомендовані стратегії:
- PDF на основі тексту: Використовуйте стандартне стиснення
- Чорно-білі сканування: Застосуйте алгоритм JBIG2
- Важливі кольорові документи: Використовуйте технологію MRC
Практичні інструменти
Інструмент растеризації векторів PDF
Перетворіть складну векторну графіку на формат растрового зображення, вирішуючи проблеми перетворення CAD
Інструмент перетворення PDF у чорно-білий/сірий
Перетворюйте кольорові PDF у чорно-білий або сірий формат для зменшення розміру файлу
Розумний інструмент стиснення PDF
Автоматично виявляйте тип документа та застосовуйте найкращий алгоритм стиснення