logo





ПОИСК

 
     
Авторизация!
  Регистрация   Забыли пароль  
страница в twitter twitter

online консультации:
 
ДИЗАЙН
Николай Коваленко
Дизайнер-график / dnkstudio
вопросы (1)


DPT Формат PDF файла
Александр Милевский, автор

Обычный «среднестатистический» пользователь не должен знать «внутреннюю» структуру формата PDF. Для желающих знать больше, в этом материале постараемся описать вид, в котором информация хранится в PDF файле.

Немного общей полезной информации:

Файлы формата PDF - 7-битовые текстовые ASCII-файлы. Они могут быть открыты в любом редакторе или текстовом процессоре (типа Notepad). В зависимости от метода сжатия и параметров настройки кодирования, файл имеет вид читаемого или нечитаемого текста.
Каждая строка в формате PDF может содержать до 255 символов.
Каждая строка заканчивается символом возврата каретки, переводом строки или символом возврата каретки, сопровождаемым переводом строки (в зависимости от приложения или базовой системы, используемой для создания PDF).
Формат PDF чувствителен к регистру.

Структура PDF

PDF файлы имеют фиксированную структуру . Они всегда содержат 4 раздела:
Заглавие (header). Содержит информацию о технических требованиях формата PDF. Эта строка выглядит следующим образом: ‘%PDF-1.2 ′. ‘1.2 ′ могут также быть ‘1.0 ′ или ‘1.1 ′ для старших версий стандарта формата PDF.
Тело (body). Содержит описания различных элементов, которые используются на всех страницах.
Таблица перекрестных ссылок (cross-reference table). Ссылается на все элементы из тела, которые используются на страницах файла формата PDF.
Окончание (trailer). Говорит приложениям или RIP, где находится таблицу перекрестных ссылок и всегда заканчивается ‘%%EOF’. Если эта строка пропущена, то PDF не закончен и скорее всего не будет обработан RIP или приложением. Данное обстоятельство отличает PDF от PostScript файла. Так если последние несколько строк PostScript файла пропущены (из-за потери связи во время передачи файла или аварийного отказа компьютера), то очень часто вы можете напечатать большинство страниц. С файлом формата PDF вы теряте все.

Изменение данных в формате PDF

Если данные были добавлены к файлу формата PDF (например, в связи с тем, что пользователь редактировал текст в Adobe Acrobat и сохранил файл снова, или же если Вы объединяете файлы формата PDF), то другая область тела, таблица перекрестных ссылок и окончание будут добавлены в конец файла. Это увеличивает размер PDF. Если же открыть файл в Acrobat и, использував ‘Save as’ сохранить его, то вы вынуждаете приложение очистить PDF, и в этом случае нет никакого большего количества множественных областей данных. То же самое верно при удалении страниц в формате PDF: только при пересохранении ‘Save as’ приложение очистит новый файл от неиспользованных данных.

Шрифты в файлах формата PDF

Файла формата PDF поддерживает Тип 1, Тип 3 и шрифты TrueType. От формата PDF 1.6 и выше, шрифты OpenType могут также быть прямо сохранены в файлах формата PDF. В более ранних версиях шрифты OpenType внедрялись или как Тип 1, или как шрифты TrueType.

Предпочтительно, чтобы любые шрифты, которые используются в работе, были включены непосредственно в файл PDF. Это гарантирует, что файл при передаче на другой компьютер или печати будет такой же, каким он был создан дизайнером.

Есть два механизма, чтобы включить шрифты в формат PDF:
Внедряя - полная копия всего символьного набора шрифта сохранена в формате PDF.
Подустанавливая - только те символы, которые фактически используются в работе, будут сохранены в формате PDF. Если символ “$” не появляется нигде в тексте, то символ не будет включен в шрифт. Это означает, что файлы формата PDF с subsetted шрифтами имеют меньший размер по-сравнению с файлами PDF с внедренными шрифтами.

Если какой-то шрифт не внедрен в PDF, то Adobe Acrobat и Adobe Reader автоматически попытаются эмулировать отсутствующий шрифт, используя один из шрифтов Multiple Master, которые встроены в эти программы. Таким образом, документ не будет представлен точно в том виде, в котором хотел дизайнер, но, по крайней мере, его можно будет прочитать.

Multiple Master использует следующие шрифты:

MMS Засечки Adobe
Adobe MMS Sans

Какие шрифты используются в формате PDF?

Adobe Acrobat и Adobe Reader предлагают опцию 'Font info' в окне "Document info". Эта опция не будет перечислять все шрифты, используемые в документе. Вы сможете увидеть только те шрифты, которые используются на активной странице. Не полагайтесь на него, чтобы получить точный краткий обзор шрифтов, используемых в документе формата PDF.

Чтобы получить информацию обо всех шрифтах, необходимо использовать дополнения к этим программам (типа Enfocus PitStop).

Внедренные шрифты

Acrobat Distiller предлагает опцию, позволяющую автоматически добавить отсутствующие шрифты к PostScript файлам, которые он обрабатывает. В меню местоположений шрифта пользователь может определить несколько папок, которые должны быть просмотрены Acrobat Distiller при работе с PostScript. Напомним, что для Acrobat Distiller необходимы лишь принтерные шрифты.

Шрифты, которые не включены в файлы формата PDF

Старшие версии Adobe Acrobat (Акробат 3.x и ранее) никогда не будут внедрять следующие 14 шрифтов в PDF файл:
Courier, Courier-Bold, Courier-Oblique, Courier-BoldOblique, Times-Roman , Times-Bold , Times-Italic, Times-BoldItalic, Helvetica, Helvetica-Bold, Helvetica-Oblique, Helvetica-BoldOblique, Symbol, ZapfDingbats.
Эти шрифты, за исключением ZapfDingbats, называют базовыми (Base) 13 шрифтами.

Начиная с Acrobat 4.x и выше, нет никакой проблемы с внедрением вышеупомянутых 14 шрифтов. Вместо этого мы получали другое ограничение: если политика лицензирования TrueType запрещает шрифту быть включенным в файл, Distiller 4 и выше будет выполнять это ограничение и не будет внедрять шрифт.

Подустановка шрифтов

При генерации PDF файла возможен также вариант, при котором в файл включаются только те символы шрифта, которые фактически используются в издании. Эта методика называют подустановкой шрифта. Используя ‘Subset fonts below XX %’ параметр Distiller, вы можете задать, сколько символов должно использоваться в издании прежде, чем подмножество шрифта будет включено.

Есть 2 преимущества при подустановке шрифтов

Она уменьшает размер PDF файла, что может быть важно, если размер файла действительно крайне важен, например, для файлов формата PDF, которые будут загружены в сеть.

RIP будут всегда использовать подустановку шрифта, даже если полный шрифт будет уже доступен на RIP. Однако это может привести к разному представлению текстов.

Есть два недостатка при подустановке шрифтов:

Если Вы хотите редактировать текст в Акробате и символ, в котором вы нуждаетесь, не включен в подмножество, он не может использоваться в исправлении.

Объединение двух файлов, которые содержат различное подмножество того же самого шрифта, может привести к потере символов.

Конвертирование шрифтов в кривые (outline fonts)

Иногда бывает, что практично конвертировать все шрифты в PDF в кривые. При таком подходе текст в формате PDF становится не редактируемым (locked down ) и могут возникнуть проблемы при выводе его на RIP из-за непредсказуемого поведения шрифта. Нужно помнить, что при конвертировании шрифтов, ухудшается их качество.

Общие рекомендации

Некоторые рекомендации, чтобы избежать проблем со шрифтами в формате PDF:
Всегда устанавливайте выдачу ошибки в Distiller, когда шрифт не внедрен. Всегда внедряйте все шрифты.
Всегда внедряйте полностью весь шрифт, и не используйте subset fonts. Это позволяет избегать многих проблем, при редактировании и работе с PDF.
Отключите “ Use local fonts in Acrobat ” на каждой машине в вашем вычислительном центре.
Всегда делайте проверку (preflight) на включение Courier в файлах формата PDF, которые Вы обрабатываете или отсылаете.
Попытайтесь избежать использовать TouchUp в Акробате.
Удалите все шрифты из Вашего RIP (кроме Courier, Helvetica или любого другого шрифта, который RIP требует, чтобы работать правильно).

 
 
Сведения о файловом формате Adobe PDF
Формат PDF файла
Изображения в файлах формата PDF