Предыдущая запись: База данных терминологии Microsoft

Следующая запись: Korzh Localizer — локализация программ и игр на Delphi и C++ Builder

Как переводить и редактировать PDF-документы

Июль 30, 2009


По определению, PDF создавался компанией Adobe как конечный формат документов для распространения. Эти документы предназначены только для просмотра и публикации и изначально возможность редактирования таких документов не предполагалась.

Однако, жизнь внесла свои коррективы и, с распространением формата PDF в Интернете, необходимость вносить изменения в такие документы все же появилась. Создавать и редактировать PDF-документы можно в Adobe Acrobat Pro, но не спешите тратить на эту программу время и деньги – ее нельзя использовать для перевода PDF на иностранные языки. То, что подразумевает Adobe под редактированием готового PDF, это всего-лишь внесение небольших изменений в документ: добавление колонтитулов, удаление страниц, замена фоновый изображений, сравнение файлов, элементы предпечатной подготовки, оптимизация размера и т.д. – вещи безусловно нужные, но для переводчика бесполезные.

Для переводчика важно иметь возможность легко заменять исходный текст на его перевод и контролировать формат (например, при переводе на немецкий, текст может стать длиннее, и для того, чтобы все поместилось, придется уменьшить размер шрифта или вовсе его заменить на более узкий). И вот тут-то, Adobe Acrobat Pro ничем помочь не сможет. Его единственный инструмент для работы с текстом (touchup tool), как следует из названия, предназначен для внесения только небольших изменений (опечатки, ошибки, пунктуация).

В отличии от MS Word, PDF понятия не имеет о такой концепции, как колонка текста или текстовый блок. Для Adobe Acrobat Pro текст – это набор строк или отдельных слов, закрепленных на конкретных позициях. Как только вы пытаетесь отредактировать абзац текста или узкую многострочную подпись к картинке, слова начинают прыгать, налазить друг на друга, текст соседних колонок сдвигается и дальнейшее редактирование становится невозможным. Можно сравнить PDF документ с текстом, который выложен вырезанными из газеты словами. Если вы захотите заменить одно слово на более короткое, то вам придется сдвинуть абсолютно все слова, следующие за ним, и сделать это придется вручную т.к. touchup tool не знает о существовании объемлющего блока текста, который нужно было бы заново переформатировать и отобразить.

Как же тогда редактировать PDF?

Есть 2 проверенных многолетним опытом пути.

Правильный способ перевода PDF-документов (конвертировать pdf в word → перевести pdf → сверстать макет)

У PDF-документов всегда есть источник – какой-то начальный формат, из которого был получен PDF. Например, это может быть макет документа в CorelDRAW, Adobe Pagemaker, Adobe Illustrator, Quark Xpress, MS Word и т.п. Очень часто, заказчик перевода не подозревает о технической стороне редактирования PDF документов и ставит задачу переводчику вернуть исходный PDF 1:1, но уже на другом языке. Важно, чтобы у клиента было понимание того, что в игре на самом деле должно быть два игрока: верстальщик и переводчик. Задача переводчика – перевести тексты и сохранить разметку исходного документа настолько, чтобы верстальщик смог правильно определить, какому оригинальному соответствует тот или иной переведенный фрагмент. Все равно, при подготовке к печати переведенного документа без верстальщика не обойтись, и, во избежание проблем с версткой, этим с самого начала должен заниматься один профессиональный специалист. В большинстве случаев верстальщик работает на стороне клиента. Некоторые переводческие бюро предлагают услуги собственного верстальщика.

После того, как с заказчиком достигнуто обоюдное понимание технической стороны дела, нужно получить из исходного PDF-файла редактируемый и максимально приближенный по разметке к оригиналу документ. Решение этой задачи есть в виде множества программ для конвертирования PDF в, например, формат Word или RTF. Конечно же, речь идет о весьма условном конвертировании – распознать документ 1:1 невозможно, т.к. часто в дело идет даже оптическое распознавание, которое по определению на дает на 100% точного результата. Из используемых нами инструментов такого рода – ABBY PDF Transformer и Solid Converter PDF. Это две разные по принципу действия программы, у каждой есть свои сильные и слабые стороны. Продукт ABBY, к примеру, лучше всего справляется с PDF-документами, сохраненными в виде графики или содержимое которых представляет собой сканированные документы. Solid Converter PDF показывает лучшие результаты, если в PFD, все же, содержится какая-то информация о разметке и выделяемый текст.

Если PDF распознается очень плохо или документ имеет огромный размер (например, Word не открывает файлы боле чем 500MB), и наверняка известно, что у заказчика есть этот документ в исходниках, можно попросить его подготовить PDF в оптимизированном для редактирования виде с пониженным качеством графики.

Итак, первый и наиболее правильный способ перевода PDF-документов – это достижение понимания клиентом технической стороны, разделение обязанностей переводчика и верстальщика, получение редактируемого документа из PDF, его перевод (в т.ч. с применением привычных CAT-инструментов) и отправка клиенту.


Последняя надежда переводчика PDF-документов (изменение непосредственно pdf-документа используя редактор pdf)

Бывают ситуации, когда PDF- это единственное, что есть у заказчика и достать оригинальный макет документа нет никакой возможности. Распознавание PDF, перевод и конвертирование полученного документа снова в PDF наверняка приведет к потере качества, и финальный документ будет выглядеть непрофессионально. Все, что остается переводчику – это каким-то образом получить возможность редактировать текст прямо в PDF. Adobe Acrobat Pro, как было описано выше, в этом ничем не поможет, но существует несколько программ, способных решить эту задачу. Из используемых нами в процессе выполнения технических переводов – InFix Pro PDF Editor. Эта программа умеет распознавать блоки текста и правильно их форматировать при редактировании. Из недостатков – нельзя использовать привычные CAT-инструменты, все делается вручную, что может быть затратно по времени и чревато неоднородной лексикой. Так же, ограничены средства проверки орфографии для разных языков. Но несмотря на простоту и перечисленные недостатки, в качестве “последней надежды”, этот инструмент работает.

  • Facebook
  • LinkedIn
  • Twitter
  • LiveJournal
  • MySpace
  • Digg
  • Reddit
  • StumbleUpon
  • Delicious
  • Google Bookmarks
  • Google Gmail
  • Share/Bookmark

Комментариев: 2
  1. Павел Деев:

    На самом деле очень даже можно использовать КАТы с Инфиксом. В последних версиях есть тулза Translate: выберите в меню Document > translate > Export XML , получится XML-файл с подробным описанием форматирования (по сути тот же HTML). Его загружаете прямо в традос и редактируете. Для работы с ОметойТ сначала следует поменять расширение на HTML (просто так его программа не поймет), после перевода – обратно в XML.
    Затем же готовый файл импортируется в Инфикс обратно: документ – транслейт – импорт xml. Получается готовый пдф-ник, одни-в-один соответствующий оригиналу! Естественно, потом правите его вручную – где-то текст вылез, где-то шрифт надо поменять (не все отображают кириллические символы ) и т.д.

  2. Tatjana:

    I would like to express my professional appreciation for the InFix PDF Editor. Working as a technical translator I very often receive documents in PDF that need to be translated. Most of the time an original Word file is not available, which makes translation and editing of a document extremely difficult. Having tried InFix Pro on my PDF files made me feel so much better! I have finally found something that really works! The programm allows to edit the text, maintaining the original format (or keeping it very close to the original). Moreover, it is also possible to do the spellcheck and to elaborate the files using CAT tools. This really is a precious feature for any translator. I receive a lot of technical documentation, containing images and technical drawings, and even this is not a problem anymore, while when converting into Word with other applications I’d always lose all of the formatting. Another important advantage to mention is that InFix is extremely user friendly, it has a comprehencive menu bar with all the icons for any function you may need. I’d really recommend it to all my colleague-translators and to anyone who needs to do editing directly from PDF format. A big and sincere thanks to everyone who is working on it! It really makes the differenc
    Tatjana

Имя *

Почта (скрыта) *

Сайт

Комментарий

Предыдущая запись: База данных терминологии Microsoft

Следующая запись: Korzh Localizer — локализация программ и игр на Delphi и C++ Builder

Контакты

 

  • Подпишитесь на новые статьи по e-mail:

     

     

     

Оформите предварительный заказ прямо сейчас! Мы свяжемся с вами для выяснения деталей и оценки стоимости.

Сделать заказ

Способы оплаты

 

Отзывы

  • "Мы работаем с компанией Alconost Translations с октября 2004 года. Alconost это старый, надежный и проверенный партнер для переводов и написаний текстов на нескольких европейских языках."
    — Виктор Бобров, Recovery Toolbox, Inc.

Вы наш клиент?

Пожалуйста, оставьте свой собственный отзыв

Оставить отзыв!


Дизайн сайта — студия Антона Баранова