Предыдущая запись: База данных терминологии Microsoft
Следующая запись: Korzh Localizer — локализация программ и игр на Delphi и C++ Builder
По определению, PDF создавался компанией Adobe как конечный формат документов для распространения. Эти документы предназначены только для просмотра и публикации и изначально возможность редактирования таких документов не предполагалась.
Однако, жизнь внесла свои коррективы и, с распространением формата PDF в Интернете, необходимость вносить изменения в такие документы все же появилась. Создавать и редактировать PDF-документы можно в Adobe Acrobat Pro, но не спешите тратить на эту программу время и деньги – ее нельзя использовать для перевода PDF на иностранные языки. То, что подразумевает Adobe под редактированием готового PDF, это всего-лишь внесение небольших изменений в документ: добавление колонтитулов, удаление страниц, замена фоновый изображений, сравнение файлов, элементы предпечатной подготовки, оптимизация размера и т.д. – вещи безусловно нужные, но для переводчика бесполезные.
Для переводчика важно иметь возможность легко заменять исходный текст на его перевод и контролировать формат (например, при переводе на немецкий, текст может стать длиннее, и для того, чтобы все поместилось, придется уменьшить размер шрифта или вовсе его заменить на более узкий). И вот тут-то, Adobe Acrobat Pro ничем помочь не сможет. Его единственный инструмент для работы с текстом (touchup tool), как следует из названия, предназначен для внесения только небольших изменений (опечатки, ошибки, пунктуация).
В отличии от MS Word, PDF понятия не имеет о такой концепции, как колонка текста или текстовый блок. Для Adobe Acrobat Pro текст – это набор строк или отдельных слов, закрепленных на конкретных позициях. Как только вы пытаетесь отредактировать абзац текста или узкую многострочную подпись к картинке, слова начинают прыгать, налазить друг на друга, текст соседних колонок сдвигается и дальнейшее редактирование становится невозможным. Можно сравнить PDF документ с текстом, который выложен вырезанными из газеты словами. Если вы захотите заменить одно слово на более короткое, то вам придется сдвинуть абсолютно все слова, следующие за ним, и сделать это придется вручную т.к. touchup tool не знает о существовании объемлющего блока текста, который нужно было бы заново переформатировать и отобразить.
Как же тогда редактировать PDF?
Есть 2 проверенных многолетним опытом пути.
У PDF-документов всегда есть источник – какой-то начальный формат, из которого был получен PDF. Например, это может быть макет документа в CorelDRAW, Adobe Pagemaker, Adobe Illustrator, Quark Xpress, MS Word и т.п. Очень часто, заказчик перевода не подозревает о технической стороне редактирования PDF документов и ставит задачу переводчику вернуть исходный PDF 1:1, но уже на другом языке. Важно, чтобы у клиента было понимание того, что в игре на самом деле должно быть два игрока: верстальщик и переводчик. Задача переводчика – перевести тексты и сохранить разметку исходного документа настолько, чтобы верстальщик смог правильно определить, какому оригинальному соответствует тот или иной переведенный фрагмент. Все равно, при подготовке к печати переведенного документа без верстальщика не обойтись, и, во избежание проблем с версткой, этим с самого начала должен заниматься один профессиональный специалист. В большинстве случаев верстальщик работает на стороне клиента. Некоторые переводческие бюро предлагают услуги собственного верстальщика.
После того, как с заказчиком достигнуто обоюдное понимание технической стороны дела, нужно получить из исходного PDF-файла редактируемый и максимально приближенный по разметке к оригиналу документ. Решение этой задачи есть в виде множества программ для конвертирования PDF в, например, формат Word или RTF. Конечно же, речь идет о весьма условном конвертировании – распознать документ 1:1 невозможно, т.к. часто в дело идет даже оптическое распознавание, которое по определению на дает на 100% точного результата. Из используемых нами инструментов такого рода – ABBY PDF Transformer и Solid Converter PDF. Это две разные по принципу действия программы, у каждой есть свои сильные и слабые стороны. Продукт ABBY, к примеру, лучше всего справляется с PDF-документами, сохраненными в виде графики или содержимое которых представляет собой сканированные документы. Solid Converter PDF показывает лучшие результаты, если в PFD, все же, содержится какая-то информация о разметке и выделяемый текст.
Если PDF распознается очень плохо или документ имеет огромный размер (например, Word не открывает файлы боле чем 500MB), и наверняка известно, что у заказчика есть этот документ в исходниках, можно попросить его подготовить PDF в оптимизированном для редактирования виде с пониженным качеством графики.
Итак, первый и наиболее правильный способ перевода PDF-документов – это достижение понимания клиентом технической стороны, разделение обязанностей переводчика и верстальщика, получение редактируемого документа из PDF, его перевод (в т.ч. с применением привычных CAT-инструментов) и отправка клиенту.
Бывают ситуации, когда PDF- это единственное, что есть у заказчика и достать оригинальный макет документа нет никакой возможности. Распознавание PDF, перевод и конвертирование полученного документа снова в PDF наверняка приведет к потере качества, и финальный документ будет выглядеть непрофессионально. Все, что остается переводчику – это каким-то образом получить возможность редактировать текст прямо в PDF. Adobe Acrobat Pro, как было описано выше, в этом ничем не поможет, но существует несколько программ, способных решить эту задачу. Из используемых нами в процессе выполнения технических переводов – InFix Pro PDF Editor. Эта программа умеет распознавать блоки текста и правильно их форматировать при редактировании. Из недостатков – нельзя использовать привычные CAT-инструменты, все делается вручную, что может быть затратно по времени и чревато неоднородной лексикой. Так же, ограничены средства проверки орфографии для разных языков. Но несмотря на простоту и перечисленные недостатки, в качестве “последней надежды”, этот инструмент работает.
Предыдущая запись: База данных терминологии Microsoft
Следующая запись: Korzh Localizer — локализация программ и игр на Delphi и C++ Builder
Оформите предварительный заказ прямо сейчас! Мы свяжемся с вами для выяснения деталей и оценки стоимости.
На самом деле очень даже можно использовать КАТы с Инфиксом. В последних версиях есть тулза Translate: выберите в меню Document > translate > Export XML , получится XML-файл с подробным описанием форматирования (по сути тот же HTML). Его загружаете прямо в традос и редактируете. Для работы с ОметойТ сначала следует поменять расширение на HTML (просто так его программа не поймет), после перевода – обратно в XML.
Затем же готовый файл импортируется в Инфикс обратно: документ – транслейт – импорт xml. Получается готовый пдф-ник, одни-в-один соответствующий оригиналу! Естественно, потом правите его вручную – где-то текст вылез, где-то шрифт надо поменять (не все отображают кириллические символы ) и т.д.
Попробовала такой метод – хоть совет и двухлетней давности, а сработало =) Только у меня не Традос, а Дежа Вю, причем с xml совершенно отказывается работать. Пришлось переделать xml сначала в txt, потом загрузить в Дежу, перевести, экспортировать переведенный файл txt, его – обратно в xml и через Infix – в pdf. Уф, но это единственный способ, который сработал =))))
I would like to express my professional appreciation for the InFix PDF Editor. Working as a technical translator I very often receive documents in PDF that need to be translated. Most of the time an original Word file is not available, which makes translation and editing of a document extremely difficult. Having tried InFix Pro on my PDF files made me feel so much better! I have finally found something that really works! The programm allows to edit the text, maintaining the original format (or keeping it very close to the original). Moreover, it is also possible to do the spellcheck and to elaborate the files using CAT tools. This really is a precious feature for any translator. I receive a lot of technical documentation, containing images and technical drawings, and even this is not a problem anymore, while when converting into Word with other applications I’d always lose all of the formatting. Another important advantage to mention is that InFix is extremely user friendly, it has a comprehencive menu bar with all the icons for any function you may need. I’d really recommend it to all my colleague-translators and to anyone who needs to do editing directly from PDF format. A big and sincere thanks to everyone who is working on it! It really makes the differenc
Tatjana
А у меня Инфикс почему-то символы русского языка не правильно отображает.