Янтарный конвертер

Источник: http://www.softkey.info/

Как ни крути, а главная проблема в компьютерном мире - это проблема совместимости. Все развивалось по принципу "больше форматов, хороших и разных". Как результат - столько различных форматов данных развелось, и вроде бы все нужны, и каждый из них хорош для определенных целей. Каждый новый продукт в какой-то области вносит на рынок свой, родной формат. Например, все современные графические редакторы, наряду с поддержкой самых распространенных форматов, все равно рабочую версию документа хранят в своем собственном формате. С текстом (или, скорее, гипертекстом) ситуация не лучше - на сегодняшний день существует около двух десятков различных форматов. Бедных пользователей, которым то и дело приходиться искать способы преобразования документов из одного формата в другой, спасают программы-конвертеры.

Process Text Group предлагает пользователям свое, достаточное мощное и очень недорогое решение в этой области - ABC Amber Text Converter. Поражает обилие "входных" и "выходных" форматов, есть даже довольно экзотические, вроде Word для "Макинтоша" или Lexicon для DOS. Интерфейс прост и функционален, ничего лишнего. Из настроек присутствуют возможность сворачивания в трей, включения или выключения панели инструментов и выбор языка интерфейса. Кроме того, можно еще задать настройки для PDF формата, который есть в числе "выходных". Кстати, при конвертации в PDF возможна шифровка документа (с указанием длины ключа), защита паролями, настройка размеров листа и ориентации, установка желаемого уровня сжатия и разрешения на распечатку, a также редактирование или копирование фрагментов получаемого документа и прочих параметров. А в качестве языка для интерфейса программы можно выбрать любой из более чем 50 языков (в том числе русский, украинский и белорусский). Согласитесь, приятно будет пользователю из Словении или Индонезии увидеть эту программу на своем родном языке. С другой стороны, интерфейс программы ограничивается буквально несколькими диалоговыми окнами, а переведено не все (например, окно с настройками PDF).

Теперь посмотрим, как это все работает. Выбираем "входной" формат, открываем исходный файл. Затем точно так же выбираем формат файла, который должен получиться на выходе после конвертации. Затем указываем его имя, тем самым запускаем процесс. Ниже описано несколько протестированных автором вариантов.

Конвертация HTML-странички в RTF. Открытие файла прошло успешно, что и было засвидетельствовано отдельной строкой в протоколе (внизу окна программы, под списками форматов). Кстати, для исходного файла можно указать набор символов (charset) и кодировку. Для моей странички я выбрал RUSSIAN_CHARSET и Win1251 соответственно, потому что именно эта кодировка используется в моем HTML. Далее выбираем RTF в качестве формата для экспорта и после нажатия кнопочки "Сохранить как" указываем имя файла. Все проходит гладко и быстро, вновь созданный документ автоматически открывается (кстати, как повлиять на такое поведение, я не нашел). Так, вроде все нормально - русский текст отображается корректно. Смотрим дальше - и вот первый сюрприз. У меня на страничке есть немного текста, а затем таблица. Текст есть, гиперссылки сохранились, и табличка на месте. Дополнительно сконвертируем в формат Word версии 97-2000 - все в порядке. Теперь Word 6.0 - 95. И тут сюрприз - таблички нет. И ошибок никаких не выдал. Досадно. Причина, скорее всего, кроется в версии Microsoft Office - в данном случае это Office 2002. Неприятно, конечно, но, с другой стороны, пользователю достаточно иметь документ в формате, соответствующем той версии Office, которая установлена у пользователя. Заодно, по ходу дела, сконвертируем эту же страничку в PDF. Указываем RUSSIAN_CHARSET и получаем русский текст без проблем. Теперь попробуем что-нибудь более простое - например, взять текстовый файл в ANSI кодировке и преобразовать его в Unicode. Все работает отлично. Кстати, это может пригодиться тем, кто делает свои словари для Lingvo.

Word 97-2000 -> PDF. Этот вариант тоже работает нормально. Для разнообразия попробовал преобразовать тот же документ, но уже в HTML. Все нормально, даже размер символов был учтен, но вот ссылки пропали. А казалось бы, если в Word'овском документе были ссылки, то они мне нужны и в HTML в виде ссылок.

XLS -> HTML. Не все гладко, если строки в таблице раскрашены разными цветами, но радует то, что даже очень большой документ (порядка полутора тысяч строк) сконвертировался без проблем. Правда, открывался достаточно долго.

Теперь придумаем еще какую-нибудь задачку для программы. Например, есть у нас список видеокассет из домашней видеотеки в виде таблички в формате Excel, и мы хотим создать HTML-страничку и выложить ее на свой сайт. Выбираем файл, после чего нам предлагается выбрать, всю ли книгу надо конвертировать или какой-то конкретный лист. После конвертации, как ни странно, получаю страничку с черным фоном. Таблички моей нет. При ближайшем рассмотрении оказалось, что она есть, но черным цветом. Гляжу в сгенерированный HTML - так точно, в стилях и цвет фона и цвет символов в табличке - черный. Казалось бы, логично предположить, что раз в Excel я вижу черные буквы на белом фоне, то и в HTML страничке я захочу увидеть то же самое. Но это не самое интересное. Когда я уже работал над статьей, я все эти тесты повторял. Так вот - в описанном выше случае все отработало корректно. То есть фон был белым. Призвав на помощь здравый смысл и память, я понял в чем было дело: перед тем как делать эту конвертацию, я сконвертировал в RTF файл HTML с черным фоном и серыми буквами! Забавно, конечно, но если неискушенный пользователь на такое наткнется, он может разочароваться в программе навсегда.

Конвертация XLS в PDF отработала нормально, а вот после преобразования в RTF получился документ с гигантским количеством страниц, причем создалось такое ощущение, что каждая строка таблицы теперь располагается в гордом одиночестве на листе и "тянет" за собой еще пару пустых листов. Еще одна особенность - если выбрать в качестве входного формата Word 6.0/95, а сам файл будет создан в Word 97/2000, то программа выдаст сообщение об ошибке. В этом же сообщении содержится совет, суть которого сводится к тому, что RTF формат в качестве входного программа воспринимает гораздо лучше, чем все остальные, и предлагается первоначально сконвертировать документ в этот формат. Напрашивается резонный вопрос: а зачем тогда все эти форматы, которые можно указать в качестве входных, пусть бы был там только RTF.

Начиная с версии 1.17, появился так называемый пакетный режим. После нажатия на кнопку Open Folders нужно выбрать папку, затем открывается диалоговое окно, в котором можно найти в указанной папке все файлы указанного типа. Затем можно выбрать из них только те, что нужны. Аналогично указываем папку (кнопка Save Folders), куда будут складываться сконвертированные файлы. И сразу после выбора этой папки запускается процесс конвертации.

В целом у меня от этого "янтарного" конвертера ("amber" в переводе с английского значит "янтарь") осталось впечатление, что продукт многообещающий, но "не доведенный". Аббревиатура "ABC" ("букварь", "азбука") в названии намекает на простоту использования, и это правда. Но вот все описанные выше недочеты портят общее впечатление. Встроенная система помощи (в обоих продуктах), кроме информации о поддерживаемых форматах, не дает подробных сведений о тех или иных опциях программы. В общем, складывается впечатление, что продукту не хватает "интеллектуальности" и дополнительных настроек, а команде создателей надо бы провести тщательное тестирование на различных типах документов.

Кстати, кроме текстового конвертера, есть также отдельный продукт - ABC Amber PDF Converter, который может быть получен "в нагрузку" (то есть бесплатно), если вы приобретаете Text Converter. Программа эта выводит различную информацию об открываемом PDF документе и позволяет сконвертировать либо все страницы (в незарегистрированной версии - только первые пять), либо указанную. Набор форматов - тот же, что и у текстового конвертера. Для извлечения теста из PDF предусмотрены два режима - "As plain text", когда в выходной файл попадает только текст, и его там можно редактировать, и "As preview pictures", когда на выходе получается файл, целиком состоящий из набора картинок, отражающих содержимое входного документа. Кстати, в справочной системе программы назначение этих опций подробно не описано, сказано лишь, что "иногда лучше использовать первый вариант, а иногда второй".

Кроме описанных выше, на сайте на данный момент доступны и другие продукты компании - такие, например, как ABC Amber XML Converter, ABC Amber CHM Converter, ABC Amber Outlook Express Converter и ABC Amber DBX Converter. А к выходу планируются (и это не полный список) ABC Amber Text2Image Converter, ABC Amber The Bat! Converter, ABC Amber ICQ Converter, ABC Amber DBF Converter. В общем, пожелаем разработчикам успехов в деле "доводки" своего детища и будем ждать новых версий.

Автор статьи: Андрей Кулабухов