Из всего разнообразия графических форматов для хранения оцифрованных копий архивных документов подходят далеко не все. Векторные не подходят в силу особенностей представления изображений в векторной форме. Среди растровых наибольшую распространённость у архивистов получили форматы TIFF и JPEG.
Формат TIFF своей популярностью обязан прежде всего возможности сохранения безупречного качества изображения благодаря алгоритмам компрессии данных без потерь ZIP и LZW, которые он реализует.
Сильной же стороной JPEG является высокая степень сжатия, недостижимая при использовании TIFF-ZIP или TIFF-LZW. Правда получается такая высокая степень сжатия ценой потери качества изображения. Потери могут быть незаметны невооружённым взглядом, но, тем не менее, сжатое изображение всегда будет отличаться от исходного. Проще всего искажения в виде цветового шума (так называемые «артефакты сжатия») можно заметить на областях изображения с резкими цветовыми переходами (например, чёткий текст на контрастном фоне), а также на областях с плавным изменением яркости (изображение рассыпается на блоки размеров 8 на 8 пикселов). Чем больше степень сжатия — тем сильнее будут заметны артефакты.
Очевидно, что JPEG нельзя использовать как промежуточный формат при обработке, ретуши изображений, поскольку при каждом сохранении оно всё больше будет отличаться от оригинала. В JPEG допустимо сохранять лишь окончательный вариант, при этом параметр качества не следует опускать ниже 80%.
Еще один формат, незаслуженно нами забытый — JPEG 2000. Стандарт разработан уже достаточно давно, но пока не получил очень широкого распространения. Возможно из-за того, что требует значительных вычислительных ресурсов для компрессии и декомпрессии. В то же время он обладает рядом несомненных преимуществ:
- поддержка сжатия с потерями и без,
- большая эффективность сжатия по сравнению с TIFF (без потерь) и JPEG (с потерями),
- лучшее качество изображения (меньше искажений) по сравнению с JPEG при одинаковой степени сжатия,
- артефакты, появляющиеся на высоких коэффициентах сжатия (1:50 и выше), носят менее явный характер.
По оценкам специалистов из Digital Preservation Coalition (Коалиция цифровой сохранности) JPEG 2000 позволяет достичь степени сжатия 1:2 в режиме без потерь. Для TIFF аналогичный показатель составил 1:1,3–1,5. В режиме с потерями заметные глазу визуальные искажения начинают появляться на степенях сжатия, превышающих 1 к 20–25, что значительно лучше, чем у JPEG.
Вывод, к которому пришли специалисты, состоит в том, что формат JPEG 2000 является большим шагом вперед для архивного сообщества. Среди организаций, использующих JPEG 2000, присутствуют Библиотека Конгресса США, Библиотека и архив Канады, Национальный архив Японии и многие другие.
Если наших читателей заинтересовала тема выбора формата хранения изображений, мы можем провести собственное сравнение эффективности указанных трёх форматов на архивных документах. Кроме того, если вы считаете, что мы упустили какой-либо формат, укажите его в комментариях и мы включим его в исследование.
Форматы хранения изображений: JPEG, TIFF, JPEG-2000,
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 705
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 574
Автор написал: «Векторные [форматы] не подходят однозначно в силу особенностей представления изображений в векторной форме».
Если с тезисом о том, что в настоящее время векторные форматы не слишком подходят для сохранения отсканированных образов документов, можно согласиться, то обоснование его вызывает недоумение. В общем случае, векторные форматы обеспечивают более высокое качество изображения (особенно если в дальнейшем его нужно сильно увеличить/уменьшить), при значительно меньшем размере файла. Так о каких «особенностях представления изображений в векторной форме» автор ведет здесь речь? 🙂
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 705
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 574
Речь идёт о применении форматов для хранения оцифрованных образов документов. Как Вам наверняка известно, изображение в векторной форме описывается с помощью геометрических примитивов: линий, кривых и т.п. Именно эти особенности и имеются в виду.
Представить изображение со сканера (растровое изначально) в такой форме довольно проблематично (в настоящее время), и качество результата оставляет желать лучшего. Впрочем, на тему применимости векторных форматов для представления образов документов можно подискутировать.
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 705
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 574
Получить со сканера вектор уж очень специфичный софт надо пользовать, стандартные программы используемые сканерами к сожалению работают исключительно в растре (по крайней мере с теми сканерами, с которыми я имел дело).
При отсканированных 29+ тысячах дел и суммарном количестве образов ~9 террабайт перегонять все в вектор является более чем безнадежным делом.
Хотя соглашусь, что вектор для размещения образов онлайн наиболее перспективен за счет своей небольшой размерности и возможности к увеличению без потери качества изображения.
На данный момент наиболее распространен все же формат JPEG за счет своей экономичности к ресурсам и размерности. Tiff тоже весьма хорош, но годится по большей части только для ч/б изображений, что с использованием архивной документации не всегда может быть применено.
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 705
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 574
[img]http://breys.ru/upload/jpg_vs_png2.png[/img]
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 705
Warning: count(): Parameter must be an array or an object that implements Countable in /var/www/u0799528/data/www/aiteh.ru/blog/wp-content/plugins/gd-star-rating/code/blg/frontend.php on line 574
Я работаю в области полиграфии. Слышал, что лучше всего в нашей профессии сохранить файлы в формате tiff. правильно с точки-зрения качества. Учитывая то, что проект в дальнейшем будет выдан в офсетную печать. Настолько правдоподобны эти слова?! Благодарю за внимание, и за ответ.