Главная страницаОбратная связьКарта сайта

Архивация данных и программы сжатия и восстановление файлов и каталогов

Работа с файлами и каталогами
Архивация данных и программы сжатия

Программы-архиваторы можно разделить на три категории.

1.   Программы, используемые для сжатия исполняемых файлов, причем вс.
файлы, которые прошли сжатие, свободно запускаются, но изменение i
содержимого, например русификация, возможны только после ихраза;-
хивации.

2,   Программы, используемые для сжатия мультимедийных файлов, приче
можно после сжатия эти файлы свободно использовать, хотя, как прави­
ло, при сжатии изменяется их формат (внутренняя структура), а иногда
ассоциируемая с ними программа, что может привести к проблемам с з -
пуском.


3. Программы, используемые для сжатия любых видов файлов и каталогов, причем в основном использование сжатых файлов возможно только после разархивации. Хотя имеются программы, которые видят некоторые типы архивов как самые обычные каталоги, но они имеют ряд неприятных нюансов, например, сильно нагружают центральный процессор, что исключает их использование на слабых машинах.

Принцип работы архиваторов основан на поиске в файле избыточной информации и последующем ее кодировании с целью получения минимального объема. Самым известным методом архивации файлов является сжатие последовательностей одинаковых символов. Например, внутри вашего файла находятся последовательности байтов, которые часто повторяются. Вместо того, чтобы хранить каждый байт, фиксируется количество повторяемых символов и их позиция. Например, архивируемый файл занимает 15 байт и состоит из следующих символов:

ВВ В ВВ LLLLLAAAAA

В шестнадцатеричной системе

42 42 42 42 42 4С 4С 4С 4С 4С 41 41 41 41 41

Архиватор может представить этот файл в следующем виде (шестнадцате-ричном):

01 05 42 06 05 4С 0А 05 41

Это значит: с первой позиции пять раз повторяется символ В, с позиции 6 пять раз повторяется символ L и с позиции 11 пять раз повторяется символ А. Для хранения файла в такой форме потребуется всего 9 байт, что на 6 байт меньше исходного.

Описанный метод является простым и очень эффективным способом сжатия файлов. Однако он не обеспечивает большой экономии объема, если обрабатываемый текст содержит небольшое количество последовательностей повторяющихся символов.

Более изощренный метод сжатия данных, используемый в том или ином виде практически любым архиватором, — это так называемый оптимальный префиксный код и, в частности, кодирование символами переменной длины (алгоритм Хаффмана).

Код переменной длины позволяет записывать наиболее часто встречающиеся символы и группы символов всего лишь несколькими битами, в то время как редкие символы и фразы будут записаны более длинными битовыми строками. Например, в любом английском тексте буква Е встречается чаще, чем Z, а X и Q относятся к наименее встречающимся. Таким образом, используя специальную таблицу соответствия, можно закодировать каждую букву Е меньшим числом битов и использовать более длинный код для более редких букв.

Популярные архиваторы ARJ, РАК, PKZIP работают на основе алгоритме Лемпела-Зива. Эти архиваторы классифицируются как адаптивные словарные кодировщики, в которых текстовые строки заменяются указателями на идентичные им строки, встречающиеся ранее в тексте. Например, все слова какой-нибудь книги могут быть представлены в виде номеров страниц и номеров строк некоторого словаря. Важнейшей отличительной чертой этого алгоритма является использование грамматического разбора предшествующего текста с расположением его на фразы, которые записываются в словарь. Указатели позволяют сделать ссылки на любую фразу в окне установленного размера. предшествующего текущей фразе. Если соответствие найдено, текущая фраза заменяется указателем на своего предыдущего двойника.

При архивации, как и при компрессировании, степень сжатия файлов сильно зависит от формата файла. Графические файлы, типа TIF и GIF, уже заранее компрессированы (хотя существует разновидность формата TIFF и без компрессии), и здесь даже самый лучший архиватор мало чего найдет для упаковки. Совсем другая картина наблюдается при архивации текстовых файлов, файлов PostScript, файлов BMP и им подобных.

Восстановление файлов и каталогов

Наиболее важное правило, которое следует знать при восстановлении файлов, — это то, что вы фактически восстанавливаете не сам файл, а доступ к нему. То есть сам файл в большинстве случаев находится на диске в целости и сохранности, только вот вы не можете его ни прочитать, ни скопировать, т. к. отсутствует служебная информация, указывающая на то, где располагается этот файл, и на то, какими характеристиками он обладает. например, размером. То же самое относится и к каталогам.

Если вы потеряли файл при работе в Windows 2000/XP, обратите внимание на то, что рабочий стол у каждого пользователя свой и при копировании на него файлов можно получить эффект их пропажи, если войти в систему пол другим именем.

Любые повреждения делятся на физические и логические. С первыми все понятно — либо работает, либо нет, зато вот со второй разновидностью следует разобраться как следует.

Самый первый сектор занят главной загрузочной записью (MBR, Master Boot Record), которая представляет собой программу, заведующую загрузкой операционной системы после передачи ей управления BIOS. Эта запись стандартна и легко восстановима, например, командой fdisk /mbr.

В конце сектора располагается таблица разделов жесткого диска, в ней содержатся данные о размере, местоположении и назначении разделов. По стандарту их не может быть больше четырех. Нарушение структуры в этой области грозит потерей всех или части разделов. Восстановление возможно при ручном или программном поиске начальных структур разделов.


Файловая система FA T состоит из следующих компонентов: Boot Sector, две копии таблицы FAT, расположенные одна за другой, корневой каталог и область данных.

Нарушение структуры одной из FAT-таблиц не критично, т. к. она может быть восстановлена путем дублирования целой копии на место поврежденной. Если же повреждения коснулись обеих копий, то это уже проблема. Единственное, что может при этом спасти, так это специальные программы, способные искать файлы по остаткам обеих FAT-таблиц.

Корневой каталог является основным и содержит все ссылки на каталоги следующего уровня, а также на файлы, находящиеся в нем. Его повреждение сопровождается появлением странных директорий и файлов. Вероятность восстановления данных при их искажении в нем велика, однако логическая структура директорий, а также многие файлы могут быть потеряны безвозвратно.

Далее располагается область данных, где кроме них находятся еще и каталоги следующего уровня. Их повреждения локальны и при желании легко излечиваются стандартными средствами вроде NDD.

Обсудить статью на форуме


Если прочитаная статья из нашей обширной энциклопедия компьютера - "Архивация данных и программы сжатия и восстановление файлов и каталогов", оказалась полезной или интересной, Вы можете поставить закладку в социальной сети или в своём блоге на данную страницу:

Так же Вы можете задать вопрос по статье через форму обратной связи, в сообщение обязательно указывайте название или ссылку на статью!
   


Copyright © 2008 - 2024 Дискета.info