Please enable JavaScript.
Coggle requires JavaScript to display documents.
Сжатие данных. Хранение и резервное копирование данных - Coggle Diagram
Сжатие данных. Хранение и резервное копирование данных
сжатие данных
процедура перекодирования
данных с целью уменьшения их объема
применение
хранение и пересылка
уменьшение объема
объекты сжатия
данные
устранение избыточности
изменение данных
документы
архивация
файлов
для подготовки к передаче через сети
для хранения на внешнем носителе
малой вместимости
архивация
папок
для сжатия данных перед длительным хранением
(при резервном копировании)
для оптимизации пересылки
архивация
дисков
повышение эффективности использования
рабочего пространства
применяется к дискам
недостаточной емкости
алгоритмы сжатия
RLE
(эффективен для графики, с англ. Run-Length encoding- кодирование повторов или длин серий)
выявление повторяющихся последовательностей данных и замена их простой структурой, в которой указывается код данных и коэффициент повтора
Keyword Encoding
(эффективен для длинных английских текстов и баз данных)
кодирование с ключевыми словами: кодирование лексических единиц (слов) исходного документа группами байтов фиксированной длины, результат которого сводится в прилагаемую таблицу-словарь; для англоязычных текстов обычно используют двухбайтное кодирование слов, а получаемые пары байтов называют токенами.
алгоритм Хаффмана
кодирование не байтами, а битовыми группами:
перед началом кодирования проводится частотный анализ кода документа
для чаще встречающихся символов задается меньшее количество битов кода
полученная иерархическая таблица соответствия прикладывается к сжатому документу
алгоритм Шеннона — Фано
один из первых алгоритмов сжатия, сходен с алгоритмом Хаффмана, который появился позже и является логическим продолжением алгоритма Шеннона.
Алгоритм использует коды переменной длины: часто встречающийся символ кодируется кодом меньшей длины, редко встречающийся — кодом большей длины. Коды Шеннона — Фано — беспрефиксные, то есть никакое кодовое слово не является префиксом любого другого. Это свойство позволяет однозначно декодировать любую последовательность кодовых слов.
программы
диспетчеры архивов
функции
создание новых архивов
добавление файлов
в существующий архив
создание самораспаковывающихся архивов
создание распределенных архивов
на носителях малой вместимости
тестирование целостности структуры архивов
полное или частичное восстановление
поврежденных архивов
защита архивов от просмотра
и несанкционированной модификации
извлечение
(разархивирование)
примеры
7-zip
WinRAR
WinZip
HaoZip
Zipeg
коэффициент сжатия
основная характеристика алгоритма сжатия, отношение объёма исходных несжатых данных к объёму сжатых:
k = So/Sc, где
k — коэффициент сжатия,
So — объём исходных данных, а
Sc — объём сжатых
виды сжатия данных
с потерями
используют, когда целостность данных
не очень существенна
аудиоданные
формат .MP3
видеоданные
формат .MPG
прогнозирование движения:
"экономия" на неподвижных областях
битрейт (частота дискретизации)
частота кадров
тип развертки
(прогрессивная, чересстрочная)
разрешающая способность
цветовая разрядность
графические данные
формат .JPG
без потерь
применяют при сжатии
текстовых и числовых данных, а также когда важна их целостность
графические данные
форматы .GIF, .TIF, .PCX и др
видеоданные
.AVI
другие
.ZIP, RJ, .RAR, .LZH, .LH, .CAB и др.
способы
уменьшения избыточности
изменение содержания данных
необратимы
с регулируемой потерей информации
изменение структуры данных
обратимы
восстанавливаются
применением обратного алгоритма
изменение содержания
и структуры данных.
резервное копирование (backup)
процесс создания копии данных на носителе, предназначенном для восстановления данных в оригинальном месте их расположения в случае их повреждения или разрушения, соответствующими программами - резервными дубликаторами данных
требования
к системе
резервного копирования
надежность хранения
информации
обеспечивается использованием отказоустойчивого оборудования систем хранения, дублированием информации и заменой потерянной копии другой в случае уничтожения одной из копий (в том числе как часть отказоустойчивости).
простота в эксплуатации
- автоматизация (по возможности минимизировать участие человека: как пользователя, так и администратора).
быстрое внедрение
- простота установки и настройки программ, быстрое обучение пользователей.
виды
резервного копирования
полное резервирование
(Full backup)
обычно затрагивает всю систему и все файлы; следует проводить хотя бы раз в, неделю.
дифференциальное резервирование
(Differential backup).
каждый файл, который был изменен с момента последнего полного резервирования, копируется заново
дополнительное резервирование
(Incremental backup)
копирование только тех файлов, которые были изменены с тех пор, как в последний раз выполнялось полное или дополнительное резервное копирование.
пофайловый метод
система пофайлового резервирования опрашивает каждый индивидуальный файл и записывает его на носитель; всегда следует использовать предлагаемую опцию верификации.
блочное инкрементальное копирование
(Block level incremental).
хранение
резервной копии
«Облачный» бэкап
DVD или CD
HDD
LAN
FTP
USB