СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ

Благодаря готовым учебным материалам для работы в классе и дистанционно

Скидки до 50 % на комплекты
только до

Готовые ключевые этапы урока всегда будут у вас под рукой

Организационный момент

Проверка знаний

Объяснение материала

Закрепление изученного

Итоги урока

Архивация данных. Архиваторы

Категория: Информатика

Нажмите, чтобы узнать подробности

Просмотр содержимого документа
«Архивация данных. Архиваторы»

Муниципальное общеобразовательное учреждение

Львовская школа № 4













ОТКРЫТЫЙ УРОК ПО ИНФОРМАТИКЕ И ИКТ



Тема урока: «Архивация данных. Архиваторы»

8 класс









Учитель: Лукьянова В.А.

























2015 г.



Урок – исследование

Тема: Архивация данных. Архиваторы.

Класс: 8

Цели:

Образовательная:

Знакомство учащихся с понятиями архив, архиваторы, архивные файлы. Познакомить с функциями, методами работы и видами программ-архиваторов. Знакомство учащихся с основными приемами работы при архивации и разархивации объектов.

Развивающаяся:

Формирование и развитие у учащихся познавательных способностей;

Развитие интереса к предмету.

Воспитательная:

Воспитание информационной культуры учащихся.

Программно-дидактическое обеспечение: флипчарт, раздаточный материал.



Ход урока

1.Организационный момент

2.Актуализация знаний

Дополнить:

1

Файл - это:

2

Полное имя файла состоит из:

3

Расширение файла указывает:

4

Какие файлы имеют расширение .txt, .doc

5

Размер файла - это:

6

Папки и файлы можно:

7

Дан полный путь к файлу C:\arhiv\nc\Norton.txt Файл Norton.txt находится в папке:

3.Изучение новой темы.

Постановка проблемной ситуации и объяснение нового материала с использованием презентации «Резервное копирование информации. Архиваторы»

Необходимость использования резервного копирования.

Пусть некоторый пользователь достаточно долго работал над написанием какой-либо работы и эта работа достаточно значима для него, скажем, что это реферат, проект или диплом. И вот он включает компьютер и при запуске системы пользователь видит на экране сообщения Invalid system configuration (неправильная конфигурация системы) или Hard disk failure (жесткий диск вышел из строя). Как показывает практика, такие ситуации достаточно часты.

Вопрос: Почему возникают такие ситуации?
Предполагаемый ответ: Такие ситуации возможны из-за:

  • Скачков электропитания;

  • Некорректной работы некачественных приложений;

  • Вирусных атак;

  • Износа носителей.

Что можно сделать после таких сообщений? Практически ничего.
Что можно было сделать до появления подобных сообщений? Сделать резервную копию важной информации для ее восстановления после сбоев.

Необходимость использования резервного копирования.

Необходимость резервного копирования (архивирования) информации и ее восстановление после сбоев, вирусных атак и поломок аппаратуры – одно из главных условий работы на компьютере.
Рассмотрим следующую ситуацию. На компьютере хранится большой объем редко используемой информации. Помня о знаменитом принципе компьютерщиков «Памяти никогда не бывает много», имеет ли смысл хранить малоиспользуемую информацию на жестком диске? Естественно, нет.
Резервное копирование (архивирование) целесообразно использовать для записи малоиспользуемой информации.
Однако при этом резервные копии занимают столько же места, сколько занимают исходные файлы, и для копирования нужных файлов может потребоваться достаточно большие ресурсы.
Поэтому обычно копированную информацию хранят не в первоначальном виде, а в сжатом для экономии ресурсов накопителей. Можно ли уменьшить объем файла, не теряя содержащуюся в нем информацию? Можно с помощью специальных программ – архиваторов.
И еще один аспект применения архивирования информации. Это ситуации, когда объем информации должен быть уменьшен, например, при переносе информации с одного компьютера на другой (в том числе средствами электронной почты, пересылка большого по объему файла вызывает рост затрат на оплату времени и уменьшает надежность передачи).

  • Необходимость резервного копирования (архивирования) информации и ее восстановление после сбоев, вирусных атак и поломок аппаратуры - одно из главных условий работы на компьютере.

  • Резервное копирование (архивирование) целесообразно использовать для записи малоиспользуемой информации.

  • Резервное копирование (архивирование) используют для уменьшения объема информации.

Архивация - это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле. Архивация данных  - это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.

Сжатие данных (англ. data compression) — алгоритмическое преобразование данных, производимое с целью уменьшения их объёма. Применяется для более рационального использования устройств хранения и передачи данных.

Архивация проводится в следующих случаях:

 Когда необходимо создать резервные копии наиболее ценных  файлов

 Когда необходимо освободить место на диске

 Когда необходимо передать файлы по E-mail

Архивный файл представляет собой набор из нескольких файлов (одного файла), помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде.

Архиваторы – это программы (комплекс программ) выполняющие сжатие и восстановление сжатых файлов в первоначальном виде. Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов – разархивированием. Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия (WinZip 9.0, WinAce 2.5, PowerArchiver 2003 v.8.70, 7Zip 3.13, WinRAR 3.30, WinRAR 3.70 RU).
Другие названия архиваторов: утилиты - упаковщики, программы - упаковщики, служебные программы, позволяющие помещать копии файлов в сжатом виде в архивный файл.
Назовите функции архиваторов.
Основными характеристиками архиваторов являются:

  • степень сжатия или отношение объемов исходного и результирующего файлов;

  • скорость сжатия – время, затрачиваемое на сжатие некоторого объема информации.

Виды архиваторов.

Весь спектр существующих сегодня архиваторов можно разделить на две группы:

  • файловые;

  • дисковые.

Файловые архиваторы: ZIP, ARJ,LHARC, LHA, ICE, AIN, RAR, РАК, ZOO, EXPAND.
Такие архиваторы позволяют упаковывать один или несколько файлов в единый архивный файл.

Дисковые архиваторы позволяют программным способом увеличить дисковое пространство на (Microsoft Backup, Norton Ghost, PowerQuest Drive Image).
Принцип работы: формируется единый сжатый файл, в котором содержится образ диска. Затем этот файл записывается на сменный носитель либо в отдельный раздел того же жесткого диска. Впоследствии программа может восстановить образ диска на том же или на другом накопителе.

Давайте рассмотрим какие же алгоритмы используются архиваторами для уменьшения объема информации.

Сжатие основано на устранении избыточности, содержащейся в исходных данных.

Рассмотрим два метода архивирования: метод замены одинаковых последовательностей (на примере сжатия текстовых, числовых и графических данных) и метод удаления избыточной информации (на примере сжатия графического формата JPEG и оцифрованных видеозаписей).

Метод замены одинаковых последовательностей. Отступление 1.

Пример 1: стенографистка заменяет при записи какой-либо информации большинство общеупотребительных слов условными значками. Это самый простой метод архивирования информации.
Приведите свои примеры использования обозначений для сжатия информации (смайлики, математические обозначения).

Метод замены одинаковых последовательностей.

Пример 2: сожмем фразу: КОЛ_ОКОЛО_КОЛОКОЛА
Оцените размер фразы до сжатия: 18 байт
Проанализируем текст и заменим совпадающие участки данных специальным символом, например *.
*_О*О_*О*А
Оценим размер фразы после применения алгоритма сжатия: 10 байт
НО: к сжатому файлу прибавляется информация о кодировке последовательности символов КОЛ специальным символом *.

Метод замены одинаковых последовательностей.

Вопрос: каков алгоритм сжатия текстового файла?
Предполагаемый ответ: алгоритм состоит в поиске совпадающих участков данных и последующей их заменой специальными символами.

Задание №1. Заархивируйте фразу и оцените ее размер до и после сжатия:
КЛАРА_У_КАРЛА_УКРАЛА_КОРАЛЛЫ,_ КАРЛ_У_КЛАРЫ_УКРАЛ_КЛАРНЕТ

Метод замены одинаковых последовательностей

Пример 3. Предположим, что мы имеем строку текста, в конце строки стоит 40 пробелов. Налицо явная избыточность имеющейся информации. Решим проблему сжатия этой строки.
Решение: 40 пробелов (40 байт) сжимаются в 2 байта с помощью упаковки их по методу повторяющихся символов. Первый байт, стоящий вместо 40 пробелов в сжатой строке, фактически будет являться пробелом, (последовательность была из пробелов). Второй байт – байт счета (в нашем случае – 40).
Суть методов данного подхода состоит в замене цепочек или серий повторяющихся байтов или их последовательностей на один кодирующий байт и счетчик числа их повторений.

Задание №2:

Пример 4. Заархивируйте числовую последовательность как последовательность из повторяющихся байтов с использованием счетчика числа их повторений:

33        33        33        11        11        11        11        11        10

Таким образом, метод сжатия заменой одинаковых последовательностей  изменяет только способ представления входных данных, приводя их к форме, которая более компактно кодируется и является методом сжатия без потерь, поскольку исходные данные из сжатого массива восстанавливаются достаточно точно.
Характерные форматы файлов, хранящих сжатую без потерь информацию, являются:

  • GIF, TIF, PCX, PNG – для графических данных;

  • AVI – для видеоданных;

  • ZIP, ARJ, RAR, CAB – для любых типов данных.

Метод замены одинаковых последовательностей. Принцип сжатия графического формата PCX.

Пусть исходный файл представляет собой некоторый рисунок на одноцветном фоне.
Цвет каждой точки рисунка закодирован некоторым числом, причем в файле эти числа записаны подряд одно за другим в виде построчной развертки рисунка. Для многих участков такая запись будет содержать достаточно длинные последовательности одинаковых байтов. Для уменьшения размера заменяются с помощью архиватора подобные последовательности всего двумя байтами, первый из которых представляет собой тот самый повторяющийся байт-образец, а второй – количество одинаковых байтов в последовательности.
При разархивации программа считает информацию из закодированного файла и повторит байт образец нужное количество раз.

Метод удаления избыточной информации. Отступление 2.

Характерной особенностью большинства «классических» типов информации, с которыми работают люди, является их избыточность.

Пример 1. В русском языке существуют слова, однозначно прочитываемые в случае «потери» некоторых букв.
Например, Т_ТР_ДЬ, КВАД_Т,  Д_Р_ВО. Кроме того, имея текст на русском языке с «потерянными» буквами, человек, достаточно хорошо владеющий русским языком, может однозначно восстановить его. Например, вы без труда прочитаете предложение с пропущенными буквами:
Дм_т_ий Ива_ов__Менд_ле_в – в_л_ки__рус_кий_х_мик.
Таким образом, для носителя языка обычный связный текст на его родном языке содержит избыточную информацию – ее можно удалить, но смысл текста для него сохранится.
Были проведены исследования, которые установили, что избыточность литературного английского языка составляет около 50%. Это означает, что если в английском тексте стереть наугад около половины букв, то по оставшимся буквам человек, знающий английский язык, почти наверняка сможет восстановить текст. Избыточность языка выполняет очень важную функцию – обеспечивает человеку надежность ее восприятия, особенно в неблагоприятных условиях (просмотр телепередач при наличии помех, чтение текстов в условиях недостаточной освещенности, разговор в вагоне метро и т.п.)
Степень избыточности зависит от типа информации: у видеоинформации она в несколько раз больше, чем у графической, а степень избыточности последней в несколько раз больше, чем текстовой. Как оказалось, для аудио- и видеоинформации абсолютно точное восстановление необязательно. Например, в ходе исследований, было установлено, что глаз человека наиболее чувствителен к зеленому цвету, чувствительность к красному ниже примерно в 4 раза, а к синему – почти в 10 раз! Это означает, что на хранение красной и синей составляющих цвета можно отводить меньше битов, а не кодировать цветовые компоненты одинаковым количеством бит.

Метод удаления избыточной информации

Характерной особенностью методов сжатия аудио- и видеоинформации является возможность удаления маловажной (для человеческого восприятия) информации. Поэтому такие алгоритмы сжатия называют алгоритмами с регулируемой потерей информации.
Наиболее известными методами сжатия с регулируемой потерей информации являются:

  • JPEG – метод сжатия графических данных;

  • MP3– метод сжатия звуковых данных;

  • MPEG– метод сжатия видеоданных;

Поэтому существуют методы выделения во входных данных той части, которой можно пренебречь, после чего оставшиеся существенные данные подвергаются дальнейшему сжатию.

Принцип сжатия графического формата JPEG (метод удаления избыточной информации и метод различий)

Рисунок раскладывается на отдельные строки пикселов. Затем в каждой второй строке и в каждом втором столбце матрицы пикселей информация о красном и синем цветовых компонентах просто удаляется.
Первая строка записывается в файл целиком, вторая сравнивается с первой, и в файл записывается только информация о различиях между ними. Все строки последовательно сравниваются с предыдущими.
Формат JPEG способен упаковывать графические изображения в несколько десятков раз, при этом потери качества становятся заметными только при очень высоких коэффициентах сжатия.

Принцип сжатия видеозаписей

При упаковки оцифрованных видеозаписей так же используют метод различий. Каждый кадр – многоцветный рисунок, и в каждой секунде видеозаписи 24 таких кадра. В одном и том же сюжете различие между изображениями на соседних кадрах очень небольшое, а то и вовсе отсутствует. Следовательно, достаточно записывать в файл целиком только первые кадры каждого нового сюжета, а вместо всех последующих кадров сохранять информацию только о смещении заснятых предметов.

4. Исследование эффективности сжатия файлов различных форматов

Сейчас я предлагаю вам провести самостоятельное исследование эффективности сжатия файлов различных форматов. С помощью знакомой нам уже программы Калькулятор мы можем оценить степень сжатия файлов. Для этого мы выполним следующие действия: заархивируем файл и узнаем его объем. Обозначим его как Vа. Узнаем, сколько байт занимал наш файл до архивации. Этот объем обозначим как V. Степень сжатия файла обозначим за Rсж. Произведем расчеты по формуле:

100-Vа*100%/V= Rсж

Проведем сравнительный анализ степени сжатия файлов.

Запишите вывод

5.Домашнее задание

Задания

  1. Заархивируйте текст: Теоретически теория и практика есть одно и то же, практически – нет.

Какой метод архивирования вы использовали? Сравните размер фразы до и после сжатия.

  1. Заархивируйте последовательность чисел:

44        44        44        11        11        11        11        11        01        33        FF       22        22

Какой метод архивирования вы использовали? Сравните размер последовательности до и после сжатия.




Скачать

Рекомендуем курсы ПК и ППК для учителей

Вебинар для учителей

Свидетельство об участии БЕСПЛАТНО!