Алфавитный подход к измерению информации
Алфавитный подход —
это единственный способ измерения информации, который может применяться по отношению к информации, циркулирующей в информационной технике,
в компьютерах.
Алфавит —
это вся совокупность символов, используемых в некотором языке для представления информации.
Мощность алфавита — это число символов в алфавите ( N ).
Например, алфавит десятичной системы счисления – множество цифр- 0,1,2,3,4,5,6,7,8,9.
Мощность этого алфавита – 10.
Компьютерный алфавит , используемый для представления текстов в компьютере, использует 256 символов .
Алфавит двоичной системы кодирования информации имеет всего два символа- 0 и 1.
Алфавиты русского и английского языков имеют различное число букв, их мощности – различны.
Информационный вес символа
При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита.
А каким может быть наименьшее число символов в алфавите?
Двоичным называется алфавит, мощность которого равна 2 .
Информационный вес
1 символа двоичного алфавита принят за единицу информации и
называется 1 бит .
Один символ из четырехсимвольного
алфавита ( N = 4) «весит» 2 бита.
Порядковый номер символа
1
Двузначный двоичный код
2
00
3
01
4
10
11
Комбинацию из нескольких
(двух, трех и т. д.) знаков двоичного алфавита назовем двоичным кодом.
Используя три двоичные цифры, можно составить 8 различных комбинаций.
Порядковый номер символа
1
Трехзначный двоичный код
2
000
3
001
4
010
5
011
6
100
7
101
8
110
111
Найдем зависимость между мощностью алфавита N и
количеством знаков в коде i .
N
2
i
4
1 бит
8
2 бита
16
3 бита
4 бита
Заметим, что 2 = 2 1 , 4 = 2 2 , 8 = 2 3 , 16 = 2 4 .
В общем виде это записывается
следующим образом:
N = 2 i
Информационный вес каждого символа, выраженный в битах ( i ) и мощность алфавита ( N ) связаны между собой формулой:
N = 2 i .
N = 2 i
8=2 i
2 3 =2 i 3= i
N=8
i - ?
Какой объем информации несет
слово «информация»?
32=2 i
2 5 =2 i i = 5 бит – 1 буква
N= 32
K= 10
I- ?
I = K· i I = 1 0 · 5 = 5 0
Ответ: 50 бит
15
ЕДИНИЦЫ ИНФОРМАЦИИ
СИМВОЛЬНЫЙ АЛФАВИТ КОМПЬЮТЕРА
- русские (РУССКИЕ) буквы
- латинские ( LAT ) буквы
- цифры
- математические знаки
- прочие символы
i = 8 бит = 1 байт
N = 256 = 2 8
N = 2 i
1 байт - это информационный вес одного символа компьютерного алфавита
1024 байта
1 килобайт
=
=
1 Кб
=
2 10 байт
2 10 Кб
1024 Кб
1 мегабайт
1 Мб
=
=
=
2 10 Мб
1024 Мб
1 Гб
1 гигабайт
=
=
=
I = K · i ,
I - количество информации в тексте
K – количество символов в тексте
i - информационный вес 1 символа
Найти информационный объем текста, записанного с помощью двоичного алфавита:
1101001011000101110010101101000111010010
содержит 40 символов,
Так как мощность алфавита N=2
2 =2 i 2 1 =2 i 1= i
I = K· i I = 40 · 1= 40 .
Ответ: информационный объем равен 40 битам.
2 i = N
I = K · i
Выполнить в тетради:
- Один символ алфавита «весит» 8 бит, сколько символов в алфавите? И какой объем будет занимать сообщение, состоящее из 7 символов?
- Подсчитать информационный объем слова «компьютер»
- Информационное сообщение объёмом
1,5 Кбайта содержит 3072 символа.
Сколько символов содержит алфавит,
при помощи которого было записано это сообщение?
2. Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой странице записано 256 символов. Какова мощность используемого алфавита?
3. Сколько килобайтов составляет сообщение, содержащее 12288 битов?
РЕШЕНИЕ задачи1
- Надо найти мощность алфавита N.
По условию задачи
I=1,5 Кб=1.5*1024*8=12 288 бит
I=i*k Значит, i=I/k=12 288/ 3072 = 4 бита
Так как N=2 i , то N=2 4 = 16 символов.
ОТВЕТ: 16 символов
- ДНК человека (генетический код) можно представить себе как некоторое слово в четырёхбуквенном алфавите, где каждой буквой помечается звено цепи ДНК, или нуклеотид.
Сколько информации (в битах) содержит ДНК человека, содержащий примерно 1,5*10 23 нуклеотидов?
Ответ:3*10 23 бит
АЛФАВИТНЫЙ ПОДХОД К ИЗМЕРЕНИЮ ИНФОРМАЦИИ
2 i = N
МОЩНОСТЬ АЛФАВИТА
число символов в алфавите (его размер)
N
ИНФОРМАЦИОННЫЙ ВЕС СИМВОЛА
количество информации в одном символе (в битах)
i
ЧИСЛО СИМВОЛОВ В СООБЩЕНИИ
I = K · i
K
КОЛИЧЕСТВО ИНФОРМАЦИИ В СООБЩЕНИИ
I