Kategorie: Wszystkie - вероятность - информация - символы - алфавит

przez Юлия Беспалова 2 lat temu

289

Объёмный подход

Объёмный подход

Формула хартли

Количество возможных событий и количество информации

N=2^i

Количество информации, которое несёт каждый символ

i=log2N N - мощность алфавита

Единицы измерения

Килобайт (Кбайт) = 1024 байт Мегабайт (Мбайт) = 1024 Кбайт Гигабайт (Гбайт) = 1024 Мбайт Терабайт (Тбайт) = 1024 Гбайт Петабайт (Пбайт) = 1024 Тбайт Эксабайт (Эбайт) = 1024 Пбайт Зеттабайт (Збайт) = 1024 Эбайт Йоттабайт (Йбайт) = 1024 Збайт

k - символов

V=K⋅i

V=K⋅log2N

Объёмный подход

Вероятностный подход

Примеры
В корзине лежат 8 черных шаров и 24 белых. Сколько информации несет сообщение о том, что достали черный шар?

N1 = 8 черных шаров N2 = 24 белых шаров N = 8 + 24 = 32 шара всего p = 8/32 = 1/4 вероятность того, что достали черный шар I = log 1/(1/4) = 2 бита

Пусть вероятность выпадения осадков в виде дождя равна 0,5, ветра - 0,25, грозы и молнии - 0,125. Какое количество информации получится при реализации одного из событий?

I = - (0.5 log 0.5 + 0.25 log 0.25 + 0.125 log 0.125) = 1.75 бит

Пусть бри бросании несимметричной четырехгранной пирамидки вероятности отдельных событий равны: p1 = 1/2 p2 = 1/4 p3 = 1/8 p4 = 1/8 Какой количество информации

I = -( 1/2 log 1/2 + 1/4 log 1/4 + 1/8 log 1/8 *2) = 14/8 = 1.75 бит

Формула Шеннона
Формула
Вероятностный подход предполагает, что возможные события имеют различные вероятности реализации.
2^i = 1/p
Вероятность
Вероятностью случайного события (p) называется отношение числа благоприятствующих событию исходов (m) к общему числу исходов (n): p = m/n

случайное событие - событие, которое может произойти или не произойти (например, выигрыш билета в лотерее, извлечение карты определенной масти из колоды карт).

множество исходов испытания - множество всех возможных исходов испытания;

исходы испытаний - результаты испытания (например, при подбрасывании монеты выпал «орел», или из корзины извлекли белый шар);

единичное испытание - испытание, в котором совершается одно действие с одним предметом (например, подбрасывается монетка, или из корзины извлекается шар);

испытание - любой эксперимент;

Содержательный подход

примеры
Шахматная доска состоит из 64 полей: 8 столбцов на 8 строк. Какое количество бит несет сообщение о выборе одного шахматного поля?

Поскольку выбор любой из 64 клеток равновероятен, то количество бит находится из формулы: 2^i =64, i=log2 64 = 6. Следовательно, i=6 бит.

загадали некоторое целое число в определённом диапазоне. Угадывая это число, получили 7 бит информации. Сколько чисел содержит диапазон?

i = 7, 2^i = N, N = 2^7 = 128 чисел

в доме 16 этажей, на каждом этаже по 4 квартиры. Какое количество информации несёт сообщение о том, что Игорь живет на 7-ом этаже в квартире №47?

всего в доме 16*4 = 64 квартиры, т.е. N = 64 i = log2N = log 64 = 6 бит

количество информации, заключенное в сообщении, определяется объемом знаний, который это сообщение несет получающему его человеку. Если сообщение не информативно, то количество информации с точки зрения человека = 0

Алфавитный подход

Примеры задач
В рулетке общее количество лунок равно 128. Какое количество информации мы получаем в зрительном сообщения об остановке шарика в одной из лунок?

N = 128 I = log2N = log128 = 7 бит

Информационное сообщение объемом 1,5 Кб содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?

I = 1,5 Кб = 1,5*1024 = 1536 байта = 1536*8 = 12288 бит i = I/K = 12288/3072 = 4 бита N = 2^i = 2^4 = 16 символов

Одно племя имеет 32-символьный алфавит, а второе племя – 64-символьный алфавит. Вожди племен обменялись письмами. Письмо первого племени содержало 80 символов, а письмо второго племени – 70 символов. Сравните объем информации, содержащийся в письмах.

Первое племя: 2^i = 32, i = 5 бит - количество информации, которое несёт каждый символ, 5*80=400 бит Второе племя: 2^i = 64, i = 6 бит - количество информации, которое несёт каждый символ, 6*70=420 бит Следовательно, письмо второго племени содержит больше информации

Мощность алфавита - количество символов используемых в алфавите
Мощность русского алфавита = 256 (2^8)
Алфавит- множество используемых символов в языке.
1 символ = 8 бит
позволяет определить количество информации, заключенной в тексте, записанном с помощью некоторого алфавита.