Чему равен вес одного символа

Чему равен вес одного символа

Информационный объем текста складывается из информационных весов составляющих его символов.

Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется всего два символа 0 и 1. Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).

Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц — машинным языком.

Какой длины должен быть двоичный код, чтобы с его помощью можно было закодировать васе символы клавиатуры компьютера?

Достаточный алфавит

В алфавит мощностью 256 символов можно поместить практически все символы, которые есть на клавиатуре. Такой алфавит называется достаточным.

Т.к. 256 = 2 8 , то вес 1 символа – 8 бит.

Единице в 8 бит присвоили свое название — байт.

1 байт = 8 бит.

Таким образом, информационный вес одного символа достаточного алфавита равен 1 байту.

Для измерения больших информационных объемов используются более крупные единицы измерения информации:

Единицы измерения количества информации:

1 килобайт = 1 Кб = 1024 байта

1 мегабайт = 1 Мб = 1024 Кб

1 гигабайт = 1 Гб = 1024 Гб

Информационный объем текста

Книга содержит 150 страниц.
На каждой странице — 40 строк.
В каждой строке 60 символов (включая пробелы).
Найти информационный объем текста.

1. Количество символов в книге:

60 * 40 * 150 = 360 000 символов.

2. Т.к. 1 символ весит 1 байт, информационный объем книги равен

3. Переведем байты в более крупные единицы:

360 000 / 1024 = 351,56 Кб

351,56 / 1024 = 0,34 Мб

Ответ: Информационный объем текста 0,34 Мб.

Задача:

Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кб. Сколько символов содержит этот текст?

Информационный объем текста 3,5 Мб. Найти количество символов в тексте.

1. Переведем объем из Мб в байты:

3,5 Мб * 1024 = 3584 Кб

3584 Кб * 1024 = 3 670 016 байт

2. Т.к. 1 символ весит 1 байт, количество символов в тексте равно

Ответы на вопрос

Один символ занимает:
байт = 4 бит
(1,5 Кбайт = байт)
Мощность алфавита N (или количество символов в алфавите) равно
ответ: 16 символов содержит алфавит.

1,5 Кбайта=1,5 * 1024 байта = 1,5 * 1024 *8 бит = 12288 бит
12288/3072 = 4 бита — на один символ

Читайте также:  Как восстановить удаленные файлы с гугл диска

Значит N=2^4 = 16 символов в алфавите.

ответ: 16 символов

1) X1*X1=X1 (закон повторения). Имеем:

2) Раскрываем скобки:

3) X1*X3+X1*X3=X1*X3 (a+a=a — тот же закон повторения, только для сложения). Применяем и имеем:

4) Х1*Х2+Х2=X2 (правило склеивания). Имеем:

Решено. Все законы нетрудно проверить подставляя 0 или 1

Nav view search

Навигация

Искать

Новости

Учебники

Как пользоваться:

Счетчики

Сайт участвует

Подробности Опубликовано 07.02.2012 18:19 Просмотров: 22304

§4.Измерение информации

О сновные темы параграфа;

алфавитный подход к измерению и нформации;

информационный вес сим вола;

информационный объем текста и единицы информаци и.

А теперь обсудим вопрос о том, как можно измерять ин­формацию, Существует несколько подходов к измерению ин­формаци и. Здесь мы рассмотрим только один , который назы­вается алфавитным подходом .

Алфавитный подход к измерению информации

Вам хорошо известно, что для измерения таких величин, как, например, расстояние, масса, время, существуют эта­лонные единицы . Для расстояния — это метр, для массы — килограмм, для времени — секунда . Измерение происходит путем сопоставления измеряемой величины с эталонной еди­ницей, Сколько раз эталонная единица укладывается в изме­ряемой велич ине, таков и резуль тат измерения. Следова ­тельно, и для измерения информации должна быть введена своя эталонная единица.

Алфавитный подход позволяет измерять информацион­ный объем текста на некотором языке (естественн ом или формальном), не связанный с содержанием этого текста.

Алфавит . М ощность алфавита

Под алфавитом мы будем понимать набор букв, знаков препинания , цифр , скобок и др . символов, используемых в тексте. В алфавит также следует включить и пробел, т . е. пропуск между словами.

Полное число символов в алфавите принято называть мощностью алфавит а . Будем обозначать эту величину бук ­вой N. Например , мощность алфавита из русских букв и от­меченных дополнит ельных символов равна 54: 33 буквы + 10 цифр + 11 знаков препинания, скобки , пробел .

И нформацион ный вес символа

При алфавитном подходе считается, что каждый символ текста имеет определенный и н фор м ационны й ве с, Информа­ционный вес символа зависит от мощности алфавита . А ка­ким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете , что такой алфавит ис­пользуется в компьютере . Он содержит всего 2 символа, ко ­торые обозначаются цифрами «0» и «1». Его называют дво­ичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно пред­ставить любую информаци ю.

Читайте также:  Упс что это такое расшифровка

Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.

С увеличением мощности алфавита увеличивается инфор­мационный вес символов этого алфавита . Так один символ из четырех символь ного алфавита (N = 4) «весит » 2 бита. Объяс­нение этому можно дать следующее: все символы такого ал­фавита можно закодировать всеми возможными комбинаци­ями из двух цифр двоичного алфавита. Комбинацию из не­скольких (двух , трех и т. д .) знаков двоичного алфавита назовем двоичным кодом.

Используя три двоичные цифры, можно составить 8 раз­личных комбинаций .

Следовательн о , если мощность алфавита равна 8 , то ин ­ формационный вес одного символа равен 3 битам .

Четырехзначным двоичным кодом может быть закодиро­ван каждый символ из 1 6-символьного алфавита. И так далее .

Найдем зависимость между мощностью алфавита ( N) и количеством знаков в коде (b) — разрядностью двоичного кода.

Разрядность двоичного кода — это и есть информацион­ный вес символа.

Информационный вес каждого символа, выраженный в битах ( b ) , и мощность алфавита (N) связаны между собой формулой: N= 2 b .

Информационный объем текста складывается из информа­ционных весов составляющих его символо в. На п ример, следу­ющий текс т, записанный с помощью двоичного алфави т а:

110100101100010111001010 1 101000111010010

содержит 40 символов , следовательно, его информационный объем равен 40 битам .

Сегодня для подготовки текстовых документов чаще всего применяются компьютеры. Алфавит , из которого составля­ется такой « компьютерный текст , содержит 25 6 символов. В алфавит такого размера можно поместить все практически необходимые символы: строчные и прописные латинские и русские буквы , цифры, знаки арифметических операций, всевозможные скобк и, знаки препинания и пр.

Поскольку 256 = 2 8 , то один символ компьютерного алфа­ в ита «в есит » 8 битов . Причем 8 битов информации — это на­столько характерная величина, что ей даже присвоили свое название — байт .

Легко подсчитать информационный объем текста , если известно, что информационный вес одного символа равен 1 байту . Надо просто сосчитать число символов в тексте. По­лученное значение и будет информационным объемом тек­ста, выраженным в байтах .

Читайте также:  Доверенность на смену сим карты мтс

Например, небольшая книжка , подготовленная с помо­щью компьютера , содержит 150 страниц. На каждой страни ­це — 40 строк, в каждой строке — 60 символов (включая пробелы между словами) . Значит, страница содержит 40 х 60 = 2400 байтов информации . Для вычисления инфор­мационного объема всей книги нужно полученную величину умножить на число страниц;

2400 байтов * 150 = 360 000 байтов.

Уже на таком примере видно, что байт — «мелкая » еди­ница. А представьте, если нужн о, например , измерить ин­формационный объем целой библиотеки? В байтах это ока­жется громадным числом!

Для измерения больших информационных объемов ис­пользуются более крупные единицы:

Следовательно, информационный объем вышеупомянутой книги равен приблизительно 360 килобайтам. А если посчи­тать точнее, то получится:

360000/1024 = 351,5625 Кб.

351,5625/1024 = 0,34332275 Мб.

В заключение еще раз обратим внимание на важное свойст­во рассмотренного здесь алфавитного подхода. При е го ис­пользовании содержательная сторона текста в учет не берет­ся. Текст » состоящий из бессмысленного сочетания символов, будет иметь ненулевой информационный объе м.

Коротко о главно м

Алфавитный подход — это способ измерения информаци ­онного объема текста , не связанного с его содержанием .

Алфавит — это вся совокупность символо в, используемых в некотором языке для представления информации. Мощ­ность алфавита — это число символов в нем .

1 бит — информационный вес одного символа двух символьного алфавита (N = 2).

Информационный вес символа (разрядность двоичного кода) (b) и мощность алфавита (N) связаны формулой: N = 2

Информационный объем текста равен сумме информаци­онных весов всех символов, составляющих текст .

1 байт — информационный вес символа и з алфавита мощ­ностью 2 8 = 256 символов. 1 байт — 8 бито в.

Ба йт, килобайт , мегабайт, гигабай т — единицы измере­ния информации. Каждая следующая единица больше пре ­дыдущей в 1024 (2 10 ) раза .

Вопросы и задания

Чему вы должны научиться , изучив главу 1

Разл ичать декларативные и процедурные знания . Называть виды информационных процессов. Определять информационный объем текста . Переводить количество информации из одних единиц в другие.

Ссылка на основную публикацию
Чем открыть файл с расширением dat
После установки каких-нибудь программ, получения почты при помощи почтовых клиентов, на компьютере создаются .dat файлы. Чаще всего они почти не...
Фото с листком для вк
Сигна в ВК – это просто фотография человека с листком бумаги, на котором обычно написано чье-то имя. Часто надписи делают...
Фото спортивных мужчин 40 лет
17. Джерард Батлер, 48 лет (kinopoisk) «Законопослушный гражданин» Джерард Батлер когда-то работал официантом, демонстратором игрушек и даже юристом. Он также...
Чем отличается frontend от backend
Переводы , 13 апреля 2017 в 19:58 Мая Устинова Вы наверняка уже слышали эти модные в сфере программирования слова «фронтенд»...
Adblock detector