Человек, никогда не совершавший ошибок, никогда не пробовал ничего нового.
А. Эйнштейн

Кодирование текстовой информации.

Информация, выраженная в письменной форме, называется текстовой.

Для кодирования всех вариантов, расположенных на клавиатуре достаточно 256 комбинаций. Из формулы: N=2i (N – мощность алфавита, i – кол-во информации одного варианта), можно вычислить кол-во бит одного варианта.

N = 256 => 256 = 2i => 256 = 28 => i = 8 битов = 1 байт.

При вводе текстовой информации в компьютер происходит её двоичное кодирование. Пользователь нажимает клавишу с символом, и в компьютер поступает определённая последовательность из восьми электрических импульсов (двоичный код символа).

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange - Американский стандартный код для информационного обмена), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Вторая половина символов от 128 до 255 отводится под символы национальных алфавитов (русский, немецкий, французский и т.п.) в зависимости от страны.

Долгое время в мире существовало пять различных кодировок кириллицы (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

С конца 90-х годов XX века проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Домашнее задание:

  1. В одной из кодировок Unicode каждый символ кодируется 16 битами. Определите размер следующего предложения в данной кодировке.

Я к вам пишу – чего же боле? Что я могу ещё сказать?

  1. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 640 бит. Какова длина сообщения в символах?

Решения и ответы, в любом из электронных вариантов (текст, рисунок, фото), можно передать по любому из предложенных вариантов: