Двоичное кодирование текстовой, графической, звуковой информации


Двоичное кодирование текстовой информации.
Каждому символу, вводимому с клавиатуры, ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертаниям, а компьютер – по их кодам.

Присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. При вводе в компьютер текстовой информации происходит ее двоичное кодирование. Пользователь нажимает на клавиатуре клавишу с символом, а в компьютер поступает его двоичный код (последовательность из восьми электрических импульсов). Код символа хранится в оперативной памяти компьютера, где занимает 1 байт.

При выводе символа на экран происходит обратный процесс – декодирование, т.е. преобразование кода символа в его изображение.

Первые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строки, ввод про­бела и т.д.). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв, поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ-8 («Код обмена информацией 8-битный»). Эта кодировка применяется на компьютерах с операционной системой UNIX.

Наиболее распространенная кодировка- это стандартная кириллическая кодировка Microsoft Windows, обозначаемая сокращением СР1251 («СР» означает «Code Page», «кодовая страница»). Все Windows-приложения, работающие с русским языком, поддерживают эту кодировку.


Комментарии