Двоичное кодирование текстовой
информации.
Каждому символу, вводимому с клавиатуры, ставится в соответствие уникальный десятичный код от 0 до 255 или
соответствующий ему двоичный код от 00000000 до 11111111. Таким образом,
человек различает символы по их начертаниям, а компьютер – по их кодам.
Присвоение символу конкретного кода – это вопрос
соглашения, которое фиксируется в кодовой таблице. При вводе в компьютер текстовой информации происходит
ее двоичное кодирование. Пользователь нажимает на клавиатуре клавишу с
символом, а в компьютер поступает его двоичный код (последовательность из
восьми электрических импульсов). Код символа хранится в оперативной памяти
компьютера, где занимает 1 байт.
При выводе символа на экран происходит обратный процесс
– декодирование, т.е. преобразование кода символа в его изображение.
Первые 33 кода (с 0 по 32)
соответствуют не символам, а операциям (перевод строки, ввод пробела и т.д.).
Коды с 33 по 127 являются интернациональными и соответствуют символам
латинского алфавита, цифрам, знакам арифметических операций и знакам
препинания.
Коды с 128 по 255 являются
национальными, т.е. в национальных кодировках одному и тому же коду
соответствуют различные символы. К сожалению, в настоящее время существуют пять
различных кодовых таблиц для русских букв, поэтому тексты, созданные в одной кодировке,
не будут правильно отображаться в другой.
Хронологически одним из первых
стандартов кодирования русских букв на компьютерах был код КОИ-8 («Код обмена
информацией 8-битный»). Эта кодировка применяется на компьютерах с операционной
системой UNIX.
Наиболее распространенная
кодировка- это стандартная кириллическая кодировка Microsoft Windows,
обозначаемая сокращением СР1251 («СР» означает «Code Page», «кодовая
страница»). Все Windows-приложения, работающие с русским языком, поддерживают
эту кодировку.
Комментарии
Отправить комментарий