Кодирование информации


Кодирование и измерение информации.

Информация играет в жизни современного человека важную роль. Она возникает в результате деятельности человека и оказывает влияние на последующую его деятельность.

Информация нужна и различным техническим устройствам, для того, чтобы точно и правильно выполнять требуемую человеком работу. Технические устройства окружают человека дома и на работе. Для правильной работы автоматического устройства, необходимо, чтобы оно реагировало на внешние условия, т. е. использовало информацию, получаемую от человека и окружающей среды. Автоматическое устройство должно уметь фиксировать информацию.

Одним из способов фиксации информации, является представление ее в символьном виде. Появление символьной формы представления информации связано с формированием человеческой речи. В ходе развития человека сформировалась идея алфавита - некоторого фиксированного набора знаков, из которого можно составить как угодно много слов. Алфавит лежит в основе каждого языка.

Если общение происходит между человеком и автоматическим устройством (например, компьютером), необходимо выработать систему условных знаков для передачи, обработки и хранения информации.

Кодирование информации - это процесс формирования определенного представления информации. При кодировании информация представляется в виде дискретных данных. Декодирование является обратным к кодированию процессом.

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации.

Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов. Знаки или символы любой природы, из которых конструируются информационные сообщения, называют кодами. Полный набор кодов составляет алфавит кодирования.

Простейшим алфавитом, достаточным для записи информации о чем-либо, является алфавит из двух символов, описывающих два его альтернативных состояния ("да" - "нет", "+" - "-", 0 или 1).

Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

Преимущества двоичного кода:
  • возможность автоматической обработки информации при помощи технических устройств с двумя состояниями;
  • представление информации двумя состояниями очень надежно;
  • операции над двоичными кодами гораздо проще, чем над десятичными;
  • появляется возможность использовать аппарат логики (ложь - 0, истина - 1).
Компьютер с точки зрения пользователя работает с информацией самой различной формы представления: числовой, графической, звуковой, текстовой и пр. Но мы уже знаем (упоминалось выше), что он оперирует только цифровой (дискретной) информацией. Значит, должны существовать способы перевода информации из внешнего вида, удобного пользователю, во внутреннее представление, удобное компьютеру, и обратно.

Язык как способ представления символьной информации.

Обсуждая проблему восприятия человеком информации из внешнего мира, нужно обратить внимание учеников на то, что человек обладает множеством каналов, по которым в его мозг (память) поступает информация. Эти каналы - наши органы чувств. Их пять: зрение, слух, вкус, обоняние, осязание. Информацию, с которой имеет дело человек можно разделить на два вида: на символьную и образнуюК символьной относится информация, воспринимаемая человеком в речевой или письменной (знаковой) форме. Все ос­тальное, не относящееся к этому, будем называть образной ин­формацией. Образная информация  это сохраненные в памяти ощущения человека от контакта с источником; она воспринимается всеми органами чувств человека.

Язык — это определенная система символьного представления информации. Языки делятся на две группы: естественные и формальные.

Есте­ственные языки — это исторически сложившиеся языки нацио­нальной речи. Для большинства современных языков характерно наличие устной и письменной речи. 

Формальные языки — это искусственно созданные языки для профессионального применения. Они, как правило, носят международный характер и имеют письменную форму. Для формальных языков характерна принадлежность к ограниченной предметной области (математика, химия, музыка и пр.). Назначение формального языка — адекватное описание системы понятий и отношений, свойственных для данной предметной области. С любым языком связаны следующие понятия: алфавит — множество используемых символов; синтаксис — правила записи язы­ковых конструкций (текста на языке); семантика — смысловая сторона языковых конструкций; прагматика — практические по­следствия применения текста на данном языке.

Информацию, циркулирующую в компьютере, можно разделить на два вида: обрабатываемая информация (данные) и ин­формация, управляющая работой компьютера (команды, программы, операторы). Информацию, представленную в форме, пригодной для хране­нии, передачи и обработки компьютером принято называть данны­миСпособ представления данных в компьютере называется языком представления данных.

Для каждого типа данных различается внешнее и внутреннее представление данных. Внешнее представление ориентировано на человека, определяет вид данных на устройствах вывода: на экране, на распечатке. Внутреннее представление — это представление на носителях информации в компьютере, т.е. в памяти, в линиях передачи информации.

В самом общем смысле можно сказать, что языком представления данных в компьютере является язык двоичных кодовОднако с точки зрения приведенных выше свойств, которыми должен обладать всякий язык, нельзя говорить об одном общем языке двоичных кодов. Общим в нем является лишь двоичный алфавит: 0 и 1. Но для различных типов данных различаются правила синтаксиса и семантики языка внутреннего представления. Одна и та же последовательность двоичных цифр для разных типов данных имеет совсем разный смысл. Например, двоичный код «0100000100101011» на языке предъявления целых чисел обозначает десятичное число 16683, а на языке представления символьных данных обозначает два символа «А+». Таким образом, для разных типов данных используются разные языки внутреннего представления.

Языки внешнего представления данных обычно приближены к привычной для человека форме: числа представляются в десятичной системе, при записи текстов используются алфавиты естественных языков, традиционная математическая символика.
Внутренним языком представления действий над данными (язы­ком управления работой компьютера) является командный язык процессора компьютераК внешним языкам представления действий над манными относятся языки программирования высокого уровня, вход­ные языки пакетов прикладных программ, командные языки опера­ционных систем, языки манипулирования данными в СУБД и пр.

Комментарии