Кодирование чисел, символов и графической информации, единицы измерения данных

Автор работы: Пользователь скрыл имя, 14 Мая 2012 в 23:41, реферат

Описание

Любой способ кодирования характеризуется наличием основы (алфавит, спектр цветности, система координат, основание системы счисления…) и правил конструирования информационных образов на этой основе.

Содержание

Кодирование чисел, символов и графической информации, единицы измерения
1.1Кодирование чисел. Системы счисления
1.2. Перевод целых чисел из системы счисления с основанием k в десятичную систему счисления
1.3. Двоичная система счисления
1.4. Перевод целых чисел из десятичной системы счисления в систему счисления с другим основанием
1.5. Шестнадцатеричная система счисления
1.6. Вавилонская (шестидесятеричная) система счисления
1.7. Кодирование двоичным кодом
1.8. Кодирование символов. Байт.
1.9. Единицы измерения объема данных и ёмкости памяти: килобайты, мегабайты, гигабайты…
1.10. Кодирование графической информации

Практическое задание №2

Практическое задание №3

Список литературы

Работа состоит из  1 файл

информат готов.docx

— 195.36 Кб (Скачать документ)

Таблица 5.

 Для шестнадцатеричной  системы счисления действуют  те же правила перевода, что  и для всякой позиционной системы счисления.

                                               

Рис. 5а. Перевод из СС                   Рис. 5b. Перевод из СС с основанием           с основанием 16 в СС с основанием 10.         10 в СС с основанием 16. 

1.7. Кодирование двоичным кодом

Информация любого типа: символьная, графическая, звуковая, командная для представления  на электронных носителях кодируется на основании алфавита, состоящего только из двух символов (0, 1). Информация представленная в аналоговом виде, для того, чтобы быть сохраненной в электронной памяти,  оцифровывается и приводится к двоичному коду.  

Каждая ячейка электронной памяти обладает информационной ёмкостью 1 бит. Физически, в зависимости  от способа регистрации информации, это может быть конденсатор, находящийся  в одном из двух состояний: разряжен (0), заряжен (1); элемент магнитного носителя: размагничен (0), намагничен (1); элемент  поверхности оптического диска: нет лунки (0), есть лунка (1). Одним  из первых носителей информации, представленной в двоичном коде, была бумажная перфокарта, пробитое отверстие на которой означало 1, а цельная поверхность 0.  

1.8. Кодирование символов. Байт. 

 На основании  одной ячейки информационной  ёмкостью 1 бит можно закодировать  только 2 различных состояния. Для  того чтобы каждый символ, который  можно ввести с клавиатуры  в латинском регистре, получил  свой уникальный двоичный код,  требуется 7 бит. На основании  последовательности из 7 бит, в  соответствии с формулой Хартли, может быть получено N=27=128 различных  комбинаций из нулей и единиц, т.е. двоичных кодов. Поставив  в соответствие каждому символу  его двоичный код, мы получим  кодировочную таблицу. Человек  оперирует символами, компьютер – их двоичными кодами.

 Для латинской  раскладки клавиатуры такая кодировочная  таблица одна на весь мир,  поэтому текст, набранный с  использованием латинской раскладки,  будет адекватно отображен на  любом компьютере. Эта таблица  носит название ASCII (American Standard Code of Information Interchange) по-английски произносится [э́ски], по-русски произносится [а́ски]. Ниже приводится вся таблица ASCII, коды в которой указаны в десятичном виде. По ней можно определить, что когда вы вводите с клавиатуры, скажем, символ “*”, компьютер его воспринимает как код 42(10), в свою очередь 42(10)=101010(2) – это и есть двоичный код символа “*”. Коды с 0 по 31 в этой таблице не задействованы.

  
 

 Таблица  символов ASCIIкод Символ код Символ код символ код символ код символ код символ
32 Пробел 48 . 64 @ 80 P 96 ' 112 p
33 ! 49 0 65 A 81 Q 97 a 113 q
34 " 50 1 66 B 82 R 98 b 114 r
35 # 51 2 67 C 83 S 99 c 115 s
36 $ 52 3 68 D 84 T 100 d 116 t
37 % 53 4 69 E 85 U 101 e 117 u
38 & 54 5 70 F 86 V 102 f 118 v
39 ' 55 6 71 G 87 W 103 g 119 w
40 ( 56 7 72 H 88 X 104 h 120 x
41 ) 57 8 73 I 89 Y 105 i 121 y
42 * 58 9 74 J 90 Z 106 j 122 z
43 + 59 : 75 K 91 [ 107 k 123 {
44 , 60 ; 76 L 92 \ 108 l 124 |
45 - 61 < 77 M 93 ] 109 m 125 }
46 . 62 > 78 N 94 ^ 110 n 126 ~
47 / 63 ? 79 O 95 _ 111 o 127 DEL

Таблица 6.

 Чтобы хранить также и коды национальных символов каждой страны (в нашем случае – символов кириллицы) требуется добавить еще 1 бит, что увеличит количество уникальных комбинаций из нулей и единиц вдвое, т.е. в нашем распоряжении дополнительно появится 128 свободных кодов (со 128-го по 255-й), в соответствие которым можно поставить символы русского алфавита.

 Таким образом,  отведя под хранение информации  о коде каждого символа 8 бит,  мы получим N=28=256 уникальных двоичных  кодов, что достаточно, чтобы закодировать  все символы, которые можно ввести с клавиатуры.

 Так мы  подошли к необходимости познакомиться  с еще одной базовой единицей  измерения – байтом.

Байт - последовательность из 8 бит.

1 байт = 23 бит  = 8 бит.

На основании  одного байта можно получить 28=256 уникальных двоичных кодов.

 В современных  кодировочных таблицах под хранение  информации о коде каждого символа отводится 1 байт.

1 символ = 1 байт.

В байтах измеряется объем данных (V) при их хранении и  передаче по каналам связи. Например, текст “Добрый день!” занимает объем равный 12 байтам.

 Биты в  байте нумеруются с конца с  0-го по 7-й. Минимальная комбинация  на основании одного байта  – восемь нулей, максимальная – восемь единиц. Рис. 18а.

11111111(2)=27+26+25+24+23+22+21+20=128+64+32+16+8+4+2+1=255(10)

 При хранении  на физическом уровне каждый  байт может быть реализован, например, на базе восьми конденсаторов,  каждый из которых либо разряжен (0), либо заряжен (1). Рис. 18b.

      

Рис. 6а. Байт: минимальная и    Рис. 6b. Байт: соответствие двоичного           максимальная комбинации                   числа и электрического импульса. 
 

Возвращаясь к  кодировочным таблицам, заметим, что  на сегодняшний день в использовании  не одна, а несколько кодировочных таблиц, включающих коды кириллицы, –  это стандарты, выработанные в разные годы и различными учреждениями. В  этих таблицах различен порядок, в котором  расположены друг за другом символы  кирилличного алфавита, поэтому одному и тому же коду соответствуют разные символы. По этой причине, мы иногда сталкиваемся с текстами, которые состоят из русских букв, но в бессмысленной  для нас последовательности.

 Например, текст  “Компьютерные вирусы”, введенный  в кодировке Windows-1251 в кодировке  КОИ-8 будет отображен так: ”лПНРШАФЕТОШЕ ЧЙТХУЩ”.

Эта проблема разрешима - на каждом компьютере найдутся все  основные кодировочные таблицы, и если тест выглядит неадекватно, нужно попробовать  перекодировать его, просто указав использовать другую кодировочную таблицу. Но наличие  такой проблемы, конечно, вносит неудобства.

 Используя  8-битную кодировочную таблицу  мы не сможем адекватно увидеть  на мониторе и тексты, созданные  на тех языках, где используются  символы, отличные от латинских и кирилличных, например символы с умляутами в немецком языке.  

1.9. Единицы измерения объема данных и ёмкости памяти: килобайты, мегабайты, гигабайты… 

 Итак, в мы  выяснили, что в большинстве современных  кодировок под хранение на  электронных носителях информации  одного символа текста отводится  1 байт. Т.е. в байтах измеряется объем, занимаемый данными при их хранении и передаче (файлы, сообщения).

Объем данных – количество байт, которое требуется для их хранения в памяти электронного носителя информации.

 Память носителей  в свою очередь имеет ограниченную  ёмкость, т.е. способность вместить  в себе определенный объем.  Ёмкость памяти электронных носителей  информации, естественно, также измеряется  в байтах.

 Однако байт  – мелкая единица измерения  объема данных, более крупными  являются килобайт, мегабайт, гигабайт, терабайт…

 Следует запомнить,  что приставки “кило”, “мега”, “гига”… не являются в данном случае десятичными. Так “кило” в слове “килобайт” не означает “тысяча”, т.е. не означает “103”. Бит – двоичная единица, и по этой причине в информатике удобно пользоваться единицами измерения кратными числу “2”, а не числу “10”. 

1 байт = 23 =8 бит, 1 килобайт = 210 = 1024 байта. В двоичном  виде 1 килобайт = &10000000000 байт. 

 Т.е. “кило”  здесь обозначает ближайшее к  тысяче число, являющееся при  этом степенью числа 2, т.е. являющееся  “круглым” числом в двоичной  системе счисления.

Именование  Обозначение              Значение в байтах
килобайт  1 Кb                                  210 b 1 024 b
мегабайт  1 Mb                                  210 Kb = 220  b 1 048 576 b
гигабайт  1 Gb                                   210 Mb = 230 b 1 073 741 824 b
терабайт                                        1 Tb        210 Gb = 240  b 1 099 511627 776 b

Таблица 7. 

1.10. Кодирование графической информации

 Графическая  информация, как и информация  любого другого типа, хранятся  в памяти компьютера в виде  двоичных кодов. Изображение,  состоящее из отдельных точек,  каждая из которых имеет свой  цвет, называется растровым изображением. Минимальный элемент такого изображения  в полиграфии называется растр,  а при отображении графики  на мониторе минимальный элемент  изображения называют пиксель  (pix).

                                                  Пиксель                                                                            Растр

 Рис. 7. Минимальная единица изображения: пиксель и растр.

 Если пиксель изображения может быть раскрашен только в один из 2х цветов, допустим, либо в черный (0), либо в белый (1), то для хранения информации о цвете пикселя достаточно 1 бита памяти (log2(2)=1 бит). Соответственно, объем, занимаемый в памяти компьютера всем изображением, будет равен числу пикселей в этом изображении (рис. 20а).

 Если под  хранение информации о цвете  пикселя выделить 2 бита, то число  цветов, допустимых для раскраски  каждого пикселя, увеличится до 4х (N=22=4), а объем файла изображения  в битах будет вдвое больше, чем количество составляющих  его пикселей (рис. 20b).  

Рис. 8a. 1 бит на пиксель – 2 цвета. Рис. 8b. 2 бита на пиксель – 4 цвета.

При печати на не цветном принтере обычно допускает 256 градаций серого цвета (от черного (0) до белого (255)) для раскраски каждой точки изображения. Под хранение информации о цвете точки в  этом случае отводится 1 байт, т.е. 8 бит (log2(256)=8 бит). 
 
 
 
 
 
 
 
 
 
 
 
 

  1. Практическое  задание №2
 

    Создать папку  «Информатика», в которой создать папку “Word”, затем в текстовом процессоре “Word” создать файл с произвольным текстом, включающем 2 абзаца, имеющий имя Текст.doc , сохранить данный файл в папке «Информатика».

     Порядок выполнения:

  1. В месте, где необходимо создать папку нужно нажать правой кнопкой мыши.
  2. В появившемся контекстном меню выбрать “Создать” – Папку
  3. По умолчанию она будет названа Новая папка, чтоб ее переименовать, можно на ней вызвать контекстное меню и выбрать “Переименовать”.
  4. Для того чтобы создать текстовый документ в процессоре “Word”, нужно нажать меню Пуск – Все программы – Microsoft Office - Microsoft Office Word
  5. В открывшийся документ внести произвольный текст включающий в себя 2 абзаца.
  6. В документе на панели управления нажать “Фаил” – Сохранить как…
  7. В открывшемся диалоговом окне ввести Имя фаила – Текст, указать расширение DOC и сохранить документ в Папке «Информатика».

Информация о работе Кодирование чисел, символов и графической информации, единицы измерения данных