Автор работы: Пользователь скрыл имя, 19 Июня 2012 в 18:52, контрольная работа
Существует несколько взглядов на то, что принято считать информацией.
Введение 3
1. Понятие текстовой информации и способы её кодировки 5
1.1 Понятие текстовой информации 5
1.2 Кодирование информации 6
1.3 Кодирование текстовой информации байтами 3
1.4 Кодировочные таблицы 3
2. Реализация возможностей систем виртуальной реальности 19
Выводы и предложения 3
Список использованной литературы 3
В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др.
Традиционно, для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):
К = 2I = 28 = 256, т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.
Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.
Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов.
Одному и тому же двоичному коду ставится в соответствие различные символы.
Таблица 2. Кодировка символов
Двоичный код |
Десятичный код |
КОИ-8 |
СР1251 |
СР866 |
ас |
SO |
11000010 |
194 |
б |
В |
- |
- |
Т |
Впрочем, в большинстве случаев о перекодировке текстовых документов заботится на пользователь, а специальные программы - конверторы, которые встроены в приложения.
Начиная с 1997 г. последние версии Microsoft Windows&Office поддерживают новую кодировку Unicode, которая на каждый символ отводит по 2 байта, а, поэтому, можно закодировать не 256 символов, а 65536 различных символов.
Чтобы определить числовой код символа можно или воспользоваться кодовой таблицей, или, работая в текстовом редакторе Word. Для этого в меню нужно выбрать пункт "Вставка" - "Символ", после чего на экране появляется диалоговая панель Символ. В диалоговом окне появляется таблица символов для выбранного шрифта. Символы в этой таблице располагаются построчно, последовательно слева направо, начиная с символа Пробел (левый верхний угол) и, кончая, буквой "я" (правый нижний угол).
Для определения числового кода символа в кодировке Windows (СР1251) нужно при помощи мыши или клавиш управления курсором выбрать нужный символ, затем щелкнуть по кнопке Клавиша. После этого на экране появляется диалоговая панель Настройка, в которой в нижнем левом углу содержится десятичный числовой код выбранного символа.
Одним битом можно закодировать два значения: Да или Нет (1 или 0).
Двумя битами можно закодировать уже четыре значения: 00, 01, 10, 11.
Тремя битами кодируются 8 разных значений.
Добавление одного бита удваивает количество значений, которое можно закодировать. При восьми битах уже можно закодировать 256 разных значений. Нетрудно догадаться, что если бы в байте было 9 битов, то одним байтом можно было бы закодировать 512 разных значений, а если бы в нем было 10 битов, то 1024 и т. д.
Таблица 3. Количество кодируемых значений битами
Биты |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Количество кодируемых значений |
2 |
4 |
8 |
16 |
32 |
64 |
128 |
256 |
Но все-таки в байте не 9 и не 10 битов, а только 8, и потому с его помощью кодируют 256 разных значений. Много это или мало? Смотря для чего. Давайте посмотрим, как с помощью байтов кодируют текстовую информацию.
В русском языке 33 буквы (символа) — для их кодирования достаточно 33 различных байтов. Если мы хотим различать прописные (заглавные) и строчные буквы, то потребуется 66 байтов. Для строчных и прописных букв английского языка хватит еще 52 символов — получается 118. Добавим сюда цифры (от 0 до 9), все возможные знаки препинания: точку, запятую, тире, восклицательный и вопросительный знаки. Добавим скобки: круглые, квадратные и фигурные, а также знаки математических операций: +, –, =, /, *. Добавим специальные символы, например такие, как: %,$,&, @, — мы видим, что все их можно выразить восемью битами, и при этом еще останутся свободные коды, которые можно использовать для других целей.
Дело осталось за малым: надо всем людям мира договориться о том, каким кодом (от 0 до 255) должен кодироваться каждый символ. Если, например, все люди будут знать, что код 33 означает восклицательный знак, а код 63 — знак вопросительный, то текст, набранный на одном компьютере, всегда можно будет прочитать и распечатать на другом компьютере.
Такая всеобщая договоренность об одинаковом использовании чего-либо называется стандартом. Стандарт устанавливает таблицу, в которой записано, каким кодом должен кодироваться каждый символ. Такая таблица называется таблицей кодов. В этой таблице должно быть 256 строк, в которых записывается, какой байт какому символу соответствует.
Но здесь-то и начались проблемы. Дело в том, что символы, которые хороши для одной страны, не подходят для другой. В Греции используются одни буквы, в Турции — другие. То, что подходит для Америки, не годится для России, а то, что подходит для России, не подходит для Германии.
Поэтому было принято следующее решение. Таблицу кодов разделили пополам. Первые 128 кодов (с 0 до 127) должны быть стандартными и обязательными для всех стран и всех компьютеров, а во второй половине (с кода 128 до кода 255) каждая страна может делать все, что ей угодно, и создавать в этой половине свой стандарт — национальный.
Первую (международную) половину таблицы кодов называют таблицей ASCII — ее ввел американский институт стандартизации ANSI. В этой таблице размещаются прописные и строчные буквы английского алфавита, символы чисел от 0 до 9, все знаки препинания, символы арифметических операций и некоторые другие специальные коды.
За вторую половину кодовой таблицы (коды от 128 до 255) стандарт ASCII не отвечает Разные страны могут создавать здесь свои таблицы. Часто бывает, что даже в одной стране в этой половине действуют несколько разных стандартов, предназначенных для разных компьютерных систем. В России, например, содержание этой половины таблицы может подчиняться четырем разным стандартам, каждый из которых действует в какой-то своей, особой области.
Стандартная кодировка ASCII
Для кодирования текстовой информации принят международный стандарт ASCII (American Standard Code for Information Interchange), в кодовой таблице которого зарезервировано 128 7-ми разрядных кодов для кодирования:
Добавление 8-го разряда позволяет увеличить количество кодов таблицы ASCII до 255. Коды от 128 до 255 представляют собой расширение таблицы ASCII. Эти коды в таблице ASCII использованы для кодирования некоторых символов, отличающихся от латинского алфавита, и встречающихся в языках с письменностью, основанной на латинском алфавите, - немецком, французском, испанском и др. Кроме этого, часть кодов использована для кодирования символов псевдографики, которые можно использовать, например, для оформления в тексте различных рамок и текстовых таблиц.
В русском алфавите буква А имеет первое место, а буква Б – второе. У каждой буквы есть своя позиция. Буква Я имеет позицию номер 33. Мы можем считать, что алфавит — это таблица для кодирования букв.
Стандарт ASCII — это тоже как бы «алфавит», только компьютерный. Он тоже определяет номер каждого символа. Но символов больше, чем букв, потому что к ним относятся еще и цифры, и знаки препинания, и некоторые специальные символы.
Выше мы сказали, что с помощью одного байта можно закодировать 256 разных символов. Еще мы узнали, что стандарт ASCII определяет первую половину кодовой таблицы, то есть, кодировку символов, имеющих номера до 127. Но это не совсем так. На самом деле стандарт ASCII первые 32 кода (от 0 до 31) не определяет. Он оставляет их для так называемых управляющих кодов, которые не используются для представления информации, а применяются для управления компьютерами. Эти коды отданы на усмотрение производителей компьютерных систем (у них есть свои соглашения и свои стандарты по применению этих кодов). Еще несколько лет назад людям, работающим с компьютерами, стоило знать некоторые из этих кодов, но сегодня это уже не требуется.
Самый первый символ стандарта ASCII — это ПРОБЕЛ. Он имеет код 32.
За ним идут специальные символы и знаки препинания (коды с 33 по 47).
Далее идут десять цифр (коды 48-57).
Коды 58—64 используют некоторые математические символы и знаки препинания.
Самое интересное начинается с кодов 65—90. Ими обозначают прописные английские буква от А до Z
Коды 91—96 используются для специальных символов.
Коды 97—122 — строчные буквы английского алфавита.
Коды 123-127 — специальные символы.
Коды верхней половины таблицы символов (128-255) отданы для национальных стандартов. Когда мы узнаем о компьютере немного больше, мы разберемся с несколькими российскими стандартами и посмотрим, как кодируются буквы русского языка.
Имея под рукой кодовую таблицу символов, вы можете легко определить, какие слова закодированы следующими байтами
67 79 77 80 85 84 69 82 99 111 109 112 117 116 101 114
У вас раскодирование информации займет пару минут. Компьютер сделает это за несколько миллионных долей секунды.
Таблица 4. Таблица кодов ASCII
Для кодирования символов национальных алфавитов используется расширение кодовой таблицы ASCII, то есть 8-ми разрядные коды от 128 до 255.
В языках использующих кириллический алфавит, в том числе русском, пришлось полностью менять вторую половину таблицы ASCII, приспосабливая ее под кириллический алфавит. Но отсутствие согласованных стандартов привело к появлению различных кодовых таблиц для кодирования русскоязычных текстов, среди которых
альтернативная кодовая таблица CP-866
международный стандарт ISO 8859
кодовая таблица фирмы Microsoft CP-1251 (кодировка Windows)
кодовая таблица, применяемая в ОС Unix KOI 8-r.
Таблица 5. Кодовая таблица Windows (CP-1251)
Таблица 6. Альтернативная кодовая таблица
Сравните:
в альтернативной кодтровке русский прописной символ А имеет код 128,а в кодировке Windows – 192.
В последние годы развитие информационных технологий позволило создать технические и психологические феномены, которые в популярной и научной литературе получили название "виртуальной реальности", "мнимой реальности" и "ВР-систем". Развитие техники программирования, быстрый рост производительности полупроводниковых микросхем, разработка специальных средств передачи информации человеку, а также обратной связи (надеваемых на голову стереоскопических дисплеев, перчаток и костюма, в которые встроены датчики, передающие на компьютер информацию о движениях пользователя) - все это создало новое качество восприятия и переживаний, осознанные как виртуальные реальности.
Внешний эффект состоит в том, что
человек попадает в мир, или весьма
похожий на настоящий, или предварительно
задуманный, сценированный программистом
(например, попадает на Марс, участвует
в космических путешествиях или
космических войнах), или, наконец, получает
новые возможности в плане
мышления и поведения. Наиболее впечатляющим
достижением новой
Несомненно, что дальнейшее развитие и распространение виртуальных технологий способно привести к коренным изменениям в научно-технической сфере, а также повлечь за собой существенные социальные преобразования. Возможно, мы не можем даже представить себе, каково будет в связи с этим истинное положение дел, допустим, через несколько десятилетий. Однако существуют различные прогнозы, высказываемые как учеными, так и возлюбившими эту столь благодатную ныне тему писателями-фантастами, которые представляют интерес к рассмотрению.