Компьютер и текст

В информатике текстом считают последовательность любых символов. Сейчас компьютеры в основном пользуются алфавитами, содержащими 256 знаков1. Каждому из символов соответствует свой восьмиразрядный двоичный код.

ВНИМАНИЕ! Работа на этой странице представлена для Вашего ознакомления в текстовом (сокращенном) виде. Для того, чтобы получить полностью оформленную работу в формате Word, со всеми сносками, таблицами, рисунками (вместо pic), графиками, приложениями, списком литературы и т.д., необходимо скачать работу.

Компьютер и текст

В
информатике текстом считают последовательность любых символов. Сейчас
компьютеры в основном пользуются алфавитами, содержащими 256 знаков1. Каждому
из символов соответствует свой восьмиразрядный двоичный код. Таким образом
любой символ текста, включая пробелы, занимает 8 бит (1 байт) в памяти
компьютера. Зная это, можно легко оценить объем памяти, необходимый для
хранения того или иного текстового документа.


Вспомним,
как связано количество бит в коде с тем, сколько требуется различных кодов.


Один
бит (двоичная цифра) может принимать два значения, добавление каждого разряда в
код удваивает количество получаемых комбинаций: двухбитовый код -- четыре
варианта, трехбитовый -- восемь, четырехбитовый -- шестнадцать и т. д.


Рассмотрим
пример. Машинописная страница стандартного формата (А4) содержит около 55
строк. На каждой строке помещается в среднем 60 символов2. Подсчитаем
количество текстовой информации на такой странице. Каждый символ -- 1 байт информации,
а всего символов -- 60*55=3300. Значит, на странице 3300 байт (около 3 Кбайт).
Как связаны двоичные коды и соответствующие им символы? Это определяется
таблицей кодировки. Все используемые на персональных компьютерах таблицы3
основаны на американском стандарте ASCII4. Он определяет первые 128 кодов: для
латинских букв, цифр, основных знаков препинания и математических операций.
Остальные 128 кодов используются для специальных символов и букв национальных
алфавитов (в том числе, русского). И, поскольку общепринятого стандарта для
этого не было, возникло много различных кодировок, в том числе, несколько --
для кириллицы5. Именно поэтому, получив от кого-нибудь текст и попытавшись
прочесть его на своем компьютере, мы зачастую видим на экране набор непонятных
"закорючек".











код


CP866


CP1251


KOI-8R


Mac


01011010


Z


Z


Z


Z


10001111


П


Компьютер и текст


Компьютер и текст


П


11111101


$


э


Щ


э


Скачиваний: 1
Просмотров: 0
Скачать реферат Заказать реферат