кодирование текстовой информации
Transcript of кодирование текстовой информации
Кодирование Кодирование текстовой текстовой
информации.информации.
Кодирование Кодирование текстовой текстовой
информации.информации.
Язык как способ представления
информации
Язык – система знаков (звуков, сигналов) для
представления и передачи информации.
языки
естественные формальные
Текстовая информация
Информацию можно выразить разными способами.
Знак – это элемент конечного множества отличных друг от друга элементов.
Знак вместе с его смыслом называют символом.
Набор знаков, в котором определен ихпорядок, называется
алфавитом.
Коды и кодирование
Код – это система условных знаков для представления информации.
Кодирование – это перевод информации в удобную для передачи, обработки или хранения форму с помощью некоторого кода.
Кодирование числовой информации
12 – число, записанное арабскими цифрами
– число, записанное римскими цифрами
– число, записанное вавилонской клинописью
Кодирование текстовой информации
КНИГА – русский язык
BOOK – английский язык
BUCH – немецкий язык
LIVRE – французский язык
Азбука Брайля
Кодирование музыки
Кодирование на дорогах
Штрих-коды
«Школьное» кодирование»
Почтовые индексы
143511 – Волоколамск
157130 – Чухлома
186300 – Олонец
396790 – Богучар
628400 – Сургут
Сигнальные коды
Азбука Морзе Флажковая азбука
Двоичное кодирование
1000 00010101 10100010 01000101 10100101 10100010 01000101 10101000 0001
1100 00001100 00011100 0010
АБВ
254 1111 1110
1 0 1 1
КОДИРОВАНИЕ ИНФОРМАЦИИ В
ЭВМИнформация, циркулирующая в ЭВМ, с
помощью электрических сигналов закодирована в виде последовательностей цифр 0 и 1,
называемых битами.
1 символ = 8 бит информации = 1 байт.
С помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.
КОДИРОВАНИЕ ИНФОРМАЦИИ В
ЭВМ• 01000000@ 01010000Р
• 01000001А 01010001Q
• 01000010В 01010010R
• 01000011С 01010011S
• 01000100D 01010100Т
• 01000101Е 01010101U
• 01000110F 01010110V
• 01000111G 01010111W
Присвоение символу конкретного кода - это вопрос соглашения, которое фиксируется в кодовой таблице.
Кодовая таблица - это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange - Американский стандартный код для обмена информацией).
В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256, а 65536 различных символов. Эту кодировку поддерживают последние версии платформы Microsoft Windows&Office (начиная с 1997 года)
Домашнее задание:
• § 1.6 стр.51-54, §2.1