Kod infor
description
Transcript of Kod infor
Кодування інформації
1. Двійкове кодування
2. Кодування чисел і символів
3. Кодування рисунків
4. Кодування звуку
© К.Ю. ПоляковПереклад В.Семенюкa
Кодування інформації
Тема 1. Двійкове кодування
3
Двійкове кодування
Двійкове кодування – це кодування всіх видів інформації за допомогою двох знаків ( 0 і 1).
Передача електричних сигналів:
сигнал із завадамисигнал із завадами
час
U
«1»
«0»корисний сигнал
корисний сигнал
сигнал із завадамисигнал із завадами
5 В
U
1 0 1
часкорисний
сигналкорисний
сигнал
4
Двійкове кодування
• в такій формі можна закодувати всі види інформації
• потрібні тільки пристрої з двома станами• практично немає помилок при передачі• комп’ютеру легше оборобляти дані
• людині складно сприймати двійкові коди
Чи можна використовувати не «0» і «1», а інші символи, наприклад, «А» і «Б»?
?
кодувальниккодувальник
числачисла
символисимволи
рисункирисунки
звукзвук
101011011101110110101101011011101110110101
Кодування інформації
Тема 2. Кодування чисел і символів
6
Кодування чисел (двійкова система)
Алфавіт: 0, 1
Основа (кількість цифр): 2
10 210 2
2 102 10
19 2
918
112
4 8
112
2 4
002
1 2
002
0 0
11
19 = 100112
система численнясистема
числення
100112
4 3 2 1 0 розряди
= 1·24 + 0·23 + 0·22
+ 1·21 + 1·20
= 16 + 2 + 1 = 19
7
Кодування символів
Текстовий файл
• на екрані (символи)
• в пам’яті – двійкові коди
10000012 10000102 10000112 10001002
У файлі зберігаються не зображення символів, а їх числові коди у двійковій системі!
!
65 66 67 68
А де ж зберігається зображення?
8
Кодування символів
1. Скільки символів можна використовувати одночасно? або 65536 (UNICODE)
2. Скільки місця потрібно виділити на символ:
3. Вибрати 256 будь-яких символів (або 65536) - алфавіт.
4. Кожному символу – унікальний код 0..255 (або 0..65535). Таблиця символів:
5. Коди – в двійкову систему.
256256
256 = 28 8 біт на символ 256 = 28 8 біт на символ
65 66 67 68
… A B C D …
коди
9
Кодування 1 байт на символ
0 1 254 255127 128
таблиця ASCII (міжнародна) кодова сторінка
ASCII = American Standard Code for Information Interchange0-31 символи кодування:
7 – дзвінок, 10 – новий рядок, 13 – повернення каретки, 27 – Esc. 32 пробіл
знаки пунктуації: . , : ; ! ?спеціальні знаки: + - * / () {} []48-57 цифри 0..965-90 великі латинські літери A-Z97-122 малі латинські літери a-z
Кодова сторінка (розширенна таблиця ASCII)для кирилиці:
CP-866 для системи MS DOSCP-1251 для системи WindowsКОІ8-U для системи UNIX (Інтернет)
10
Кодування UNICODE (2 байта на символ)
•Windows, MS Office, …•16 біт на символ
• 65536 або 216 символів в одній таблиці
• можна одночасно використовувати символи різних мов
• розмір файла збільшується у 2 рази
Кодування інформації
Тема 3. Кодування малюнків
12
Два типа кодування малюнків
• растрове кодування точковий малюнок, складається з пікселів
фотографії, розмиття зображення
• векторне кодуваннямалюнок, складається з окремих геометричних фігур
креслення, схеми, карти
13
Крок 1. Дискретизація: розбивка на пікселі.
Растрове кодування
Крок 2. Для кожного пікселя визначається єдиний колір.Піксель – це найменший
елемент рисунка, для якого можна незалежно встановити колір.
Піксель – це найменший елемент рисунка, для якого можна незалежно встановити колір.
Існує втрата інформації!• чому?• як її зменшити?
!
Роздільна здатність: число пікселів на дюйм, pixels per inch (ppi)екран 96 ppi, друк 300-600 ppi, типографія 1200 ppi
14
Растрове кодування (True Color)
Крок 3. Від кольору – до чисел: модель RGB
колір = R + G + Bred
червоний0..255
blueсиній0..255
greenзелений0..255
R = 218G = 164B = 32
R = 135G = 206B = 250
Крок 4. Числа – в двійкову систему.
Скільки пам’яті потрібно для збереження кольору 1 пікселя??
Скільки різних кольорів можна кодувати??256·256·256 = 16 777 216 True Color
R: 256=28 варіантів, потрібно 8 біт = 1 байтR G B: всього 3 байта
15
Растрове кодування з палітрою
Крок 1. Вибрати кількість кольорів: 2, 4, … 256.
Крок 2. Вибрати 256 кольорів з палітри:248 0 880 221 21
181 192 021 0 97
Крок 3. Скласти палітру (кожному кольору – номер 0..255)палітра зберігається на початку файла
248 0 88 0 221 21 … 181 192 0 21 0 970 1 254 255
Крок 4. Код пікселя = номеру його кольору на палітрі
2 45 65 14 … 12 23
16
Растрове кодування з палітрою
Скільки займає палітра і головна частина??
Файл з палітрою:
палітра коди пікселів
Один колір на палітрі: 3 байта (RGB)256 = 28 кольорів:
палітра 256·3 = 768 байтрисунок 8 біт на піксель
16 кольорів:палітра 16·3 = 48 байтрисунок 4 біта на піксель
2 кольори:палітра 2·3 = 6 байтрисунок 1 біт на піксель
17
Формати файлів (растрові рисунки)
Формат True Color Палітра Прозорість
BMP + +JPG +GIF + +PNG + + +
18
Растрові рисунки
• найкращий спосіб для збереження фотографій і зображень без чітких меж
• спецефекти (тіні, ореоли, і т.д.)
• існує втрата інформації (чому?)• при зміні розмірів рисунка він спотворюється
• розмір файла не залежить від складності рисунка (а від чого залежить?)
19
Векторні рисунки
Будуються з геометричних фігур:• відрізки, ламані, прямокутники• круги, еліпси, дуги• зглажування ліній (криві Без’є)
Для кожної фігури в пам’яті зберігаються:• розміри і координати на рисунку• колір і стиль межі• колір і стиль заливки (для замкнутих фігур)
Формати файлів:• WMF (Windows Metafile)• CDR (CorelDraw)
• AI (Adobe Illustrator)• FH (FreeHand)
20
Векторні рисунки
• найкращий спосіб для збереження креслень, схем, карт;
• при кодуванні немає втрат інформації;• при зміні розміру немає спотворень;• менший розмір файла, залежить від складності рисунка;
• не ефективно використовувати для фотографій і розмитих зображень
Кодування інформації
Тема 4. Кодування звуку
22
Оцифровка (переведення в цифрову форму)
10110101101010100111011010110101010011аналоговий сигнал
цифровий сигнал
• Який об’єм iнформації в аналоговому сигналі?• Чи можно зберігати його в пам’яті реального пристрою?• Чи буде сигнал на виході такий самий?• Чому існують втрати інформації?
?
аналоговий сигнал
23
Частота дискретизації: 8 кГц, 11 кГц, 22 кГц, 44 кГц (CD)
Людина чує 16 Гц … 20 кГц
Дискретизація по часу
зберігаються тільки значення сигналу в моменти 0, T, 2T, …
T – інтервал дискретизаціїT – інтервал дискретизації
0 T 2T
Tf
1
22 кГц22 кГц 00005,022000
1T с
Що комп’ютер може видати на виході?
?
Як покращити якість? Що при цьому погіршиться?
?0 T 2T
24
Дискретизація по рівню
Скільки біт потрібно, щоб зберегти число 0,7??
0 T 2T
43210
У всіх точок в одній смузі однаковий код!
8 біт = 256 рівнів
16 біт = 65536 рівнів
32 біта = 232 рівнів
64 біта = 264 рівнів
При оцифруванні втрату інформації дає дискретизація як по часу, так і по рівню!
!
25
Оцифровка – підсумок
• можна закодувати будь-який звук ( голос, свист, шарудіння, …)
• існує втрата інформації• великий об’єм файлiв
44 кГц, 16 бiт: 88 Кб/с, 5,3 Мб/хв
Формати файлів:•WAV (Waveform audio format), часто без стиску (розмір!)•MP3 (MPEG-1 Audio Layer 3, стиск з втратами)•WMA (Windows Media Audio, потоковий звук, стиск)
26
Інструментальне кодування
MIDI (Musical Instrument Digital Interface), файли *.MID
у файлі:• нота (висота, тривалість)• музичний інструмент• параметри звуку (гучність, тембр)• може бути декілька каналів
• немає втрат інформації при кодуванні інструментальної музики
• маленький розмір файлів
• неможливо закодувати нестандартний звук, голос
MIDI-клавіатура:
27
Кінець