Мультимедиа технологии. Лекция 3. Составляющие...

21
Мультимедиа технологии. Лекция 3. Составляющие мультимедиа. Звук Антон Викторович Кудинов, доцент кафедры ВТ

description

Мультимедиа технологии. Лекция 3. Составляющие мультимедиа. Звук. Антон Викторович Кудинов, доцент кафедры ВТ. Содержание. Природа звука Оцифровка звука. Запись звука Обработка Сжатие Форматы хранения Объединение звука и изображения Методы синтеза звука MIDI. Природа звука. - PowerPoint PPT Presentation

Transcript of Мультимедиа технологии. Лекция 3. Составляющие...

Page 1: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Мультимедиа технологии. Лекция 3. Составляющие мультимедиа.

Звук

Антон Викторович Кудинов,

доцент кафедры ВТ

Page 2: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Содержание Природа звука Оцифровка звука. Запись звука Обработка Сжатие Форматы хранения Объединение звука и изображения Методы синтеза звука MIDI

2

Page 3: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Природа звука Отличается от всех цифровых средств

информации (визуальных) Комбинация физических и

психологических факторов Сложно смоделировать Не всегда нужен: легко раздражает

3

Page 4: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Два специальных типа звука Музыка (имеет культурный статус) Речь (имеет лингвистическое содержание)

Разработаны специальные представления речи (особые алгоритмы сжатия) и музыки (команды)

4

Page 5: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Природа звука Преобразование энергии в колебания

воздуха или другой упругой среды Камертон – одна частота

Большинство звуков – сложной природы, можно разложить на набор частотных компонентов

Частотный спектр - способ описания звука через относительные амплитуды его частотных компонентов

5

Page 6: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Свойства звука Высота – восприятие мозгом частоты колебаний Длительность – восприятие

продолжительности колебаний Громкость – восприятие амплитуды колебаний

единица измерения – децибел удвоение амплитуды звуковых колебаний

соответствует увеличению громкости на 6 децибел, и наоборот

Пространственная локализация – оценка направления на источник звука и расстояния до него

Тембр – окраска звука. По тембрам отличают звуки одинаковой высоты и громкости, но исполненные или на разных инструментах, разными голосами, или на одном инструменте разными способами, штрихами.

6

Page 7: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Особенности восприятия звука человеком 20 Гц – 20 кГц (средние) Верхняя граница чувствительности

снижается с возрастом Форму сигнала любого звука можно

изобразить, построив зависимость его амплитуды от времени

Иллюзии: более громкий звук кажется более низким сложные звуки кажутся более низкими, чем

чистые человек выделяет свое имя, произнесенное в

шуме стереофония7

Page 8: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Цитата «Зная об очевидной сложности

акустических сигналов, было бы наивно верить, что аналоговые или цифровые технологии развились достаточно, чтобы допускать точную запись и передачу того, что мы слышим. Ситуацию еще более усложняет то, что мы не знаем точного предела человеческого восприятия. Очевидно одно: в лучшем случае, даже при использовании самой сложной технологии, то, что воспроизводится аудиосистемой, является лишь аппроксимацией реального звука».

Кен С. Похлманн8

Page 9: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Оцифровка звука 1. Преобразование звука в электрический

сигнал

2. Аналогово-цифровое преобразование: квантование дискретизация

9

Page 10: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Дискретизация Частота Найквиста для оцифровки звука:

f = 2 fmax = 2 * 20 кГц = 40 кГц Для разный целей:

AudioCD – 44,1 кГц передача через Internet – 22,05 кГц запись речи – 11, 025 кГц цифровые аудиоленты – 48 кГц

Используется частотный фильтр, удаляющий частоты больше половины частоты дискретизации

10

Page 11: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Квантование Количество уровней выбирается исходя из

удобного количества бит Обычно – 16 бит, 65 536 уровней Шум квантования Минимальный уровень – 8 бит Высококачественный звук – 24 бит

(сложная схема АЦП)

11

Page 12: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Шум квантования

12

Page 13: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Сжатие сжатие речи

удаление пауз (амплитуда ниже заданного порога)

нелинейное квантование адаптивная дифференциальная импульсно-

кодовая модуляция (16-32 Кбит/с) кодирование с линейным предсказанием

сжатие на основе восприятия отбрасывание данных, не влияющих на

восприятие сигнала сжатие на основе порога слышимости – психо-

акустическая модель стандарт MPEG-1, разработанный для видео,

хорошо используется для аудио, имеет 3 уровня (3-й уровень – MP3)

аудио MPEG-2 – Advanced Audio Coding (AAC), лучше сжатие, нет обратной совместимости

13

Page 14: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Форматы хранения и передачи По платформам:

MacOS – AIFF (.aiff) Windows – WAVE (.wav) Unix – AU (.au, .snd)

MP3 – скорее алгоритм сжатия, может быть частью других форматов

RealAudio (.ra, .ram) – для потокового аудио MIDI (.mid) MOD (.mod) – для хранения сэмплов,

платформонезависимый

14

Page 15: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Методы синтеза звука таблично-волновой синтез (WaveTable, WT) –

основан на воспроизведении сэмплов – заранее записанных звучаний реальных инструментов сэмплы содержатся в ПЗУ звуковой платы, можно

загружать в ОЗУ изменение высоты звука через изменение скорости

проигрывания сэмпла параллельное проигрывание разных сэмплов дополнительная обработка звука (модуляция,

фильтрация) достоинства: реалистичность звучания классических

инструментов, простота получения звука недостатки: жесткий набор заранее подготовленных

тембров, большие объёмы памяти для сэмплов, неодинаковое звучание разных моделей синтезаторов из-за различающихся наборов стандартных инструментов

15

Page 16: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Методы синтеза звука частотная модуляция (Frequency Modulation,

FM) – синтез, основанный на использовании нескольких генераторов сигнала с взаимной модуляцией каждый генератор управляется схемой,

регулирующей частоту и амплитуду сигнала (оператор)

бывает двухоператорный (OPL2) и четырехоператорный (OPL3) синтез

16

тембр звучания определяется схемой соединения операторов и параметрам и каждого оператора

мах количество синтезируемых тембров – зависит от числа операторов и схемы управления ими

Page 17: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Частотная модуляция достоинства: не надо заранее записывать

звуки инструментов и хранить их в ПЗУ, велико разнообразие получаемых звучаний, легко повторить тембр на различных платах с совместимыми синтезаторами

недостатки: трудно обеспечить достаточно благозвучный тембр во всем диапазоне звучания, имитация звучания реальных инструментов крайне грубая, сложно организовать тонкое управление операторами, из-за чего в звуковых платах используется упрощенная схема с небольшим диапазоном возможных звучаний

17

Page 18: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Выбор метода синтеза Если в композиции нужен звук реальных

инструментов, лучше подходит метод таблично-волнового синтеза

Для создания новых тембров более удобен метод частотной модуляции, хотя возможности FM-синтезаторов звуковых плат достаточно ограничены

18

Page 19: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

MIDI Musical Instruments Digital Interface по сравнению с цифровым звуком – как

векторная графика по сравнению с растровой

сокращенная форма записи музыки в цифровой форме

достоинства: меньший объем памяти более высокое качество произведения можно редактировать на уровне отдельных нот,

менять скорость и тембр звучания и т.д. недостатки:

зависимость от устройства воспроизведения нельзя записать произвольный звук

19

Page 20: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

MIDI-файл представляет собой последовательность

команд, которыми записаны действия (например, нажатие клавиши на пианино или поворот регулятора) General MIDI (GM) –разработка фирмы Roland, 128

мелодических тембров с возможностью воспроизведения звуков разной высоты и 46 ударных инструментов. За всеми инструментами закреплены номера

General Standart (GS) – общий стандарт фирмы Roland, включает дополнительные наборы мелодических и ударных инструментов, а также различные эффекты (скрип двери, звук мотора, крики и т.д.)

Extended General (XG) – новый стандарт фирмы Yamaha, включающий несколько сотен мелодических и ударных инструментов, ставший альтернативой формату GS

20

Page 21: Мультимедиа технологии.  Лекция 3. Составляющие мультимедиа. Звук

Спасибо за внимание!

[email protected]

21