MPEG2 DVB

66
Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm 1 2. Формирование и передача цифровых потоков по стандарту MPEG-2 2.1 Общие сведения Телевидение становится цифровым. Сказать то это легко, однако столь радикальные перемены имеют и далеко идущие последствия. Производство ТВ программ предназначено, с одной стороны, для доставки зрителю пользы и удовольствия, а с другой стороны - для доставки рекламной информации большим массам населения. Если цифровой способ доставки визуальной информации не обеспечит достижения двух этих целей, он не сможет выжить. Большое распространение при производстве и распределении ТВ программ находят системы со сжатием цифрового потока. Все, без единого исключения, новые ТВ и видеосистемы основаны на сжатии видео- и звукоданных. Изучение столь сложного объекта имеет смысл начать с предыстории и терминологии. Наряду с правильной терминологией, важнейшим элементом здесь является стандартизация. Почему вообще потребовалось сжатие цифровых видеосигналов? Как и многие другие, телевизионные сигналы лучше сохраняются и передаются в цифровой форме. Для достижения хорошего качества изображения исходный аналоговый сигнал, как известно, необходимо превратить в цифровой следующим образом: частота отсчетов сигнала яркости должна быть не менее 13.5 МГц точность квантования - не менее 8 бит на отсчет сигнал яркости и цветоразностные сигналы должны кодироваться раздельно. Легко вычислить, что результирующая скорость передачи видеоданных составляет 216 Мбит/с. Запись потока 216 Мбит/с стоит очень дорого. Радиочастотная передача 216 Мбит/с требует занятия 10 каналов обычного аналогового ТВ. Получается, что только для того, чтобы сравняться с аналоговым ТВ, надо сжать цифровой поток в пропорции 10:1. Однако, для экономического выживания новых систем они должны не только сравняться, но и превзойти старые системы. Поэтому желательны еще большие коэффициенты сжатия. Алгоритм MPEG–2 обеспечивает сжатие потока данных до 40:1. Такой коэффициент сжатия означает, что через канал обычного аналогового композитного ТВ можно передавать до четырех различных программ MPEG. Как сжимается цифровой поток? Любой источник изображения, в той или иной мере, обладает избыточностью. Цель сжатия состоит в том, чтобы сохранить только важную в информационном отношении часть видеосигнала. Какие же составляющие видеосигнала можно считать избыточными? Во-первых, имеется избыточность в смысле ограниченности человеческого зрения. Большая часть активно воспринимаемой информации о крупных деталях изображения сосредоточена на низких пространственных частотах. Глаз и мозг человека не нуждаются во всей информации, фактически содержащейся в исходном видеокадре, и до определенного порога спокойно относятся к искажениям на высоких пространственных частотах. Грубое квантование или даже полное отбрасывание мелких деталей позволяет сжать объем видеоданных в несколько раз. Важно подчеркнуть, что речь идет о двумерной обработке, т.е. полностью отбрасываются, прежде всего, точечные объекты, размеры которых малы как по горизонтали, так и по вертикали. Детали типа вертикальных линий не отбрасываются, лишь контраст подобных деталей передается не вполне точно. Во-вторых, имеется избыточность передачи фаз движения, поскольку значительная часть видеокадра обычно занята статическим или равномерно перемещающимся фоном. Эта часть может быть сравнительно легко предсказана по предыдущему или последующему видеокадру. Телевизионные поля передаются с периодом 33 или 40 миллисекунд. За такой короткий интервал времени изображение не так уж сильно изменяется. Один из основных принципов сжатия по алгоритму MPEG - это передача только той информации, которая изменяется от кадра к кадру. Тем самым объем передаваемых данных дополнительно снижается в среднем на 50 %.

description

MPEG

Transcript of MPEG2 DVB

Page 1: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

1

2. Формирование и передача цифровых потоков по стандарту MPEG-2

2.1 Общие сведения Телевидение становится цифровым. Сказать то это легко, однако столь радикальные перемены имеют и далеко идущие последствия. Производство ТВ программ предназначено, с одной стороны, для доставки зрителю пользы и удовольствия, а с другой стороны - для доставки рекламной информации большим массам населения. Если цифровой способ доставки визуальной информации не обеспечит достижения двух этих целей, он не сможет выжить. Большое распространение при производстве и распределении ТВ программ находят системы со сжатием цифрового потока. Все, без единого исключения, новые ТВ и видеосистемы основаны на сжатии видео- и звукоданных. Изучение столь сложного объекта имеет смысл начать с предыстории и терминологии. Наряду с правильной терминологией, важнейшим элементом здесь является стандартизация.

Почему вообще потребовалось сжатие цифровых видеосигналов? Как и многие другие, телевизионные сигналы лучше сохраняются и передаются в цифровой форме. Для достижения хорошего качества изображения исходный аналоговый сигнал, как известно, необходимо превратить в цифровой следующим образом: • частота отсчетов сигнала яркости должна быть не менее 13.5 МГц • точность квантования - не менее 8 бит на отсчет • сигнал яркости и цветоразностные сигналы должны кодироваться раздельно. Легко вычислить, что результирующая скорость передачи видеоданных составляет 216 Мбит/с. Запись потока 216 Мбит/с стоит очень дорого. Радиочастотная передача 216 Мбит/с требует занятия 10 каналов обычного аналогового ТВ. Получается, что только для того, чтобы сравняться с аналоговым ТВ, надо сжать цифровой поток в пропорции 10:1. Однако, для экономического выживания новых систем они должны не только сравняться, но и превзойти старые системы. Поэтому желательны еще большие коэффициенты сжатия. Алгоритм MPEG–2 обеспечивает сжатие потока данных до 40:1. Такой коэффициент сжатия означает, что через канал обычного аналогового композитного ТВ можно передавать до четырех различных программ MPEG.

Как сжимается цифровой поток? Любой источник изображения, в той или иной мере, обладает избыточностью. Цель сжатия состоит в том, чтобы сохранить только важную в информационном отношении часть видеосигнала. Какие же составляющие видеосигнала можно считать избыточными? Во-первых, имеется избыточность в смысле ограниченности человеческого зрения. Большая часть активно воспринимаемой информации о крупных деталях изображения сосредоточена на низких пространственных частотах. Глаз и мозг человека не нуждаются во всей информации, фактически содержащейся в исходном видеокадре, и до определенного порога спокойно относятся к искажениям на высоких пространственных частотах. Грубое квантование или даже полное отбрасывание мелких деталей позволяет сжать объем видеоданных в несколько раз. Важно подчеркнуть, что речь идет о двумерной обработке, т.е. полностью отбрасываются, прежде всего, точечные объекты, размеры которых малы как по горизонтали, так и по вертикали. Детали типа вертикальных линий не отбрасываются, лишь контраст подобных деталей передается не вполне точно. Во-вторых, имеется избыточность передачи фаз движения, поскольку значительная часть видеокадра обычно занята статическим или равномерно перемещающимся фоном. Эта часть может быть сравнительно легко предсказана по предыдущему или последующему видеокадру. Телевизионные поля передаются с периодом 33 или 40 миллисекунд. За такой короткий интервал времени изображение не так уж сильно изменяется. Один из основных принципов сжатия по алгоритму MPEG - это передача только той информации, которая изменяется от кадра к кадру. Тем самым объем передаваемых данных дополнительно снижается в среднем на 50 %.

Page 2: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

2

Обработка видеосигнала кодером сжатия устраняет присущую ему избыточность. При этом декодированное ("разжатое") изображение несколько отличается от исходного ("сжимаемого"). Предполагается, что эти различия приемлемы для зрителя, т.е. незаметны или малозаметны.

История вопроса Применительно к статическим цветным полутоновым изображениям алгоритмы сжатия были впервые разработаны в рамках МОС/МЭК совместной рабочей группой экспертов по фотографии (JPEG = Joint Photographic Experts Group). Этот формат основан на нескольких основополагающих принципах: 1. Поблочная развертка, при которой квадратные блоки элементов изображения (пикселов) обрабатываются

последовательно слева направо и сверху вниз. Размер блоков жестко фиксирован и сравнительно мал - 8 х 8. 2. Сжатие данных, при котором исходные значения пикселов заменяются либо на округленные значения

спектральных компонентов, либо на значения разностей соседних пикселов. Первый способ основан на Дискретном Косинусном Преобразовании (DCT = ДКП), а второй на Дифференциальной Импульсно-Кодовой Модуляции (DPCM = ДИКМ). На практике более эффективный, хотя и более сложный в реализации, способ ДКП полностью вытеснил способ ДИКМ. Стандарт JPEG предусматривает и так называемый режим "сжатия без потерь" (lossless compression), при котором все цифровые значения всех элементов исходного изображения восстанавливаются абсолютно точно. В этом случае JPEG выступает как один из алгоритмов архивирования, подобно алгоритмам ZIP, ARJ, и т.п. Однако в реальных применениях "сжатие без потерь" почти всегда заменяют на "сжатие с приемлемыми потерями".

3. Многоступенчатый вывод изображения, при котором зритель видит сперва грубое приближение, а затем все более четкое изображение с большим числом мелких деталей.

Модифицированный вариант M-JPEG (Motion-JPEG), приспособленный для пространственного кодирования отдельных кадров ТВ сигнала, широко применялся в видеосерверах и системах видеомультипликации. Группа экспертов по движущимся изображениям (MPEG = Motion Picture Experts’ Group) была создана в 1988 году с целью разработки стандартов кодирования движущихся изображений со звуковым сопровождением для записи, передачи и распределения этого вида цифровых данных. В своей работе эта группа использовала не только большой опыт, накопленный при применении формата JPEG, но и многолетний опыт использования систем сжатия видеосигналов, среди которых наибольшее распространение в Европе получили компонентные системы со скоростями 24 Мбит/с и 34 Мбит/с, а в Америке - композитная система со скоростью 45 Мбит/с. Первоначальный вариант формата MPEG (MPEG–1 по стандарту ISO/IEC 11172) предназначен, прежде всего, для видеоконференций и видеотелефонной связи. Высокая степень сжатия обеспечивается путем сочетания внутрикадрового кодирования с кодированием межкадровых разностей. Однако этот вариант имеет ряд существенных ограничений - низкая скорость потока (1.5 Мбит/с) не позволяет даже приблизиться к качеству аналогового ТВ, невозможна передача изображений с чересстрочным разложением, и т.д. Тем не менее, формат MPEG–1 все еще широко применяется в области мультимедиа и в бытовой технике. Сигналы, кодированные по алгоритму MPEG–1, постепенно выходят из употребления, и, естественно, новым чемпионом стал MPEG–2. Формат MPEG–2 обогащен многими принципиально новыми идеями - применены переменные шкалы квантования, введено гибкое управление буфером, допускаются как постоянные, так и переменные скорости результирующего цифрового потока, включены различные алгоритмы сжатия звукоданных и регламентированы способы передачи дополнительных данных. В рамках семейства форматов MPEG имеется множество подвариантов, и традиционные различия в стандартах разложения все еще имеют значение. Например, система MPEG–2/50 не совместима с системой MPEG–2/59.94, а любое преобразование потоков с изменением частоты полей остается чрезвычайно сложной и дорогостоящей операцией. Практически все современные системы сжатия видеоданных, так или иначе, связаны с MPEG. На его основе функционируют системы цифрового вещания по стандартам DVB и ATSC, системы бытовой и профессиональной видеозаписи DVC, DVCPro, Digital-S, DVD, SX, а также многие другие системы.

Page 3: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

3

Рис. 2.1.1 Генеалогия формата MPEG-2.

JPEGНеподвижныеизображения

M-JPEGПодвижныеизображенияНизкое сжатие

Простой видеомонтаж

MPEG-11.5 Мбит/с

Мультимедиа

Без чересстрочности

ETSI34 Мбит/сСбор и

распределениеТВ программ

MPEG-2Большой наборпараметров

потокаи разложений

DVBЦифровоеТВ вещание

ATSCЦифровоеТВ вещание

DVC, DVD, SX, ...Цифровая

видеозапись

MPEG-4до 64 кбит/сКонтекстно-

ориентированныйформат

MPEG-7

в стадииразработки

MHEG

Новая бытоваявидеотехника

Page 4: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

4

Что такое MPEG-2? Стандарт MPEG-2 - это: • Метод сжатия видео- и звукоданных и описание средств их пакетирования • Описание мультиплексированного цифрового потока и правил его декодирования (т.е. эталонного декодера) • Свобода (неопределенность) выбора конкретных приемов формирования этого потока. Они оставлены на

усмотрение разработчиков аппаратуры. • Свобода (неопределенность) выбора метода передачи потока. Методы передачи, например методы

радиочастотной модуляции, зависят от конкретных приложений и оговариваются отдельными стандартами. Таким образом, стандарт MPEG представляет собой всего лишь набор стандартизированных правил и методов сжатия данных. В пределах этих правил фигурирует огромное число вариантов и разновидностей цифрового потока сжатых данных. В этом смысле нельзя говорить о сигнале MPEG с той же степенью определенности, с какой мы говорим о сигнале PAL, или о сигнале SECAM.

Как аппаратура MPEG–2 относится к сигналам MPEG–1? Все декодеры новой системы MPEG–2 любого уровня и профиля должны быть способны декодировать цифровые потоки, удовлетворяющие требованиям MPEG–1. Это условие называется "условием восходящей прогрессирующей совместимости". Обратное требование, - декодирование потоков MPEG–2 декодерами MPEG–1, не обеспечивается. Следует пояснить, что в общей терминологии систем передачи информации различают следующие виды совместимости старых и новых систем: 1. Прогрессирующая совместимость (forward compatibilty = совместимость "вперед"). Означает способность

новой системы воспринимать сигналы старой системы. Например, цветной телевизор способен качественно воспроизводить изображения черно-белого ТВ.

2. Регрессирующая совместимость (backward compatibilty = совместимость "назад"). Означает способность старой системы воспринимать, хотя бы частично, сигналы новой системы. Например, обратная совместимость системы цветного ТВ SECAM означает, что черно-белый телевизор способен, хотя бы в черно-белом виде и с некоторыми перекрестными помехами, воспроизводить изображения цветного ТВ.

3. Восходящая совместимость (upward compatibilty = совместимость "вверх"). Означает способность новой системы с более высокими параметрами, в частности - с более высоким разрешением, воспринимать сигналы старой системы с низкими параметрами. Например, монитор с горизонтальным разрешением 1024 пиксела обычно способен качественно воспроизводить изображения с разрешением 800 или 640 пикселов.

4. Нисходящая совместимость (downward compatibilty = совместимость "вниз"). Означает способность старой системы с низкими параметрами воспринимать сигналы новой системы с более высокими параметрами. Это требование почти всегда игнорируется, поэтому привести пример затруднительно. Отдельные попытки создания обратно совместимых систем ТВ высокой четкости кончились плачевно. Сигналы всех успешно функционирующих систем ТВЧ просто-напросто не могут приниматься приемниками ТВ обычной четкости.

В большинстве случаев MPEG–2 представляет собой расширение MPEG–1. Например, зигзагообразное сканирование коэффициентов MPEG–1 является одним из двух возможных методов сканирования коэффициентов MPEG–2. Однако некоторые составляющие метода MPEG–1 не имеют никакого прямого соответствия в MPEG–2.

Стандарты MPEG Система MPEG–2 описана в Международном Стандарте МОС/МЭК 13818 "Информационные технологии – Общий метод кодирования движущихся изображений со звуковым сопровождением" [ISO/IEC 13818 Information technology - Generic coding of moving pictures and associated video], который при публикации разделяется на отдельные разделы (части). Наиболее важными среди них являются первые четыре части: • 13818–1 "Системы" – описывает кодирование на системном уровне. Определяет структуру временного

уплотнения видео- и звукоданных, средства и данные синхронизации в реальном времени. Эта часть эквивалентна Рекомендации ITU–T H.261.

• 13818–2 "Видео" – описывает кодированное представление видеоданных и процесс декодирования, позволяющий восстановить исходные изображения. Эта часть эквивалентна Рекомендации ITU–T H.262.

• 13818–3 "Звук" – описывает кодированное представление звукоданных • 13818–4 "Испытания на соответствие" – описывает процедуры определения характеристик кодированных

потоков и процедуры проверки на соответствие требованиям документов 13818–1, 13818–2 и 13818–3.

Page 5: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

5

Последний из четырех упомянутых документов заслуживает специального пояснения. Дело в том, что из-за чрезвычайной сложности и многослойности стандарта фирмы-изготовители аппаратуры, иногда сознательно, а чаще неумышленно, допускают отклонения от "канонического алгоритма". Тем не менее, при подключении такого "нестандартного" декодера, изготовляемого, скажем фирмой "А", к выходу кодера, изготовляемого этой же фирмой, все прекрасно функционирует. Неприятности могут начаться при подключении декодера, изготовляемого фирмы "А", к выходу кодера, изготовляемого фирмой "Б", причем они не обязательно затронут все возможные режимы работы. В то же время, вполне вероятно, что декодер фирмы "А" будет прекрасно декодировать сигнал кодера фирмы "В". В англоязычной терминологии такая совместимость конкретных аппаратов получила наименование "interoperability", что означает "способность к совместной работе". Отсюда и необходимость разработки специальных стандартизированных методов проверки аппаратуры на соответствие "букве закона". В этой области активно работает специально созданная организация - "ProMPEG Forum". Работа по стандартизации MPEG идет непрерывно. Примером может служить седьмой раздел стандарта - документ ISO/IEC 13818-7 (1996): "Усовершенствованное кодирование звука = Advanced Audio Coding (AAC)". Структура всего комплекса стандартов МОС, относящихся к MPEG2, поясняется следующей таблицей: Номер раздела Наименование раздела (части) Текущий статус 13818-1 Systems 1-я редакция. 1996-04-15 13818-1 Дополнение 1 Дополнение 2

Amd. 1: Registration procedure for “copyright identifier” Amd. 2: Registration procedure for “format identifier”

1997-12-15

13818-2 Video 1-я редакция. 1996-05-15 13818-2 Дополнение 1

Дополнение 1: Registration of copyright identifiers 1997-12-15

13818-2 Дополнение 2

Дополнение 2: 4:2:2 profile 1997-12-15

13818-3 Audio 1-я редакция. 1995-05-15 13818-3 Audio. Дополнение 1 1996-06-15 13818-4 Проект Compliance testing Не завершен 13818-5 TR Software simulation 1-я редакция. 1997-12-15 13813-6 Проект Extensions for DSM-CC Не завершен 13818-7 Advanced Audio Coding (AAC) 1-я редакция. 1997-12-01 13818-9 Extension for real time interface for systems decoders 1-я редакция. 1996-12-15

Важным достоинством MPEG является его чрезвычайная гибкость, позволяющая применять те же алгоритмы в обширном спектре применений от маленького видеотелефонного окна на экране компьютера до широкоэкранных ТВЧ изображений со стереозвуком. Различные градации качества и скорости передачи обеспечиваются путем переключения так называемых "уровней" и "профилей" MPEG. В настоящее время не существует единых общепринятых международных стандартов для электрических стыков, алгоритмов шифрования и методов модуляции сигналов MPEG, однако в этих направлениях ведется интенсивная работа. Во многих случаях уже выявились претенденты на победу, т.е. можно ожидать принятия одного-двух вариантов в качестве основных, рекомендованных для широкого применения. Наиболее вероятный победитель - формат SDTI (Serial Data Transport Interface) по стандарту SMPTE305M, в основе которого лежит идея передачи произвольных, по существу, - асинхронных, пакетированных данных через инфраструктуру широко распространенного формата SDI. Через стык SDTI можно передавать сигналы DV, DVCPro, DVD, SX, потоки MPEG-2 различной, в том числе переменной, скорости, и многие другие виды данных. Информационная скорость передачи 9-битных данных - до 200 Мбит/с через тракты SDI 270 Мбит/с, и до 270 Мбит/с через тракты SDI 360 Мбит/с. С другой стороны, на практике наиболее распространенным в настоящее время является формат DVB-ASI (ASI = Asynchronous Serial Interface, называемый также "MPEG2 Serial Interface" или "M2S"). Он лишь частично совместим с форматом SDI 270 Мбит/с (из-за фиксированной полярности импульсного сигнала) и применяется только для передачи сжатых потоков MPEG-2.

Page 6: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

6

В США и других странах делаются, пока весьма ограниченные, попытки внедрения формата SSI по стандарту SMPTE310M - Synchronous Serial Interface for MPEG-2 Digital Transport Stream. Стык SSI хорошо обеспечивает подачу потоков до 40 Мбит/с от кодера сжатия на блок канального кодирования, однако этим область его применения практически полностью исчерпывается. В тексте стандарта прямо указывается на непригодность этого стыка для работы в условиях наличия даже весьма редких ошибок передачи.

DVB и ATSC Проект DVB (Digital Video Broadcasting = цифровое видеовещание) был официально открыт в сентябре 1993 года. Он возник в результате добровольного объединения более 200 общественных и частных организаций 25 стран мира. Цель проекта - согласовать параметры систем, обеспечивающих цифровое вещание сигналов MPEG–2. Работы по проекту DVB обеспечили пользователям максимально возможную аппаратную и программную совместимость при разнообразии средств доставки и записи сигналов, - спутниковых, наземных, кабельных, коммунальных спутниковых (Satellite Master Antenna TV = SMATV) и других. Все системы, удовлетворяющие требованиям DVB, должны использовать общие ключевые элементы. К ним относятся кодирование звука и изображения по методу MPEG, а также коррекция ошибок по коду Рида-Соломона. Другие элементы должны быть подобраны с учетом используемых средств доставки. Таковыми являются метод модуляции и канальное кодирование. Для различных служб применяются различные методы модуляции, в частности для кабельных систем выбрано несколько разновидностей QAM (квадратурной амплитудной модуляции), для спутниковых восходящих линий лучше подходит QPSK (квадратурная фазовая манипуляция), а для наземного вещания - особо устойчивая к помехам модуляция типа OFDM (частотное разделение каналов с ортогональными несущими). Отработка параметров наземных, спутниковых и кабельных систем уже завершена, началось массовое изготовление приемников-декодеров DVB и вещание соответствующих программ.

Рис. 2.1.2. Спутниковое вещание с условным доступом Большинство параметров DVB оговорено европейскими стандартами. Однако некоторые параметры, например параметры систем шифрования и условного доступа, остаются прерогативой фирм-изготовителей аппаратуры. Тем не менее, они тоже регламентируются соответствующими документами, важнейшими среди которых являются следующие европейские стандарты: • ETR 289: "Digital Video Broadcasting (DVB); Common Scrambling (CS) system description". • ETS 300 468: "Digital Video Broadcasting (DVB); Specification for Service Information (SI) in DVB systems". • ETR 211: "Digital Video Broadcasting (DVB); Guidelines for the usage of Service Information (SI) in DVB systems".

Page 7: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

7

Альтернативой проекту DVB явилось организация в США при поддержке американского правительства комитета по усовершенствованным ТВ системам - ATSC (Advanced Television Systems Committee). Первоначально утверждалось, что стандарт ATSC - это, прежде всего, стандарт ТВЧ, а стандарт DVB не поддерживает режимы высокой четкости. Затем стало ясно, что обе системы способны поддерживать широкий диапазон разрешений, - от пониженной до высокой четкости. Большие споры возникли по применению различных методов передачи звукового сопровождения и сжатия звукоданных, в частности относительно системы AC-3. Эта система запатентована фирмой Dolby и широко применяется для цифровой записи звука кинофильмов. Однако дальнейшее развитие обоих конкурирующих систем привело к их сближению, и в настоящее время существенные различия между DVB и ATSC остаются только в области радиочастотной передачи. Стратегически важным является переход к выпуску индивидуальных приемников-декодеров (IRD), поддерживающих оба мировых стандарта цифрового ТВ - ATSC и DVB. В документах Исследовательской Комиссии 11 эти два достаточно сильно отличающихся стандарта отныне именуются просто - Стандарт "А" (ATSC) и Стандарт "B" (DVB). Здесь следует вновь отметить, что принятый во всем мире стандарт MPEG-2 - это стандарт кодирования, но не стандарт передачи. На уровне радиочастотной модуляции транспортных потоков наземного вещания стандарт "А" - это, прежде всего, восьмиуровневая амплитудная модуляция с частично подавленной боковой полосой. Он обеспечивает передачу транспортных потоков порядка 20 Мбит/с через обычные американские каналы с полосой пропускания 6 Мгц. Стандарт "B", напротив, предусматривает передачу цифрового потока наземного вещания на относительно более высокой скорости 6 х 6 = 36 Мбит/с в полосе 7 Мгц путем спектральной модуляции типа C-OFDM с множеством ортогональных несущих.

Особенности вещания в MPEG Стандарт MPEG-2 предназначен для эффективного сжатия видео и звуковых сигналов, однако, при его разработке весьма слабо учитывались особенности технологии ТВ вещания. Любая вещательная организация, желающая воспользоваться преимуществами формата MPEG, сталкивается с серьезными проблемами в части взаимодействия и совместимости, как с другими системами сжатия, так и с существующей практикой создания и распределения программ. Имеет смысл напомнить некоторые свойства сигнала "обычного" аналогового ТВ в сравнении со свойствами сигналов цифрового ТВ. Исходные составляющие в обоих случаях почти идентичны:

Рис. 2.1.3. Составляющие программного ТВ сигнала

Рис. 2.1.4. Непрерывная аналоговая передача составляющих сигнала обычного телевидения

Page 8: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

8

Рис. 2.1.5. Пакетная передача составляющих сигнала цифрового телевидения

Рис. 2.1.6. Передача многопрограммного сигнала цифрового телевидения

Рис. 2.1.7. Иерархия основных составляющих сигнала цифрового телевидения

Page 9: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

9

Очевидно, что по сравнению с аналоговым ТВ цифровое ТВ не просто наращивает объем передаваемой информации, но и обладает новыми свойствами. В частности, наличие в составе сигнала кодовых таблиц системной информации (обозначенных на рисунке SI и PSI) создает принципиально новые возможности многоязычного звукового сопровождения, увязки группы каналов в "букет" и т.д. Однако, при этом возникают и новые проблемы. Сбой в передаче системной (иерархической) информации, как, впрочем, и ошибка при заполнении таблиц системной информации, полностью исключает правильный прием даже отдельных составляющих транспортного потока.

Коммутация и редактирование потоков MPEG Поскольку MPEG–2 - это полноправный ТВ сигнал, то возникает потребность в его коммутации и редактировании подобно тому, как это делается с традиционными компонентными или композитными сигналами. Однако простое переключение сигналов MPEG–2 без сброса регистров декодера вряд ли возможно. Простым, но далеко не самым лучшим, решением является полное декодирование сжатого потока, переключение обычных (полнопоточных) видео и звуковых сигналов, а затем повторное сжатие цифровых потоков. Со временем, наверное, удастся полностью перейти к монтажу и переключению преимущественно сжатых цифровых потоков. Однако, в течение длительного периода многие организации будут продолжать применять ранее установленные виды оборудования, использующие высокоскоростные (несжатые) цифровые сигналы. На практике это означает декодирование всех сжатых сигналов до стандартного формата 270 Мб/с, микширование на высокой скорости, и вновь сжатие. Операции сжатия-разжатия становятся многократными и соответственно растут связанные с этим трудности. Иерархическое сжатие, начиная с высоких скоростей порядка 25 Мб/с, и затем, поэтапно сжимая сигнал все сильнее, вряд ли поможет в условиях массированного заимствования "чужих" сильно сжатых сигналов и дефицита емкости средств записи программ. Ключевой здесь является технология MOLE, которая впервые обеспечивает свободное от потерь перекодирование, переключение и монтаж цифровых потоков MPEG в ТВ студиях. В основе технологии MOLE лежит тот факт, что любой сигнал MPEG содержит описание всех решений, принятых сформировавшим его кодером. При обычном декодировании MPEG эти сведения используются однократно - только для расжатия сигнала, и недоступны последующим звеньям тракта. Поэтому повторное сжатие добавляет свои новые искажения. Напротив, декодер MPEG, использующий технологию MOLE, сохраняет эти сведения и включает их в свой выходной сигнал, поэтому последующий кодер сжатия, по существу, просто повторяет действия первого кодера, т.е. искажения не накапливаются. Более того, даже если второй "местный" кодер уступает первому высококачественному "центральному" кодеру, качество сквозного тракта будет ограничено, в основном, качеством первого кодирования. Ведущие вещательные организации и фирмы-изготовители аппаратуры уже присоединились к технологии MOLE, заявили о намерении ее применять и выступили в поддержку стандартизации этой технологии в рамках SMPTE.

Измерения в трактах MPEG Известно, какое большое значение имеют испытательные строки и испытательные сигналы. Они, по существу, являются основным инструментом поддержания качества по всему сквозному тракту обычного ТВ. Их эквивалентом в цифровом ТВ являются специальные эталонные (тестовые) потоки MPEG. В отличие от аналогового ТВ в цифровом вещании имеется возможность вводить в транспортный поток не только отдельные испытательные строки, но и существенно более сложные тесты, например тест-таблицы. Испытательные потоки MPEG могут выступать как отдельные транспортные потоки (например, при проверке приемников на месте их производства), или как компоненты транспортного потока на правах отдельной программы, либо аварийной заставки. Здесь следует зафиксировать большое значение проекта TCM (Test Card "M"), в котором объединили свои усилия ведущие вещательные компании Великобритании и Независимая Комиссия по Телевидению (ITC). В настоящее время близится к завершению процесс стандартизации разработанных по этому проекту тестовых сигналов.

Page 10: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

10

Тест-таблицу "М" можно сравнить с айсбергом, на вершине которого располагается легко декодируемое традиционное тест-изображение, а ниже имеются разнообразные подвиды тестов для проверки приемников, мультиплексоров, трактов передачи, и т.п.

Рис. 2.1.8. Испытательная таблица "М", вариант VIDn001b

Верхняя часть этого айсберга доступна всем и может применяться, например, при коммерческих демонстрациях ТВ приемников. В определенное время суток она может быть составной частью передаваемых программ (точно так же, как это делается сейчас в аналоговом ТВ). Подводная же часть предназначена для более квалифицированных пользователей - поставщиков комплексов и отдельных устройств, эксплуатационного персонала вещательных компаний, и т.д. Записанные тесты могут передаваться во время регламентных работ и/или распространяться в виде дисков CD-ROM для проигрывания на специализированном оборудовании. Эквивалентом таких традиционных измерительных приборов, как осциллограф и вектороскоп, в цифровом ТВ являются анализаторы потоков и контрольные декодеры. Здесь следует различать отладку систем, приемо-сдаточные испытания и ежедневную эксплуатацию. Если для первых двух применений требуются дорогие многофункциональные анализаторы высокой сложности, то при эксплуатации отлаженной системы большее значение имеет мониторинг транспортных потоков и учет ошибок, - прежде всего, человеческих ошибок операторов передающих центров и разного рода нестыковок между различными вещательными и связными организациями.

Организация вещательных комплексов и сетей вещания Чтобы соблазнить зрителя на приобретение цифрового приемника, последний должен обладать явно выраженными преимуществами. Качество изображения должно быть, по крайней мере, не хуже качества аналогового ТВ, стыки между частями программы гладкими и незаметными, а сигналы должны быть пригодны для редактирования и обработки эффектами в любом звене тракта. Последнее требование особенно важно для сетей первичного распределения MPEG. Следует подчеркнуть, что системы прямого спутникового вещания на первых этапах своего развития не обладают свойствами сетей, и поэтому в определенной мере свободны от этих проблем. Если все программы поступают из одного центра на несколько синхронно работающих восходящих сегментов спутникового тракта прямого вещания, то все просто и ясно. Но только на первых этапах развития! На последующих этапах возникает потребность транскодирования потоков (для подгонки скоростей передачи при включении дополнительных программ), ремультиплексирования транспортных потоков (например, для перекомпоновки букетов заимствованных программ), коммутации и микширования сигналов MPEG-2 (например, для ввода рекламных вставок). Как это выглядит с точки зрения вещательной организации? Программные материалы поступают из разных источников и в разных форматах. Часть этих материалов оказывается уже подвергалась композитному декодированию и/или сжатию потока, что-то заимствуется у других сетей вещания, иногда надо вставлять новый логотип, добавляются еще и проблемы с изменяемым форматом кадра.

Page 11: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

11

Экономическая эффективность требует снижения скоростей потоков, но при сохранении приемлемого уровня качества. Регулирующие органы и различные инспекции настаивают на высоком качестве по политическим соображениям, а для продюсеров и заказчиков рекламы качество изображения тоже далеко не последний вопрос. В этих условиях, чтобы достичь эффективного использования цифровых каналов при сохранении качества, вещатели должны тщательно следить за выходными сигналами кодеров сжатия и мультиплексоров транспортных потоков. К счастью, уже создан целый набор средств, помогающих достичь поставленных целей. Хотя это уже и не совсем новость, но имеет смысл еще раз напомнить - без предобработки сигналов многоступенчатыми блоками шумоподавления и фильтрации нельзя даже надеяться на их эффективное сжатие кодерами MPEG. Дело в том, что случайные по своей природе шумы и помехи не обладают той самой избыточностью, которую так эффективно устраняет кодер сжатия. Поэтому значительная часть ресурса кодера сжатия оказывается истраченной "попусту" - на передачу шумов, а на передачу собственно изображения ресурсов уже не хватает. В результате качество разжатого изображения существенно снижается. Специализированные шумоподавители не только снижают уровень шумов, но и подавляют те компоненты изображения, которые практически незаметны для зрителя, однако особенно сильно расходуют ресурс кодера сжатия, - например движущиеся диагональные структуры. Именно поэтому аппаратура предобработки и шумоподавления серии PREFIX так широко применяется во всем мире.

Рис. 2.1.9. Передающий центр цифрового вещания

Page 12: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

12

Радиочастотная передача сигналов MPEG-2 В аналоговых системах сигнал всегда передается и принимается в более или менее искаженном виде, однако это не мешает нормальному функционированию системы. ТВ приемники подстраиваются путем просмотра (и прослушивания) программы с целью достижения наилучшего качества изображения и звука. Ухудшение и улучшение условий приема может быть оценено непосредственно. В цифровых системах такой подход попросту не работает, поскольку принимаемое изображение либо характеризуется как "полнокачественное", либо вовсе пропадает. Это же относится и к приему звукового сопровождения. Сформированный в передающем центре многопрограммный транспортный поток для повышения помехоустойчивости обрабатывается канальным кодером, а затем подается на модулятор и, далее, на передающую антенну восходящего сегмента спутниковой системы вещания. На этом этапе обычно не возникает никаких особенных проблем. Проблемы возникают при приеме сигнала, качество которого зависит от множества факторов: географического местоположения точки приема, размера и ориентации приемной антенны, качества СВЧ конвертера, стабильности положения и ориентации спутника, электромагнитного загрязнения местности, погодных условий, и т.д. Однако, в конечном счете, воздействие всех этих факторов может оцениваться одним простым параметром - отношением несущая-шум на входе тюнера. Для оценки этого параметра можно вполне успешно использовать имеющиеся высокочастотные измерители общего назначения, т.е. не требуются какие-либо специфические приборы, разработанные специально для систем цифрового ТВ. Отношение несущая-шум должно быть достаточно большим, чтобы обеспечить частоту битовых ошибок на выходе канального декодера не более 10-11. Эта величина приблизительно обозначает порог нормальной работы индивидуального приемника-декодера. Конкретная величина отношения несущая-шум, при которой декодер достигает опасного порога, зависит также и от качества тюнера. К сожалению, бытовые приемники-декодеры не имеют каких-либо индикаторов или измерителей частоты ошибок, а выход канального декодера недоступен для внешнего подключения. Поэтому приходится использовать косвенные методы.

Рис. 2.1.10. Прием сигнала цифрового телевидения при наличии искажений и помех

В какой-то момент цифровой приемник может оказаться на пределе своих возможностей, но все еще выдавать хорошую картинку, а затем при изменении на доли децибела вдруг обрушиться и вовсе перестать декодировать сигнал. Для нормальной эксплуатации системы вещания жизненно важно знать, насколько далеко от "цифрового обрыва" находится ситуация с приемом сигнала. Здесь могут оказаться полезными стрессовые испытания с умышленным ухудшением условий приема. Простейший пример: частичное затенение приемной антенны. Если оно приводит к срыву приема, то "обрыв" опасно близок. Если же и при потере части принимаемой энергии приемник выдает хорошую картинку, то дела не так уж плохи. Естественно, такие "любительские" способы не могут подменять профессиональные замеры и оценки условий приема.

Page 13: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

13

2. Формирование и передача цифровых потоков по стандарту MPEG-2

2.2 Сжатие видеоданных Прежде всего, следует отметить, что в официальных документах, описывающих процесс сжатия, преобладает подход специалистов по информатике и системам связи, а применяемая терминология также была привнесена, главным образом, из этих областей техники. Ключевым словосочетанием здесь является "синтаксис потока", т.е. сугубо формальное описание алгоритма и его параметров. Такой "дедуктивный" подход, заключающийся в описании процесса, начиная с самого верхнего (системного) уровня, во многом противоположен традиционному для видео и звукоинженеров "индуктивному" подходу, при котором последовательно описываются все операции обработки сигнала, - "от входа к выходу". Здесь мы будем придерживаться более легкого для восприятия и традиционного для видеотехники подхода. К собственно сжатию не относятся такие функции кодера MPEG как кодозащита, пакетирование данных, объединение (мультиплексирование) полученных потоков данных с другими потоками такой же, или иной природы, ограничение доступа к определенным типам данных, и т.д. Эти функции специфичны для передачи конкретных видов данных, поэтому имеет смысл рассматривать их отдельно.

Основные составляющие процесса сжатия видеоданных Процесс сжатия видеоданных можно условно разделить на четыре этапа: 1. Колориметрическое преобразование сигналов R, G, B в Y,Cb, Cr (только при использовании входных

данных в формате R, G, B) и передискретизация цветоразностных сигналов Cb, Cr. Как правило, для пересчета сигналов RGB в сигналы YCbCr применяются стандартные колориметрические коэффициенты и уровни квантования по Рекомендации 601, хотя стандарт допускает и другие варианты. Четкость сигналов Cb, Cr на этом этапе может, как сохраняться, так и снижаться: в два или в четыре раза - соответственно только по горизонтали, либо по вертикали и горизонтали.

2. Предсказание кадра на основе предыдущих и/или последующих кадров с локальной оценкой движения и его компенсацией. Этот этап обычно называют сокращением или устранением временной избыточности.

3. Двумерное Дискретное Косинусное Преобразование и адаптивное переквантование (огрубление) полученных цифровых значений коэффициентов ДКП. Именно на этом этапе возникают наиболее существенные искажения изображения.

4. Статистическое (энтропийное) кодирование огрубленных значений с помощью кода Хаффмана. При этом никаких искажений изображения не возникает, а объем данных существенно снижается. Совокупно третий и четвертый этапы реализуют устранение пространственной избыточности.

Управление скоростью результирующего потока сжатых видеоданных (например, для поддержания постоянной скорости этого потока) осуществляется тремя способами: - путем изменения шкал квантования, т.е., в конечном счете, путем снижения или повышения качества

декодированного изображения - путем изменения порядка сканирования коэффициентов ДКП для регулировки эффективности энтропийного

кодирования - путем ввода "пустых" данных дополнительного потока (stuffing), который никак не влияет на качество

декодированного изображения, но позволяет скорректировать слишком низкую скорость потока. Комбинируя вышеуказанные способы, разработчики кодеров сжатия стремятся обеспечить не только само по себе качество изображения отдельных кадров или фрагментов видеопрограммы, но и однородность (consistency) этого качества. Задача чрезвычайно трудна, но, как говорится, "игра стоит свеч". Дело в том, что зритель довольно спокойно относится к общей потере качества, например, к потере четкости диагональных движущихся структур, но крайне болезненно воспринимает частые изменения качества, например, резкие изменения контраста диагональных структур (мерцания и дрожания). Именно здесь проходит линия водораздела между примитивным и высококачественным оборудованием сжатия.

Page 14: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

14

В отличие от кодера, декодер MPEG не обладает какой-либо свободой принятия решений. Декодер лишь реализует все предусмотренные стандартом функции преобразовании данных в соответствии с получаемыми от кодера инструкциями, но в порядке, обратном обработке данных в кодере. Декодер реализует следующие функции: - выделение необходимых данных из мультиплексированного потока и распаковка пакетированных данных - декодирование кодов Хаффмана (восстановление кодов фиксированной длины) - обратное квантование, восстанавливающее огрубленные значения коэффициентов ДКП полного диапазона - обратное Дискретное Косинусное Преобразование, приблизительно восстанавливающее значения пикселов - реконструкция полной решетки дискретизации всех видеокадров с компенсацией движения и записью

полученных значений пикселов в правильные адреса буфера кадровой памяти - обратное колориметрическое преобразование Y,Cb, Cr в R, G, B (опционно и композитное кодирование) Рассмотрим пространственно-временную обработку сигналов изображения в кодере MPEG-2.

Рис. 2.2.1 Пространственно-временная обработка при сжатии видеоданных

Устранение временной избыточности и предсказание видеокадров Как видно из рисунка 2.2.1 исходными для всего процесса сжатия являются три прямоугольные матрицы отсчетов сигналов RGB или YCbCr (в европейском инженерном жаргоне вместо правильного обозначения YCbCr очень часто используется унаследованное от системы PAL обозначение YUV). Размеры матриц Y и Cb, Cr могут быть как одинаковыми, так и различными. Предусмотрено достаточно большое число допускаемых стандартом вариантов размеров и соотношений размеров этих матриц. Дело в том, что стандарт MPEG-2 предусматривает не только передачу изображений вещательного ТВ, но и множество других применений. Однако, в любом случае размеры матрицы по горизонтали и вертикали должны быть кратны 16. Это связано с поблочным спектральным преобразованием отсчетов изображения методом Дискретного Косинусного Преобразования (Discrete Cosine Transform). Даже, если размер исходного изображения не кратен 16, то для целей обработки оно всегда дополняется "пустыми" пикселами до кратного размера. Один из основных принципов сжатия - это передача только той информации, которая изменяется от кадра к кадру. Межкадровое предсказание само по себе плохо справляется со сценами, где много движения. Компенсация движения позволяет более точно предсказывать те части изображения, где движение можно измерить. Если движение измерено достаточно точно, то для каждого макроблока элементов изображения (размером 16 x 16 элементов) можно передавать лишь относительно малые межкадровые различия плюс двумерный вектор

Page 15: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

15

движения. Следует подчеркнуть, что в данном применении ошибки в измерении вектора движения не приводят к каким-либо заметным искажениям изображения, а лишь снижают эффективность сжатия, т.е. приводят к возрастанию передаваемого потока.

Кадровый буферИзображение

Рис. 2.2.2 Вычисление межкадровых разностей для предсказания кадра

Кадровый буферс компенсацией движения

Векторы движения

Изображение

Рис. 2.2.3 Предсказание кадра с компенсацией движения

Рис. 2.2.4 Вычисление вектора движения

Процедуры оценки и компенсации движения относятся к числу наиболее сложных. Стандартом предусмотрено четыре варианта компенсации движения: кадровая компенсация (frame motion compensation), полевая компенсация (field motion compensation), внутриполевая компенсация "16 х 8", и двухступенчатая компенсация с уточнением вектора (dual prime motion compensation). Некачественная (упрощенная) оценка, а, следовательно, и неполная компенсация движения, могут приводить к возрастанию объема сжатых данных в среднем на 15-20 %. Декодер MPEG не способен восстановить все видеокадры длинной последовательности только на основе информации о межкадровых разностях. Время от времени, необходимо посылать к декодеру сжатый (с устранением пространственной избыточности), но не предсказанный (без устранения временной избыточности), видеокадр, или хотя бы макроблок. Такой кадр или макроблок обозначают латинской буквой I (Intra) Некоторые кадры хорошо предсказываются по прошлой информации. Это кадры типа P (Predicted). Видеокадр типа P использует для своего создания (предсказания) ближайший предшествующий кадр (типа I или P). В пределах кадра типа B могут передаваться макроблоки восьми подтипов - предсказанные с компенсацией движения, предсказанные без компенсации движения, вообще не предсказанные (типа I), и даже пропущенные (skipped). Макроблоки подтипа "пропущенный" имеет смысл передавать, например, когда межкадровые разницы не превышают уровня шумов (на ровных участках статического изображения). Кадры, расположенные между кадрами типа I и P, могут быть предсказаны как из прошлого, так и из будущего. Это улучшает качество предсказания, в частности при открывании объектов, ранее перекрытых другими

Page 16: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

16

объектами. Таковы кадры типа B (Bi-directionally predicted). Кадры типа B не используются в качестве исходного материала для построения (предсказания) других кадров. В пределах кадра типа B могут передаваться макроблоки двенадцати подтипов - с предсказанием вперед, предсказанием назад и с двусторонней интерполяцией. Несколько видеокадров типа I, P и B можно объединять в группу, называемую GOP (Group Of Pictures). Размер и структура группы не определяются стандартом, однако, на практике, многие приложения основаны исключительно на фиксированности структуры GOP. Например, для достижения заданного субъективного качества изображения структура I, I, I, I… требует скорости битового потока в 2.5-3 раза большей, чем структура I, B, B, P… Очевидно, что интерполяция даже сравнительно точно предсказанных, но далеко отстоящих во времени, кадров, вряд ли приведет к хорошим результатам. Поэтому разработчики систем стремятся ограничить максимальное расстояние временной интерполяции с тем, чтобы оно не превышало 3-4 кадровых интервалов. Принято обозначать структуру (номенклатуру) группы кадров при помощи двух чисел M и N. Число N обозначает общее число кадров в группе: от первого кадра (обычно - кадра типа I) до последнего кадра (типа P или B), предшествующего начальному кадру следующей группы. Число M обозначает максимальное количество кадров B, расположенных между предсказанными кадрами типа P. Для ТВ вещания чаще всего применяется структура с M=3 N=12, которую иногда обозначают просто (3,12).

Рис. 2.2.5 Пример структуры группы кадров

При передаче группы видеокадров порядок их следования не обязательно должен совпадать с исходным. Напротив, для успешной временной интерполяции необходимо, чтобы к моменту вычисления текущего кадра (типа B или P) все кадры, вносящие в него свой вклад, должны уже присутствовать в памяти декодера. Задача кодера - подавать информацию таким образом, чтобы это условие всегда выполнялось. Поэтому показанная на рисунке последовательность из восьми кадров

I1 B2 B3 P4 B5 B6 B7 P8 должна поступить на вход декодера в следующем порядке:

I1 P4 B2 B3 P8 B5 B6 B7. Для восстановления исходного порядка следования видеокадров декодер должен перегруппировать их в пределах группы, используя соответствующие дополнительные сигналы - временные метки. Рисунок 2.2.5 - это лишь пример. Стандарт MPEG–2 допускает практически любые группировки видеокадров. В частности, допускается группа из одного кадра - типа I. Хотя сжатие данных при этом незначительно, однако такой поток видеоданных легко монтировать. Напомним, что в пределах кадров типа P и B отдельные макроблоки могут иметь другой тип, в частности - тип I. Размер группы может меняться "на ходу". В частности, полезно начинать новую группу в момент смены сюжета и в других случаях, где компенсация движения оказывается неэффективной. Здесь действуют сложные ограничения. Например, если первым идет полукадр B или P, то и следующий за ним второй полукадр должен быть того же тип. Если же первый полукадр относится к типу I, то второй полукадр может быть типа I или B, но не P.

Page 17: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

17

Устранение пространственной избыточности и Дискретное Косинусное Преобразование Устранение пространственной избыточности, именуемое также "внутрикадровой обработкой" (Intra-Frame Coding), происходит, в основном, на уровне блока. Термин "блок" в данном контексте может означать как группу отсчетов исходного, разностного или декодированного изображения, так и группу соответствующих коэффициентов ДКП. Размер блока яркости фиксирован: 8 х 8, т.е. для каждого блока вычисляется и передается 64 коэффициента двумерного ДКП.

Рис. 2.2.6 Устранение пространственной избыточности

ДКП для любителей математики Одномерное ДКП является результатом одностороннего Дискретного Преобразования Фурье (ДПФ) входного блока отсчетов, состыкованного с зеркальным отражением этого же блока. Необходимая скорость вычислений при этом достигается благодаря применению хорошо известных алгоритмов и схемно-технических решений, первоначально разработанных для Быстрого Преобразования Фурье (БПФ). Результат содержит только вещественные значения коэффициентов, поскольку массив входных отсчетов был принудительно симметризован. Другими словами, симметризованный сигнал представляется в виде суммы косинусных составляющих, тогда как амплитуды всех синусных составляющих взаимно компенсируются и оказываются равны нулю. Коэффициенты ДКП описывают не только энергию составляющих на различных пространственных частотах, но и фазу (положение) этих составляющих.

Сигнал Сигнал

ДвустороннийОдносторонний

Спектр Спектр

ОдностороннийДвусторонний

Рис. 2.2.7 ДКП представляет собой всего лишь разновидность ДПФ

Page 18: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

18

Двумерное ДКП - это описанное выше одномерное ДКП, только примененное дважды, - по горизонтали и затем по вертикали.

Рис. 2.2.8 Базовые функции двумерного ДКП

На рисунке левый верхний угол соответствует постоянной составляющей, слева направо возрастает горизонтальная частота, а сверху вниз - вертикальная. Такое представление двумерного спектра отличается от традиционного расположения начала координат в левом нижнем углу, однако оно удобнее для графического представления процесса сканирования (упорядочения) коэффициентов ДКП - слева направо и сверху вниз. ДКП для тех, кто не любит математики ДКП расщепляет блок отсчетов изображения на группу узоров, которые, будучи собраны вместе, образуют исходное изображение. Коэффициенты ДКП описывают долю каждого узора в данном блоке изображения. Интуитивное представление о процессе может быть проиллюстрировано следующим образом. Высокие горизонтальные частоты ответственны за передачу тонких вертикальных линий, а высокие вертикальные частоты - за передачу горизонтальных тонких линий. Диагональные структуры, естественно, передаются высокими диагональными частотами, узоры которых расположены в правом нижнем углу рисунка. Если при вычислении ДКП используется целочисленная арифметика без округления, то обратное ДКП восстанавливает исходные целочисленные значения отсчетов абсолютно точно. Однако при этом динамический диапазон коэффициентов ДКП оказывается больше диапазона исходного сигнала, т.е. 8-битным отсчетам сигнала соответствуют 12-битные отсчеты спектра. На первый взгляд, получается даже проигрыш в объеме данных. Квантование коэффициентов ДКП Для сокращения (сжатия) данных вычисленные 12-разрядные значения коэффициентов ДКП заменяются взвешенными и огрубленными (проквантованными) значениями с меньшим числом разрядов. Переквантованные значения коэффициентов затем подвергаются энтропийному кодированию (кодированию длин серий). Свойства зрения таковы, что кодер MPEG может почти безнаказанно выбросить часть информации из кодируемого сигнала. Коэффициенты ДКП, представляющие высокие пространственные частоты, можно передавать с меньшей точностью, расходуя на это меньше битов. Считается, что при правильном выборе весовых матриц и матриц квантования результирующие помехи практически не видны при нормальном расстоянии наблюдения (порядка 3-4 высоты экрана). Наиболее точно (с огрублением до 8-битного представления) передаются низкие частоты, а для повышения точности передачи постоянной составляющей (среднего значения всех 64 пикселов блока) применяется

Page 19: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

19

специальный рекурсивный алгоритм, основанный на статистическом предположении о близости средних значений смежных блоков. Наивысшие пространственные частоты обычно квантуются в 10 раз грубее, чем самые низкие. Матрица квантования назначается таким образом, чтобы наименее точными (грубо квантованными) оказались высокие диагональные частоты. Разумеется, в результате такой обработки относительно малые значения заменяются нулевыми. Из приведенного на рисунке 2.2.2 числового примера видно, что нули сосредоточены в области высоких и диагональных частот. Возможно как применение стандартной матрицы квантования (по умолчанию), так и загрузка произвольной матрицы прямо из потока сжатых данных. Второй вариант обычно дает не только некоторое (небольшое) дополнительное улучшение коэффициента сжатия, но, в принципе, может также существенно снизить искажения изображения. Дальнейшее сжатие объема передаваемых данных обеспечивается методом кодирования длин серий (RLC/VLC = Run-Length Coding/Variable Length Coding). Длинные последовательности нулей, а в общем случае и любые статистически частые последовательности (комбинации) значений заменяются заранее назначенными короткими кодами. Наиболее часто встречающиеся комбинации заменяются самыми короткими кодами. Дополнительный выигрыш дает зигзагообразное считывание (сканирование) коэффициентов ДКП, именуемое "Z-упорядочением". Сканирование начинается с постоянной составляющей, затем самая низкая горизонтальная частота, самая низкая вертикальная частота, следующая вертикальная, затем самая низкая диагональная частота, следующая горизонтальная, и т.д. Получается, что сперва считываются все ненулевые коэффициенты, а затем, как правило, идет длинная серия непрерывных нулей. Последняя серия нулей блока передается просто как код конца блока, т.е. на передачу этой самой частой серии расходуется ноль бит. Тем самым достигается существенное сжатие общего объема данных. Стандарт предусматривает две таблицы Z-упорядочения - "Стандартную" и "Альтернативную". Фактически различие между ними не является принципиальным, хотя для чересстрочных видеоисточников применение альтернативной таблицы может дать некоторое (небольшое) увеличение степени сжатия данных. Применительно к макроблокам схожие результаты достигаются путем передачи управляющего кода "пропущенного" макроблока. В кадрах типа B "пропущенные" макроблоки имеют тот же вектор движения, что и предыдущий (базовый) макроблок. В кадрах типа P "пропущенным" макроблокам приписывается нулевой вектор движения. При декодировании (обратном ДКП) грубо квантованных спектральных коэффициентов получается изображение, пораженное специфическими помехами. Исчезают изолированные мелкие детали, появляются паразитные узоры как на границах блоков (blockiness = блочность), так и внутри блоков ("шахматность"). В особо сложных случаях возникают разнояркость и разноцветность соседних блоков - "мозаичность" изображения.

Рис. 2.2.9 Огрубление коэффициентов ДКП приводит к искажениям изображения

Page 20: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

20

Стандартом MPEG-2 предусмотрено три формата цветности: • Формат 4:4:4 - матрицы Cb, Cr и Y одинаковы по вертикали и по горизонтали. Этот формат практически почти

никогда не применяется. • Формат 4:2:2 - горизонтальные размеры матриц Cb и Cr вдвое меньше размера матрицы Y, а вертикальные

размеры одинаковы. Это так называемый "профессиональный" формат, применяемый при производстве программ.

• Формат 4:2:0 - как горизонтальные, так и вертикальные размеры матриц Cb и Cr вдвое меньше размера матрицы Y. Именно этот формат наиболее часто применяется для вещания ТВ программ, поскольку в сравнении с форматом 4:2:2 позволяет дополнительно снизить объем передаваемых данных приблизительно на 25 %. Однако, применение формата 4:2:0 не только снижает вертикальную цветовую четкость, но также практически исключает последующую студийную обработку декодированного изображения с повторным сжатием.

Необходимо отметить, что весьма двусмысленное обозначение "4:2:0" применительно к данному контексту означает и довольно странное взаимное расположение отсчетов Y и Cb, Cr. В данном случае отсчеты цветности не только прорежены по вертикали, но и смещены вниз на половину шага отсчетов яркости. Эта мера призвана облегчить вертикальную постфильтрацию в декодере при восстановлении полной вертикальной частоты отсчетов цветности. Однако, достигается эта цель ценой существенного усложнения предфильтра и кодера в целом.

Рис. 2.2.10 Форматы цветности

Четыре блока яркости объединяются с фиксированным количеством пространственно соответствующих блоков цветности, образуя макроблок. Таким образом, общее число блоков в макроблоке зависит от выбранного формата цветности. Порядок обработки и передачи блоков внутри макроблока также зависит от формата цветности: 4:2:0 - макроблок состоит из шести блоков. Содержит четыре блока яркости и два блока цветности (Cb и Cr) в следующем порядке: Y1, Y2, Y3, Y4, Cb1, Cr1.

Y Cb Cr

1 2 5 6 3 4

4:2:2 - макроблок состоит из восьми блоков. Содержит четыре блока яркости и четыре блока цветности (по два блока Cb и Cr) в следующем порядке: Y1, Y2, Y3, Y4, Cb1, Cr1, Cb2, Cr2.

Y Cb Cr

1 2 5 6 3 4 7 8

4:4:4 - макроблок состоит из двенадцати блоков. Содержит четыре блока яркости и восемь блоков цветности (по четыре блока Cb и Cr) в следующем порядке: Y1, Y2, Y3, Y4, Cb1, Cr1, Cb2, Cr2, Cb3, Cr3, Cb4, Cr4.

Y Cb Cr

1 2 5 9 6 10 3 4 7 11 8 12

Page 21: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

21

Макроблоки размером 16 х 16 пикселов объединяются по горизонтали в слайсы, как правило, занимающие всю ширину изображения. Слайс (slice = полоска, долька, ломтик) состоит из последовательности макроблоков слева направо. В пределах слайса основные параметры сжатия, такие как шкалы квантования, изменяться не могут. Слайсы не должны перекрываться, но могут иметь промежутки - пропущенные макроблоки. Каким образом заполнять или восстанавливать пропущенные макроблоки и как декодер должен реагировать на выпадение слайса - стандарт не оговаривает. Этот важный вопрос сознательно оставлен на усмотрение разработчиков декодеров. Слайсы объединяются в видеокадры (pictures). При чересстрочной развертке кадры разбиваются на поля (полукадры), причем возможно как совместное, так и раздельное кодирование видеоданных смежных полей. Внутренняя организация макроблоков различна при кодировании полей и кадров. При кодировании полей блоки яркости группируются по полям : верхние из первого полукадра, а нижние - из второго. Блоки цветности всегда группируются по кадрам, за исключением форматов 4:2:2 и 4:44, когда они могут группироваться как по кадрам, так и по полям. Переключение поля/кадры используется и при выборе метода вычисления векторов движения. Предсказание по полям обозначается по-английски Inter-field-coding, тогда как предсказание по кадрам обозначается Inter-frame coding. Регулирование заполнения буфера Кодирование длин серий приводит к неравномерной скорости результирующего потока битов. Однако канал передачи обычно требует непрерывного потока с постоянной скоростью. Для согласования скоростей потоков необходимо использовать промежуточный буфер, - как в кодере, так и в декодере. Переполнение или полное опустошение буфера не допускаются. Для управления заполнением буфера служит система обратной связи, регулирующая поступление битов от кодера сжатия. Изменение достигается, как путем более тонкой или более грубой настройки квантователя, обрабатывающего коэффициенты ДКП, так и другими средствами. Кодер принимает свои решения, основываясь на встроенной в него и описанной в стандарте "модели эталонного декодера". Декодер, со своей стороны, просто следует командам кодера.

Проверка заполнения буфера

и обратная связь к кодеруВыходной потокпостоянной скорости

ТРЕВОГА !Буфер почти пустНадо добавить "пустых" битов

ТРЕВОГА !

Входной потокпеременной скорости

Буфер переполняетсяНадо прикрыть кран

Рис. 2.2.11 Управление буфером Основные элементы потока сжатых видеоданных В процессе формирования цифрового потока сжатых видеоданных блоки 8 x 8 элементов (сигнала яркости или цветоразностных сигналов) преобразуются в коэффициенты ДКП, подвергаются кодированию длин серий и объединяются в ... - Макроблоки. Каждый макроблок (16 элементов x 16 строк) содержит четыре блока яркости, связанные с ним

цветоразностные блоки (в формате 4:2:0 это лишь один блок Cr и один блок Cb), плюс заголовок, содержащий векторы движения, описание режима кодирования и параметров квантования. Макроблоки объединяются в ...

- Слайсы. Каждый слайс имеет стартовый код и адрес синхронизации. Если в пределах данного слайса обнаруживается ошибка передачи, то декодер игнорирует слайс целиком и переходит к началу следующего слайса. Слайсы образуют ...

- Видеокадры. Каждый видеокадр (picture) имеет стартовый код и заголовок, содержащий информацию о типе и структуре кадра, глобальных векторах движения, предшествующем композитном декодировании и т.д. Кадры группируются в ...

- Группы видеокадров (GOP). Каждая группа имеет стартовый код и заголовок, содержащий информацию о временном коде и редакторскую информацию. Группы GOP собираются в ...

- Последовательности (sequences). Каждая последовательность имеет стартовый код и заголовок, содержащий информацию о скорости потока, размере (разрешении) изображения, формате кадра, частоте кадров, коэффициенте чересстрочности развертки, формате цветности, и других глобальных параметрах кодирования, в частности - указание на используемый уровень и профиль кодирования.

Page 22: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

22

Рис. 2.2.12 Структура потока сжатых видеоданных

На рисунке показан всего лишь пример форматирования видеоданных в цифровом потоке. Следует подчеркнуть, что некоторые параметры форматирования являются обязательными для включения в поток (mandatory), а другие - необязательными (optional). Кроме того, имеется огромное число вариантов и режимов работы. Например, матрица квантования может передаваться в виде набора из 64 загружаемых 8-битных коэффициентов, но может и подразумеваться по умолчанию при поднятии соответствующего флага в заголовке последовательности. Единственное отличие "последовательности" от "группы видеокадров" заключается в наличии заголовка последовательности; например, последовательность может состоять всего из одной группы. Другой пример. При работе в режиме постоянной скорости цифрового потока необходимо передавать специальную 16-битную команду управления буфером декодера - VBV_Delay (Video Buffer Verifier Delay = Рекомендованная Задержка Буфера). Она косвенным образом задает начальное заполнение буфера, определяя число отсчетов 90-килогерцовых системных часов, в течение которых буфер должен заполниться. Условное начало заполнения пустого буфера отсчитывается при этом от стартового кода кадра (Picture Start Code). Если алгоритм сжатия и форматирования видеоданных MPEG–2 все еще представляется чрезмерно простым, то имеет смысл напомнить, что... - Видеокадры могут быть чересстрочными, прогрессивными, отдельными полями или ТВ кадрами, типов I, P

или B, причем структура передачи может изменяться "на ходу"

- Макроблоки могут трактоваться как чересстрочные или прогрессивные, целиком или по половинкам, предсказываться вперед, назад, двунаправленно ... всего 384 возможными способами

- Векторы движения задаются с точностью до половины элемента и передаются отдельно от собственно изображения, - разностным методом с кодированием длин серий

- Параметры квантования могут изменяться при переходе от одного макроблока к другому

- Требование умеренного заполнения буфера легче всего выполнить, наполнив его "пустыми" битами. Поэтому "передача с максимально возможной скоростью потока" вовсе не обязательно гарантирует хорошее качество декодированного изображения; значительная (неизвестная) часть передаваемых данных может оказаться "пустышкой".

Page 23: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

23

2. Формирование и передача цифровых потоков по стандарту MPEG-2

2.3 Сжатие звукоданных Стандарт ISO/IEC 13818–3 "Звук" – описывает кодированное представление многоканального звука. В одном потоке сжатых звукоданных MPEG–2 поддерживается до 5 широкополосных звуковых каналов плюс дополнительный низкочастотный канал, или до семи комментаторских каналов (режим многоязычного звукового сопровождения). Стандарт MPEG–2 включает три различные схемы кодирования, обеспечивающие обратную (регрессивную) совместимость со стандартом MPEG–1. Кроме того, добавлены режим пониженной (половинной) дискретизации и усовершенствованная схема кодирования MPEG–2, не совместимые с MPEG–1. При разработке стандарта MPEG–2 были учтены достижения ранее созданных систем. В первую очередь - это система MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing), которая была разработана в рамках Европейского Плана Цифрового Радиовещания совместными усилиями фирмы Philips, французского центра телекоммуникаций CCETT и Мюнхенского Института Радиотехники (IRT). Параллельно с MUSICAM для применения в сетях ISDN усилиями AT&T Bell Labs, Thomson, и CNET была создана система ASPEC (Adaptive Spectral Perceptual Entropy Coding). Комбинируя свойства двух вышеупомянутых систем, группа экспертов MPEG/Audio стремилась создать максимально гибкую структуру кодирования, которая отвечала бы требованиям большого числа применений и позволила бы реализовать различные компромиссы между стоимостью аппаратуры и качеством звучания. Кроме того, пришлось учесть тот факт, что связные применения, где стоимость приемника (декодера) играет примерно ту же роль, что и стоимость передатчика (кодера), принципиально отличаются от вещательных применений, где на один кодер приходятся миллионы декодеров. На более позднем этапе, в эту битву стандартов включилась альтернативная система AC-3, разработанная фирмой Dolby. Эта система предоставляет большое число вариантов, обеспечивающих широкий набор различных комбинаций скоростей потока и задержек распространения кодера. Необходимо пояснить, что системный стандарт MPEG–2, описывающий программные и транспортные потоки, допускает применение любого кодирования звука - как "родного" кодирования "MPEG–2" по ISO/IEC 13818–3, так и "привнесенного" - AC-3. Подобная гибкость свойственна также и записям звукового сопровождения программ на цифровых видеодисках DVD и новым моделям индивидуальных приемников-декодеров цифрового телевещания. Все схемы MPEG принципиально отличаются от схемы почти мгновенного компандирования NICAM (Near Instantaneous Companding and Multiplexing). Система NICAM, как известно, частично используется для цифрового радиовещания (со скоростью 676 кбит/с), а также для передачи и записи цифрового звукового сопровождения аналогового телевидения (со скоростью 728 кбит/с). Основные составляющие процесса сжатия звукоданных по стандарту MPEG-2 Алгоритм сжатия звукоданных основан на психо-акустической модели слуха и на соответствующем анализе спектрального состава звукового сигнала. Как известно, порог чувствительности слухового аппарата человека зависит от частоты звука. Чувствительность уха максимальна в диапазоне от 1 кГц до 5 кГц. Порог чувствительности плавно возрастает по мере отдаления частоты от этого диапазона. Менее известен тот факт, что наличие в спектре звука любой сильной сосредоточенной составляющей снижает чувствительность к остальным составляющим на близких частотах. Это явление называется маскированием. Разумеется, полная математическая модель человеческого слуха намного сложнее. В частности, чувствительность уха к чистым "тональным" сигналам (типа музыкальных звуков) сильно отличается от чувствительности к "атональным" (шумоподобным) сигналам.

Page 24: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

24

Кроме статического, имеется еще и динамическое (временное) маскирование. Дело в том, что слабый сигнал низкого уровня, возникающий сразу после окончания сильного сигнала высокого уровня, остается в течение некоторого времени незамеченным. С другой стороны, даже предшествующий слабый сигнал становится незаметным за несколько миллисекунд до начала сильного сигнала. Эти психо-акустические явления называется "маскированием вперед" и "маскированием назад".

Рис. 2.3.1 Эффект звукового маскирования

Использование эффекта маскирования позволяет существенно сократить объем звукоданных, сохраняя приемлемое качество звучания. В результате длительных исследований удалось измерить ширину и расположение частотных полос, в пределах которых действует маскирование. Эти полосы получили название "критических". В первом приближении можно считать, что до частоты 1 кГц ширина критической полосы составляет 100 Гц, в районе 2 кГц она равна 300 Гц и возрастает до 1 кГц вблизи 10 кГц. Однако, при практической реализации набора цифровых фильтров проще и дешевле разбивать спектр звукового сигнала на полосы равной ширины. Для этого применяются многофазные квадратурно-зеркальные фильтры (QMF = Quadrature Mirror Filter), которые последовательно разделяют спектр на равные части - 1/2, 1/4, 1/8, и т.д. Только схемы сжатия наивысшей сложности применяют фильтры с неравными и переменными полосами частот. Подход к сжатию звукоданных во многом схож с подходом к сжатию видеоданных. Основной лозунг здесь можно сформулировать так: "Если какая-то составляющая не слышна, то и передавать ее не надо". Реализуется этот лозунг путем динамического распределения битов (Dynamic Bit Allocation). Таким образом, звуковой сигнал разбивается на полосы частот, а процесс распределения битов позволяет обеспечить маскирование большей части этих полос и наиболее экономичную передачу активных полос.

Рис. 2.3.2 Преобразование спектра сигнала при сжатии звукоданных

Page 25: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

25

Схемы и уровни (слои) кодирования звука В рамках стандарта MPEG–2 предусмотрены две схемы кодирования, обозначаемые "MPEG–1" и "MPEG–2". Наименования весьма условны, поскольку сложились, так сказать, исторически. Эти две схемы дополнительно подразделяются на уровни. В англоязычной литературе их часто именуют "слоями" (Layers), во избежание путаницы с уровнями транспортного потока, однако замена "уровня" на "слой" ничуть не помогает прояснению ситуации. Уровни кодирования звука обозначаются просто своими номерами - 1, 2 и 3. Кроме того, для каждого уровня возможен выбор одной из трех частот дискретизации и назначение числа и конфигурации каналов.

Рис. 2.3.3 Схемы и уровни (слои) кодирования звукоданных

Частоты дискретизации выбираются из ряда 32, 44.1 или 48 кГц. В низкоскоростном режиме MPEG-2, именуемом Low Sampling Frequency extension, применяются половинные частоты дискретизации: 16, 22.05 или 24 кГц. Этот режим применяется, в основном для передачи сигналов пониженного качества на очень низких скоростях, например, при вещании по сети Интернет. Хотя это звучит несколько парадоксально, но при очень низких скоростях (порядка 64 кбит/с) применение половинных частот дискретизации повышает качество звучания речевого сигнала. Дело в том, что связанное с этим отбрасывание высоких частот почти не влияет на качество речи, а высвобождающиеся ресурсы кодера используются для более точной передачи нижней половины сигнального спектра. Поскольку число частотных полос в любом случае сохраняется равным 32, спектральное разрешение оказывается более высоким. Например, при частоте дискретизации 24 кГц ширина сигнального спектра равна 24/2 = 12 кГц, а ширина каждой из полос составляет 12000/32 = 375 Гц (при частоте дискретизации 48 кГц она составляет 750 Гц). Результирующий цифровой поток сжатых звукоданных принимает одно из длинного ряда возможных значений: 32, 48, 56, 64, 96, 112, 128, 192, 256, 384 и 448 кбит/с. Типичными для ТВ вещания можно считать следующие величины. Исходный информационный поток цифрового стереозвука студийного качества составляет 20 бит х 2 канала х 48 кГц = 1.92 Мбит/с. Кодер сжатия звукоданных превращает его приблизительно в 200 кбит/с. Таким образом, звукоданные сжимаются приблизительно в 8-10 раз. Уровень 1 означает относительно простой кодер сжатия, но либо повышенные скорости потока, либо пониженное качество звука. Он основан на технических решениях системы PASC (Precision Adaptive Subband Coding), применяемой для цифровой звукозаписи в аппаратуре DCC (Digital Compact Cassette) фирмы Philips. Уровень 2, известный также как система MUSICAM, наилучшим образом отвечает требованиям регулярного вещания и применяется наиболее часто. Кодер второго уровня существенно сложнее (и дороже) кодера первого уровня, однако декодер второго уровня лишь ненамного сложнее декодера первого уровня. Уровень 3 чрезвычайно сложен, но наиболее эффективен, весьма гибок и обеспечивает наивысшее качество звука при низких скоростях потока. Технические решения этого уровня представляют собой комбинацию наиболее действенных технических решений систем MUSICAM и ASPEC. При применении в сетях ISDN он обеспечивает качество "близкое к качеству компакт-диска" на скорости 128 кбит/с. При скорости 64 кбит/с сжатие третьего уровня обеспечивает достаточно качественную передачу стереозвука, хотя и в сокращенной полосе - 12 кГц.

Page 26: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

26

Существует несколько форматов передачи стереозвуковой и многоязычной информации. Не все из них реализуются кодерами сжатия первого и второго уровня. В таблице на рисунке показано соотношение уровней кодирования и поддерживаемых форматов многоканального звука.

Рис. 2.3.4 Форматы многоканального звука для кодеров различных уровней

Кодер любого уровня должен поддерживать классические монофонический и стереофонический форматы, плюс сдвоенный монофонический формат Dual Mono (например, двуязычное звуковое сопровождение) и квазистереофонический формат Joint Stereo, в котором для увеличения коэффициента сжатия раздельно передаются только высокочастотные составляющие стереозвука, а низкочастотные составляющие передаются совместно. Кодеры третьего уровня дополнительно поддерживают суммарно-разностный и интенсивный форматы стереозвука, позволяющие еще больше увеличить степень сжатия звукоданных. По стандарту MPEG–1 число каналов звука ограничено: один или два. По многоканальной схеме MPEG–2 число широкополосных каналов может доходить до пяти (с учетом сверхнизкочастотного канала - до шести), а при пониженном качестве и до семи. Эти каналы могут использоваться в различных применениях: моно-, стерео-, многоязычных, и с круговым звуком. В частности, по системе кругового звука (Surround Sound) передаются следующие каналы: 1. Левый (Left ) 2. Правый (Right ) 3. Центральный (Centre ) 4. Левый круговой (Left surround ) 5. Правый круговой (Right surround ) 6. Сверхнизкочастотный (Subwoofer.) С целью обеспечения обратной совместимости с MPEG–1 кодер MPEG–2 путем матрицирования преобразует пятиканальный звук в двухканальный. Эти два канала кодируются по MPEG–1, а остальная информация пятиканального звука передается в составе вспомогательных звуковых кадров, которые просто игнорируется декодером MPEG–1, но воспринимаются декодером MPEG–2. В конечном счете, декодер MPEG–2 путем обратного матрицирования восстанавливает все пять каналов кругового звука. Еще одним важным параметром является задержка обработки звукоданных в процессе их сжатия. Чем больше эта задержка, тем больше должен быть объем буфера для синхронизации потоков видео- и звукоданных. Однако, если большая задержка требуется только при низких скоростях потока, то приемлемым опять становится буфер сравнительно небольшого размера. Сравнительные параметры задержки кодирования для различных уровней MPEG–2 приведены в следующей таблице:

Уровень

(слой) Скорость, Мбит/с

Максимальная задержка, мс

Типичная минимальная задержка, мс

Исходная технология

1 192 50 19 Philips DCC 2 128 100 35 MUSICAM 3 64 150 59 MUSICAM, ASPEC

Page 27: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

27

Структура кодера сжатия (Уровни 1 и 2)

Рис. 2.3.5 Блок-схема кодера сжатия звукоданных (первого и второго уровней)

На рис. 2.3.5 показана блок-схема алгоритма сжатия, пригодная для описания как кодера первого уровня, та и кодера второго уровня. Различие между ними заключается в использовании кодером второго уровня более подробного анализа спектра входного сигнала на основе Быстрого Преобразования Фурье (обозначенного на рисунке пунктирными линиями) и более сложного алгоритма динамического распределения битов. В упрощенном виде алгоритм описывается следующим образом: 1. Спектр исходного сигнала почти всегда имеет существенные неравномерности. Однако для обеспечения

неискаженной передачи все его компоненты изначально квантуются, исходя из уровня наиболее громкой компоненты. Поэтому большая часть спектральных составляющих квантуется с чрезмерно большим запасом по перегрузке, - проще говоря, биты расходуются зря.

2. Кодер сжатия квантует частотные полосы "индивидуально", поэтому каждая полоса квантуется более экономичным образом - с примерно одинаковыми запасами по перегрузке.

3. Звукосигнал разбивается на блоки длительностью 32 х 12 = 384 отсчетов. При частоте 48 кГц это означает длительность 8 мс. На выходе набора фильтров сигналы частотных полос дискретизируются с частотой 1.5 кГц (48 кГц/32). Каждый из 32 результирующих блоков содержит 12 отсчетов и имеет длительность 8 мс. На этом этапе шкалы квантования всех блоков одинаковы.

4. В кодере первого уровня динамическое распределение битов осуществляется исходя из "грубого" спектрального анализа - измерения пикового уровня каждой из частотных полос. По результатам измерения для каждой полосы назначается как можно более грубое квантование, но так, чтобы шум квантования не превышал порога маскирования. Переключение 6-битовых номеров шкал квантования означает перекрытие динамического диапазона 120 дБ с шагом 2 дБ. Например, если сигнал данной полосы имеет уровень 60 дБ, то соседняя полоса маскируется с порогом 30 дБ. Соответственно номер шкалы квантования для соседней полосы выбирается, исходя из текущего номера плюс 15 (15 = 30 дБ / 2 дБ). Это не означает, что результирующий шум квантования будет примерно равен порогу слышимости. Речь идет лишь о стремлении к поддержанию равномерного и постоянного отношения шума квантования к порогу слышимости, по английски обозначаемому NMR (Noise to Masking Ratio).

5. В кодерах первого уровня собственно коды распределения битов имеют разрядность 4 бита и все частотные полосы обрабатываются одинаково. Для каждой шкалы число назначаемых уровней квантования различно: 3, 5 , 7, 9, 15, 31, 63 … до 65535. Код распределения 0 означает, что данная полоса отключена (inactive) и для нее передается только сам код, но не сжатые звукоданные. При тактовой частоте 48 кГц соседние последовательные 8-миллисекундные блоки звукоданных обрабатываются независимо. Типичная скорость потока стереозвукоданных вещательного качества для кодеров первого уровня составляет 384 кбит/с.

Набор фильтров:32 полосы

Пере-квантование

Выборкоэффициента

масштабирования

X Мульти-плексор

Сигналычастотныхполос

Выбор пороговмаскирования

и динамическоераспределение

битов

БыстроеПреобразование

Фурье1024 отсчета

Исходныезвукоданные

Сжатыезвукоданные

Page 28: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

28

6. В кодерах второго уровня применяется более сложный алгоритм. Полосы с номерами от 27 до 31 (соответствуют части спектра выше 20 кГц) всегда отключены, т.е. никогда не передаются. Низкочастотные полосы с номерами от 0 до 10 обрабатываются с 4-разрядным кодом распределения, т.е. для них возможен выбор любой из 15 шкал квантования. Для среднечастотных полос с номерами от 11 до 22 выбор сокращается до 3-разрядного кода распределения, т.е. для них возможен выбор одной из 7 шкал квантования. Для высокочастотных полос с номерами от 23 до 26 выбор сокращается до 2-разрядного кода распределения, т.е. для них возможен выбор одной из 3 шкал квантования. При тактовой частоте входного сигнала 48 кГц триады 8-миллисекундных блоков звукоданных обрабатываются путем объединения их в звуковые кадры длительностью 24 мс. Если шкалы квантования, выбранные для всех блоков кадра, оказываются одинаковы, то номер шкалы передается только один раз. Тем самым достигается дополнительная экономия битов при передаче стационарных фрагментов звуковой программы. Типичная скорость потока стереозвукоданных вещательного качества для кодеров второго уровня составляет 224 кбит/с. Скорость 256 кбит/с обеспечивает наивысшее качество, а скорость 192 кбит/с достаточна для большинства вещательных применений.

7. Применяются только шкалы квантования с нечетным числом уровней. Поэтому сигнал паузы всегда корректно передается средним (нулевым) значением. При небольшом числе уровней квантования (грубом квантовании) нулевой средний уровень позволяет избежать нежелательного детектирования симметричных звукосигналов.

8. Процесс распределения битов итеративно повторяется с целью обеспечить возможно лучшее отношение шум/маскирование, как в каждой полосе по отдельности, так и в звуковом кадре в целом.

9. Существенное улучшение обработки достигается путем вычисления коэффициентов БПФ. Преобразование 1024 отсчетов дает разрешение спектроанализатора 47 Гц. Большая точность анализа гарантирует безошибочное выявление частотных полос, подлежащих уничтожению (отключению). Поэтому в кодерах этого уровня более сильное сжатие достигается при пониженной заметности шумов квантования.

Как видно из рис. 2.3.5, процесс переквантования сжимаемых звукоданных производится в два приема. На первом этапе сигнал "нормируется" путем умножения на коэффициент масштабирования, а затем квантуется с заданной точностью путем отбрасывания младших разрядов. Декодер производит обратные операции также в два этапа. На первом этапе отброшенные младшие разряды заменяются нулями, и получаются 15-разрядные отсчеты "ненормированных" звукоданных. Они умножаются на коэффициент масштабирования, что возвращает сигналам частотных полос их исходные уровни (с небольшими ошибками, обусловленными грубым квантованием). Затем сигналы 32 частотных полос объединяются при помощи спектросинтезатора. Он представляет собой набор полосовых фильтров, переносящих сигнал каждой полосы на принадлежащее ему место в результирующем спектре разжатого сигнала. Различие декодеров первого и второго уровней совсем небольшое: декодер второго уровня должен быть способен запоминать номера выбранных шкал квантования и применять их, при необходимости, к последующему блоку звукового кадра. Структура кадра сжатых звукоданных формата MUSICAM (Уровень 2 MPEG-2) В этом формате звуковой кадр всегда имеет длительность 24 мс, но число бит в нем зависит от скорости сжатого потока, как показано в таблице:

Скорость, кбит/с Число бит в кадре 384 9216 256 6144 224 5376 192 4608

96 2304 64 1536

Стандарт определяет структуру звукового кадра, но не определяет конкретные способы форматирования в кодере и декодере. Кодер должен выдавать сжатые звукоданные в стандартном (форматированном) виде, а декодер должен преобразовывать один кадр сжатых звукоданных во фрагмент звукосигнала длительностью 24 мс.

Page 29: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

29

Звуковой кадр MUSICAM состоит из следующих последовательно передаваемых частей:

Заголовок Синхрослово, Идентификатор, Скорость потока, Частота дискретизации, Режим работы, Авторское право, Предыскажение

Контрольные суммы Обнаружение ошибок при передаче наиболее важных параметров: Заголовка, Распределения битов, Коэффициента масштабирования

Распределение битов 4, 3, или 2 бита на каждую полосу (х 2 для стерео) Распределение коэффициентов

масштабирования

SFSI (Scale Factor Select Information) указывает сколько различных коэффициентов масштабирования и в каких сочетаниях содержит один звуковой кадр

Коэффициенты масштабирования

Набор из последовательно передаваемых тридцати двух 6-разрядных коэффициентов

Отсчеты звукоданных Набор из тридцати двух блоков сжатых звукоданных по 12 отсчетов в блоке. Число битов в каждом отдельном блоке не фиксировано (от 0 до 15), но общее число битов в наборе должно соответствовать стандартному значению

Сжатие звукоданных кодерами третьего уровня Этот метод сжатия отличается чрезвычайно большой сложностью и должен применяться только при необходимости обеспечения сильного сжатия при очень низких скоростях сжатого потока. Основой этого алгоритма является спектральное преобразование по типу системы ASPEC, модифицированное для большего сходства с кодерами MPEG-2 второго уровня. Сигналы 32 полосных квадратурно-зеркальных фильтров с шириной полосы 750 Гц дополнительно обрабатываются 18-полосным Модифицированным Дискретным Косинусным Преобразованием. В результате получается 576 спектральных коэффициентов ("спектральных линий") с шагом примерно 40 Гц. Они подвергаются взвешиванию четырьмя адаптивно переключаемыми оконными функциями, ширина и форма которых подобрана для наилучшего подавления опережающих и запаздывающих эхо-сигналов. Цель этой операции: преодоление главного недостатка кодеров второго уровня - неэффективного сжатия быстро изменяющихся переходов и скачков уровня звука, потенциально чреватого заметными искажениями. Для наиболее полного использования высокого спектрального разрешения применены усовершенствованная психо-акустическая модель, нелинейные шкалы квантования и кодирование длин серий кодами Хаффмана. Сжатие звукоданных по системе Dolby AC-3 Эта система относится к классу спектральных с погашением помех дискретизации во временной области (TDAC = Time Domain Aliasing Cancellation). Теоретическое обоснование обработок подобного класса довольно сложное, но эффективность и помехоустойчивость алгоритма AC-3, по крайней мере, не уступают третьему уровню MPEG-2. Спектральное разрешение этой системы составляет 94 Гц при переключаемой длительности блоков кодированных звукоданных - 2.6 мс или 5.3 мс. Дополнительным аргументом в пользу этого способа сжатия звукоданных является широкое применение системы AC-3 в телекинопроизводстве, хотя шансы на прямое прохождение потоков сжатых звукоданных студийного качества непосредственно на мультиплексоры транспортных потоков не так велики. В системе AC-3 предусмотрена возможность выбора различных компромиссов между скоростью потока и задержкой кодирования. Используется Модифицированное Дискретное Косинусно/Синусное Преобразование (МДКП/МДСП) с 50-процентным перекрытием оконных функций. При этом вырабатывается вдвое больше спектральных

Page 30: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

30

коэффициентов, которые затем подвергаются понижающей передискретизации (прореживаются). Сама по себе операция прореживания может приводить к появлению помех дискретизации (в частотной области). Однако, поскольку помехи в двух окнах имеют противоположную полярность, они взаимно погашаются при восстановлении сигнала.

Рис. 2.3.6 Блок-схема кодера сжатия звукоданных по системе AC-3

Входной цифровой звукосигнал разбивается на блоки по 512 отсчетов с 50-процентным перекрытием массивов отсчетов. Затем они подвергаются косинусному и синусному преобразованию, каждое из которых дает по 512 спектральных коэффициентов. После объединения результатов и взаимного погашения ненужных составляющих в блоке остается 256 спектральных коэффициентов. Входной сигнал постоянно анализируется с целью обнаружения скачков уровня. При обнаружении скачков размер блока вдвое снижается, т.е. спектральное разрешение становится не столь тонким, но временное разрешение возрастает. Такой прием позволяет предотвратить появление помех в виде опережающих эхо-сигналов и шумов. Спектральные коэффициенты объединяются в группы в соответствии с шириной критических частотных полос. В каждой полосе коэффициенты нормируются в формате с плавающей точкой и общим для всех показателем степени (экспонентом). Экспоненты (показатели степени), по существу, представляют собой логарифм огибающей спектра, который посредством модели восприятия управляет динамическим распределением битов. Мантиссы спектральных коэффициентов подвергаются нелинейному квантованию в соответствии с выбранным распределением битов. Результирующий поток сжатых звукоданных состоит из переквантованных спектральных коэффициентов и логарифма огибающей спектра. Эта вторая составляющая отличается высокой избыточностью. Поэтому в пределах каждого блока только самая низкочастотная составляющая спектральной огибающей передается непосредственно. Все остальные частотные коэффициенты передаются дифференциально. При передаче фрагментов типичной звуковой программы спектр обычно настолько гладок, что экспоненты нескольких полос совпадают. Для эффективной передачи можно лишь однократно сообщить декодеру само значение экспонента, а повторяющиеся величины просто пометить флагами состояния. Следующим этапом сжатия является устранение временной избыточности. Для этого блоки группируются по шесть в звуковые кадры, причем последующие блоки кадра могут пользоваться экспонентом первого блока. Интересно, что промежуточное положение между системой AC-3 и вторым уровнем MPEG-2 занимает система ATRAC, применяемая для звукозаписи в аппаратуре Sony формата MiniDisc. Однако в вещании формат ATRAC никогда не применяется.

МДКП/МДСП Пере-квантование

Сжатиеполосныхсигналов сплавающей

точкой

Мульти-плексор

Сигналычастотных полос

Динамическоераспределение

битов

Исходныезвукоданные

Сжатыезвукоданные

Кодирование показателейстепени

(экспонентное кодирование)

Сжатыеспектральныекоэффициенты

Квантованныеспектральныекоэффициенты

Логарифмогибающейспектра

Page 31: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

31

Особенности сжатия стереозвуковых сигналов В монофонических системах все источники звука считаются сосредоточенными в одной точке пространства, поэтому использование эффекта маскирования дает наилучшие результаты. Однако, в стереофонических системах (с двумя каналами или с большим числом каналов) действуют и другие факторы. Необходимо достаточно точно передавать информацию о локализации различных источников звука. Типичный пример: расположение музыкальных инструментов в симфоническом оркестре. К сожалению, все психо-акустические модели систем сжатия предполагают, что все источники звука расположены в одной точке. Специалисты даже предложили термин "демаскирование" для обозначения эффекта потери маскирования при наличии несовпадающих в пространстве источников. Другой неприятный побочный эффект сжатия - преждевременное затухание реверберации. Некоторые частотные компоненты вследствие грубого квантования вдруг пропадают вместо плавного и длительного снижения их уровня. В случае стереофонических сигналов это может привести к неестественному скачкообразному перемещению звукового образа объекта. К счастью, в большинство современных бытовых акустических стереосистем применяются не так называемые "точечные звукопрожекторы", а громкоговорители с широкими апертурами. Эти устройства создают "смазанные" звуковые образы, поэтому и неприятные эффекты сжатия сказываются гораздо меньше. Интересным применением систем сжатия могло бы стать тестирование громкоговорителей. Чем лучше стереопередача акустической системы, тем раньше проявятся дефекты системы сжатия. Интенсивная стереофония подразумевает, что два сигнала стереопары отличаются только уровнями. Никаких различий фаз этих двух сигналов не допускается. Такой виртуальный звук обычно называют "сухим" или "плоским". Источник звука локализуется точно на линии, соединяющей два громкоговорителя. Именно такой звук получается на выходе систем сжатия, уничтожающих слабые реверберации. Особенно сильно эти эффекты проявляются при использовании третьего уровня MPEG-2 для передачи на низких скоростях. В системах с сильным сжатием вполне приемлемое монофоническое качество может сочетаться с заметными искажениями стереосигналов.

Page 32: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

32

Рис. 2.2.13 Блок-схема типичного кодера сжатия видеоданных

Пред-обработка

Пере-группи-ровкаGOP

Вычита-тель ДКП Кванто-

ваниеКодированиедлин серий Буфер

Управление

Обратноекванто-вание

ОбратноеДКП

Кадровыебуферы

Компенсациядвижения

Оценкадвижения

Сумматор

Предсказанныеблоки

Векторыдвижения

Page 33: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

33

Рис. 2.2.14 Типичная блок-схема декодирования сжатых видеоданных

2. Формирование и передача цифровых потоков по стандарту MPEG-2

2.4 Системный уровень, потоки данных и информационные таблицы Стандарт ISO/IEC 13818–1 "Системы" – описывает кодирование на системном уровне и определяет структуру временного уплотнения видео- и звукоданных, средства и данные синхронизации в реальном времени. Эта часть стандарта эквивалентна Рекомендации ITU–T H.261. Она посвящена мультиплексированию видео и звуковых потоков MPEG совместно с потоками вспомогательных данных в программные и транспортные потоки. Кодирование вспомогательных данных стандартом не определяется, но поддерживается при условии соблюдения оговоренных ограничений. Некоторые виды вспомогательных данных, например - субтитры, описаны достаточно детально. Цифровые потоки MPEG-2 Потоки цифровых данных разделены во времени на пакеты, выстроенные в определенной последовательности. Каждый пакет содержит заголовок и некоторое количество байтов данных одного и только одного элементарного потока. • Элементарный поток - это кодированный по стандарту MPEG поток видео, звука, или вспомогательных

данных, относящихся к одной ТВ программе. Пакетированный элементарный поток (ПЭП = PES) включает

Входнойбуфер

Декодиро-ваниедлинсерий

Выходнойбуфер

Обратноекванто-вание

ОбратноеДКП

Памятьследующего

кадра

Компенсациядвижениявперед

Сумматор

Декодированноеизображение

Векторыдвижения

Интерполя-ционная

Компенсациядвижения

Компенсациядвиженияназад

Памятьпредыдущего

кадра

Page 34: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

34

метки времени и заголовки. Элементарный поток может включать конфиденциальные, зарезервированные и/или добавочные потоки.

• Программный поток (ПП = PS) представляет собой сборку элементарных потоков, относящихся к одной ТВ программе. Они объединяются общими часами (в данном контексте не следует путать часы с тактовой частотой). Такой поток состоит из пакетов переменной длины и предназначен для записи или передачи по каналам с малой вероятностью ошибки. В частности, именно программные потоки записываются на диски CD-ROM и DVD.

• Транспортный поток (ТП = TS) - другой вид объединения элементарных потоков. Он может содержать несколько программ с независимыми часами, и даже различными тактовыми частотами. Транспортные потоки состоят из пакетов фиксированной длины (188 байт) и предназначены для передачи по каналам с ошибками, в частности для телевещания. Именно этот тип потока обычно называют просто "сигнал MPEG". Фиксированная и небольшая длина пакета транспортного потока облегчает задачи кодозащиты и коррекции ошибок.

Термин пакет, применительно к различным типам потоков, используется для обозначения сильно различающихся объектов. В программном потоке пакет неопределенной длительности содержит одну единицу воспроизведения (PU = Presentation Unit) данных определенного типа, или несколько таких единиц. Единица воспроизведения видеопотока - одно изображение (один видеокадр), а единица воспроизведения звукопотока - один звуковой кадр AES/EBU. В транспортном потоке, напротив, пакет имеет жестко определенную длительность, но может содержать данные любого типа. Следует подчеркнуть, что программный и транспортный потоки служат для различных применений. Ни один из них не является подмножеством, либо компонентом другого. Так сказать "общим знаменателем" здесь выступает элементарный поток. На системном уровне кодирования решается пять основных задач: • Собственно объединение нескольких потоков в один (мультиплексирование) • Ввод данных (заполнение) информационных таблиц • Определение временной шкалы и синхронизация отдельных составляющих потока • Инициализация буфера декодера • Обслуживание буфера (дистанционная помощь в управлении буфером декодера) Охватывающая все три части стандарта (видео, звук и системный уровень) идея синхронизации (в тексте стандарта используется термин модель синхронизации) сводится к требованию обеспечения фиксированной задержки всех составляющих в сквозном тракте от входа кодера до выхода декодера. Эта сквозная задержка складывается из задержки кодирования, буферной задержки кодера, задержки передачи или хранения, задержки декодирования, буферной задержки декодера, и задержки воспроизведения. Все указанные задержки могут варьировать в определенных пределах, но правила требуют, чтобы их сумма при этом сохранялась. Вследствие кодирования длин серий задержка распространения сигнала в декодере не постоянна. Задержка видеокодера может не совпадать с задержкой кодера звука и, более того задержки передачи видео и звука могут быть различными, лишь бы сквозная задержка оставалась одинаковой. На системном уровне в потоки вводятся Временные метки декодирования (DTS = Decoding Time Stamps) и Временные метки воспроизведения (PTS = Presentation Time Stamps), наличие которых обеспечивает фиксированную и одинаковую задержку кодека для всех составляющих программы (видео, звука, субтитров) при их независимой передаче с разбивкой на пакеты. Даже, если "в пути следования" какие-то пакеты отстанут или обгонят своих соседей, декодер, ориентируясь по временным меткам, выстроит все пакеты в нужной последовательности. На системном уровне вводятся также различные Ссылки на часы (CR = Clock References), необходимые для привязки тактовых частот видео и звукоданных декодера. К системному уровню относятся все виды программно-зависимой информации (PSI = Programme Specific Information), в частности Таблицы объединения программ (PAT = Programme Association Table), Таблицы сетевой информации (NIT = Network Information Table), Таблицы состава программы (PMT = Programme Map Table), и Таблицы условного доступа (CAT = Conditional Access Table), которые позволяют декодеру выбирать и восстанавливать конкретную ТВ программу из многопрограммного потока MPEG.

Page 35: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

35

При заполнении таблиц программно-зависимой информации следует принимать во внимание требования DVB. Стандарт MPEG-2 определяет только синтаксис этих таблиц, тогда как документы DVB четко регламентируют именно содержание.

Рис. 2.4.1 Структура ПЭП пакета

ПЭП пакет - это основная единица программного потока. Из рисунка видно, насколько сложна структура его заголовка. Заголовок начинается с 24-битной преамбулы (prefix), представляющей собой фиксированную кодовую комбинацию: 0000 0000 0000 0000 0000 0001. Затем идет 8-битный идентификатор потока (stream ID code). Следующие примеры помогают понять принципы назначения кодов для этих идентификаторов: • 1100 0000 идентификатор звукопотока номер 0 • 1100 0010 идентификатор звукопотока номер 2 • 1110 0000 идентификатор видеопотока номер 0 • 1111 0010 идентификатор пакета управления цифровой записью

(DSM-CC = Digital Storage Medium Command and Control) Следующие два байта - это указатель длины пакета. Длина ПЭП пакета не фиксирована, и, в отличие от других потоков, ПЭП обычно не применяется для передачи данных на уровне физического интерфейса. В транспортном потоке заголовок ПЭП пакета выровнен с заголовком транспортного пакета. Временные метки DTS/DPS могут содержаться в расширенном заголовке пакета, но их наличие не обязательно. Интервал между временными метками в транспортном потоке может достигать 700 мс, а в программном - до 100 мс. Дело в том, что декодер способен вычислять промежуточные значения временных меток путем интерполяции, поэтому слишком частая их передача не требуется.

Page 36: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

36

Рис. 2.4.2 Пример использования декодером временных меток для восстановления порядка кадров

За указателем длины пакета в расширенном заголовке идут несколько одно- и двухбитных флагов - флаг управления скремблированием, флаг приоритета элементарного потока, флаг авторского права, флаг наличия временных меток. Непосредственно после всех флагов и расширений следует большое число байтов видео или звукоданных. Перед байтами данных могут, при необходимости, передаваться "пустые" байты 1111 1111 (stuffing). При передаче видео и звукоданных по стандартным компьютерным сетям (типа Ethernet и т.п.) ПЭП пакеты встраиваются в соответствующий транспортный протокол, например - TCP/IP. Группы ПЭП пакетов объединяются в пачки (pack). Пачка начинается с заголовка, который может содержать сведения о битовой скорости потока и информацию синхронизации - в виде Ссылок на системные часы (SCR = System Clock Reference). Таким образом, структура программного потока MPEG-2 точно совпадает со структурой системного мультиплексированного потока MPEG-1. Пакеты транспортного потока также начинаются с заголовка, но длина этого заголовка может быть различной. Разумеется, длинный заголовок отнимает много места у полезной нагрузки короткого пакета, поэтому такие заголовки передаются сравнительно редко. При общей длине пакета 188 байт короткий заголовок занимает всего 4 байта, оставляя 184 байта на полезную нагрузку (payload). Транспортный поток может быть построен любым способом, лишь бы результат не нарушал требований системного синтаксиса. Можно создавать транспортный поток, содержащий одну или несколько программ, одним из трех способов: • Непосредственно из "сырых" элементарных потоков видео и звука • Из программных потоков • Из другого транспортного потока Обратное преобразование транспортного потока в программный поток можно производить достаточно просто, - путем выделения пакетированных элементарных потоков. Важно, что переносимые из транспортного потока ПЭП пакеты содержат в себе всю информацию, необходимую для их правильного следования - как в составе транспортного потока, так и в составе программного потока.

Page 37: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

37

Рис. 2.4.3 Структура пакета транспортного потока

Компоненты короткого заголовка показаны в следующей таблице: Число битов Назначение

8 Sync Byte - байт синхронизации = 0100 0111. Представляет собой зарезервированную группу битов, легко опознаваемую демультиплексором. Формулировка стандарта здесь на удивление мягкая: "следует избегать появления значений, совпадающих с байтом синхронизации, в регулярно повторяющихся полях, таких как идентификаторы типа пакета"

1 Transport error indicator - флаг ошибки передачи, устанавливаемый в состояние "1" при наличии в пакете хотя бы одной некорректируемой ошибки. Обычно управляется внешними устройствами, например демодулятором приемника

1 Payload start indicator - флаг начала передачи, устанавливаемый в состояние "1", если полезная нагрузка начинается с начала ПЭП пакета или с первого байта программно-зависимой информации (PSI)

1 Transport priority - флаг приоритетной передачи, устанавливаемый в состояние "1" с целью обозначения более высокого приоритета данного пакета по сравнению с другими пакетами м таким же значением PID

13 Packet Identifier (PID) - уникальный 13-битовый идентификатор типа пакета. Указывает на тип передаваемых данных полезной нагрузки.

2 Transport Scrambling Control - Указывает на способ скремблирования данных полезной нагрузки. Значение "00" указывает на отсутствие скремблирования, три другие значения - на скремблирование, определяемое пользователем

2 Adaption Field Control - Указывает на наличие полей адаптации в нагрузке пакета. Возможны три варианта: полезная нагрузка не содержит дополнительных полей адаптации, состоит только из полей адаптации, содержит смесь полей адаптации с обычными видео- или звукоданными.

4 Continuity Counter - 4-битный счетчик непрерывности пакетов. Возрастает на "1" при каждой передаче полезной нагрузки с определенным значением PID. По достижении значения "1111" счетчик продолжает значением "0000".

После заголовка в составе каждого пакета передаются байты полезной нагрузки - это видео- или звукоданные, выделенные из ПЭП пакетов, либо управляющие данные программно-зависимой информации.

Page 38: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

38

Уникальный 13-битовый идентификатор типа пакета (PID = Packet IDentifier) является важнейшим инструментом управления всем комплексом аппаратуры MPEG-2. Поскольку транспортный поток может содержать много элементарных потоков, для их опознавания, в каждом пакете, вслед за байтом синхронизации, передается PID. Ошибки в задании или определении PID приводят к крайне тяжелым последствиям, поэтому проверка их прохождения относится к наиболее важным приоритетам, так называемым приоритетам первого уровня. Выделение (демультиплексирование) элементарных потоков из программного или транспортного потока возможно благодаря наличию следующей информации: • Идентификатора потока в заголовке программного потока • Идентификатора самого выделяемого пакета • Идентификационной таблицы транспортного потока, связывающей воедино отдельные составляющие. Демультиплексор транспортного потока реализует функцию выделения конкретного элементарного потока, ориентируясь на идентификаторы пакетов. Между пакетами с искомым значением PID может следовать множество пакетов с другими значениями PID, относящимися к другим программам. Для облегчения поиска нужных пакетов служит счетчик непрерывности (Continuity Counter). Это четырехразрядный код, возрастающий на единицу при передаче мультиплексором следующего пакета данного типа. Если по какой-либо причине один или несколько пакетов оказались искажены или потеряны, демультиплексор немедленно обнаружит ошибку путем простого сравнения показаний своего счетчика пакетов с данными пришедшего пакета. Из общего числа 8192 возможных значений PID стандарт MPEG-2 жестко отводит три на общесистемные функции, а еще тринадцать значений - зарезервированы на будущее развитие. Общесистемная информация передается в составе пакетов с фиксированными номерами PID = 0 и PID = 1. Идентификатор пакета PID = 0 означает, что пакет содержит часть Таблицы объединения программ (PAT = Programme Association Table), а PID = 1 означает передачу Таблицы условного доступа (CAT = Conditional Access Table). Для поддержания постоянства скорости выходного транспортного потока мультиплексоры могут вводить в него дополнительные "пустые" пакеты. Для таких пакетов отведен специальный идентификатор - PID = 8191, т.е. код, все разряды которого равны единице.

Page 39: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

39

Таблицы программно-зависимой информации (MPEG-2 PSI) и информации вещательной службы (DVB SI) Как декодер находит пакеты с правильными идентификаторами? Для этого служат передаваемые в транспортном потоке таблицы программно-зависимой информации (PSI). Во многих случаях необходим еще и анализ содержания таблиц информации вещательной службы (DVB SI). На рисунке показана структура взаимосвязи этих таблиц и пример расстановки номеров идентификаторов пакетов.

Рис. 2.4.4 Таблицы программно-зависимой информации (PSI)

Начальные сведения обо всех программах многопрограммного транспортного потока содержатся в Таблице объединения программ (PAT = Programme Association Table). Пакеты этой таблицы легко найти в потоке, поскольку ее PID = 0. Она содержит несколько разделов, относящихся к различным ТВ программам. В примере на рисунке, PID первой ТВ программы равен 22, а второй программы - 33. Разумеется, это лишь пример, и цифровые значения могут быть любыми другими двузначными (кроме запрещенных зарезервированных значений и значений, превышающих 98). Предположим, зритель желает смотреть первую программу. Тогда декодер, просмотрев раздел Таблицы объединения программ, относящийся к первой программе, ищет и находит в составе потока следующую таблицу с PID = 22. Это - Таблица состава программы (PMT = Programme Map Table). В результате просмотра этой таблицы декодер (автоматически, без участия зрителя) определяет, что первая программа состоит из видеоданных (PID = 54) и двух потоков звукоданных (PID = 48 и PID = 49). Кроме того, декодер определяет, что Ссылки на Программные Часы (PCR = Programme Clock References) этой программы следует искать в пакетах с PID = 31. Возможно, что два потока звукоданных - это стереозвуковое сопровождение и декодеру следует извлекать пакеты с обоими номерами. Однако, в случае двуязычного сопровождения, декодер должен выбрать желаемый зрителем язык. Тогда, следует извлекать либо только пакеты с PID = 48, либо пакеты с PID = 49. Первоначально, концепция многоязычного звукового сопровождения включала понятие "язык по умолчанию", в качестве которого, естественно был предложен английский. Такая ситуация оказалась чревата политическими неприятностями и от этой идеи отказались. К сожалению, теперь положение дел еще больше осложнилось, поскольку декодер при включении питания просто не знает, что делать, и выбирает первый сверху язык из списка имеющихся.

Page 40: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

40

Если первая программа относится к классу платных, то декодеру придется заниматься еще и анализом содержания Таблицы условного доступа (CAT = Conditional Access Table), которую также нетрудно найти, поскольку ее PID всегда равен "1". Найдя в этой таблице раздел, относящийся к первой программе, декодер определит, что разрешение на просмотр (EMM = Entitlement Management Message) следует искать в пакетах с PID = 99. Соответственно, если зритель желает переключиться на вторую программу, декодер находит в составе потока другую Таблицу состава программы (PID = 33) и проделывает все описанные выше операции поиска пакетов, но уже с другими значениями PID. Таким образом, стандарт MPEG-2 требует наличия трех таблиц: PAT, CAT и PMT. Если транспортный поток предназначен для ТВ вещания, то правила DVB требуют наличия еще шести таблиц информации о службах (SI = Service Information). Эти таблицы передаются в пакетах с зарезервированными значениями PID (указаны шестнадцатеричные номера): • Таблица сетевой информации (NIT = Network Information Table) PID = 0010 • Таблица описания службы (SDT = Service Description Table) PID = 0011 • Таблица оглавления программ (EIT = Event Information Table) PID = 0012 • Таблица текущего состояния (RST = Running Status Table) PID = 0013 • Таблица времени и даты (TDT = Time and Date Table) PID = 0014 • Пустая таблица (ST = Stuffing Table) PID = от 0010 до 0013 По правилам DVB передача таблиц NIT, SDT и EIT, описывающих альтернативные (безразлично, - "свои" или "чужие") службы, является желательной, но не обязательной. Например, в тех редких пока случаях, когда эту же первую программу можно принимать более, чем из одного источника (например, утром она передается через спутник "X", а вечером - через спутник "Y", плюс эта же программа круглосуточно передается по системе наземного сотового ТВ вещания), усовершенствованный декодер может заглянуть в Таблицу сетевой информации (NIT = Network Information Table) и найти возможность все-таки показать зрителю его любимую программу. Пакеты таблицы NIT (они имеют зарезервированное значение PID = 0010) можно найти, просмотрев раздел "Программа номер 0" Таблицы объединения программ. Таблица сетевой информации состоит из двух подразделов - Таблицы данной сети (table_id = 0x40) и Таблицы альтернативных сетей (table_id = 0x41). Первый подраздел является обязательным, а наличие второго зависит от чисто коммерческих и политических условий вещания. Например, в Великобритании сеть наземного цифрового ТВ вещания построена таким образом, что каждый конкретный передатчик обязан сообщать обо всех вещательных ТВ службах в сети. Таблица сетевой информации содержит несколько разделов, ответственных за важные функции организации вещательной службы. В частности, эти разделы позволяют координировать Букеты служб, например, координировать спутниковое, наземное и кабельное вещание, а также создавать Оглавления программ (Event Information Table). Таблицы объединения букета (Bouquet Association Table) содержатся в пакетах с PID = 0x0011, идентификаторы этих таблиц всегда имеют значение 0x4A. На следующем рисунке показан пример того, как зритель может найти интересующую его программу, пользуясь электронным оглавлением. Допустим, зритель желает смотреть трансляцию футбольного матча "Шотландия-Ирландия", но не знает ни номера канала, ни времени начала этой программы. Он начинает с просмотра всего букета доступных ему вещательных служб, находит среди них спортивные службы и, нажимая кнопку на пульте дистанционного управления, переходит к просмотру меню спортивных служб. Затем он находит на экране раздел "Мозаика событий", в котором показаны все разнообразные спортивные события дня: крикет, скачки, регби, футбол, и т.д.

Page 41: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

41

Рис. 2.4.5 Интерактивное расписание программ

Перейдя в раздел "Футбол", зритель находит интересующий его матч. Последнее нажатие кнопки, - и можно наслаждаться столь популярным видом спорта, не сходя с дивана. Уровни и профили MPEG-2 MPEG–2 охватывает весьма широкий диапазон сложности кодирования и качества изображения - от компьютерной графики низкого разрешения до ТВЧ, от групп видеокадров одного единственного типа (I) до длинных групп видеокадров различных типов и номенклатур. Совершенно нереалистично требовать, чтобы все декодеры были способны декодировать все возможные виды потоков MPEG–2. Однако, поскольку многие декодеры способны декодировать различные виды потоков, необходимо четко обозначить пределы возможного. Различные уровни качества определены в стандарте через уровни и профили кодирования. Уровни определяют максимально допустимое пространственное разрешение и максимальную скорость потока. Профили определяют какие именно средства MPEG–2 должны использоваться для декодирования сигнала данного типа. Различные комбинации профилей и уровней перекрывают широкий диапазон применений. Следует заметить, что не все 24 комбинации определены и испытаны, а практически реализовано совсем небольшое число комбинаций профиль-уровень. В англоязычной литературе принято обозначать комбинации первыми буквами, разделенными знаком @. Например, сочетание MP@ML означает кодирование основного профиля основного уровня. Стандартом определены четыре уровня: Уровень Структура изображения Поток

Высокий 1920 x 1152 или менее До 80 Мбит/с Высокий-1440 1440 x 1152 или менее До 60 Мбит/с Основной 720 x 576 или менее До 15 Мбит/с Низкий 352 x 288 или менее До 4 Мбит/с

Page 42: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

42

Независимо от выбора уровня имеются пять профилей: Профиль Свойства Структура дискретизации

Простой Видеокадры типа B не допускаются 4:2:0 Основной Не допускаются расширения видео 4:2:0 Масштабируемый по С/Ш Масштабируемость 4:2:0 Пространственно масштабируемый Пространственная масштабируемость 4:2:0 Высокий Временная масштабируемость 4:2:0 или 4:2:2

Микросхемы, разрабатываемые для основного профиля основного уровня (MPML), оказались столь дешевы, что разработка специальных упрощенных микросхем для более низких профилей просто потеряла смысл. Поэтому в современных условиях кодирование низкого профиля осталось только в некоторых видах программного обеспечения. Масштабируемость - это свойство кодека обрабатывать упорядоченный набор из нескольких потоков. Более того, масштабируемый кодек обязан выдавать изображение приемлемого качества даже в отсутствие части потоков набора. Минимально необходимый набор потоков называется базовым слоем. Каждый из других потоков набора называется улучшающим слоем (enhancement layer). Для масштабируемости по отношению сигнал-шум характерна передача через улучшающий слой дополнительных данных, уточняющих значения коэффициентов ДКП, вычисленных нижним слоем. Пониженная скорость потока нижнего слоя позволяет обеспечить его повышенную помехозащищенность, что собственно и дало название всему профилю. Декодер высокого профиля - это не обязательно самый сложный и дорогой декодер. Например, возможен сложный декодер низкого разрешения, или, наоборот, - простой декодер высокого разрешения. Декодеры, обеспечивающие определенный профиль определенного уровня, обязаны обеспечивать также все нижележащие профили и уровни. Профиль 4:2:2 известен также как Профессиональный Профиль (422P) и, в принципе, стал полноправным отдельным профилем MPEG–2 (вне иерархии). Этот профиль должен обеспечивать качество изображения, сравнимое с видеозаписью формата D1, и приемлемое качество коммутации транспортных потоков. Его основными свойствами являются структура дискретизации 4:2:2 (в отличие от 4:2:0), увеличенное число строк - 720 х 608 (в отличие от 720 х 576) и возможность работы с повышенными скоростями - до 50 Мбит/с (вместо 15 Мбит/с, обеспечиваемых Основным Профилем). Большинство вещательных применений основано на Основном Профиле Основного Уровня MPEG–2 (MPML = Main Level @ Main Profile). Для некоторых применений (например, - для наземного вещания) представляют интерес масштабируемые профили, в частности, профиль, масштабируемый по отношению сигнал-шум. Однако, пока вообще нет уверенности в целесообразности использования масштабируемых профилей. В таблице показаны основные технические параметры различных практически применяемых уровней основного профиля Уровень Структура

изображения Макс. частота полей

Размер буфера, Мбит

Диапазон векторов движения

Макс. цифровой поток

Высокий 1920 x 1152 60 9.787 -128 ... +127.5 80 Мбит/с Высокий-1440 1440 x 1152 60 7.340 -128 ... +127.5 60 Мбит/с Основной 720 x 576 30 1.835 -128 ... +127.5 15 Мбит/с Низкий 352 x 288 30 0.489 - 64 ... + 63.5 4 Мбит/с

Page 43: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

43

2. Формирование и передача цифровых потоков по стандарту MPEG-2

2.5 Аппаратная реализация. Сигнальные стыки Стандарт ISO/IEC 13818–1 "Системы" – описывает кодирование на системном уровне и определяет структуру временного уплотнения видео- и звукоданных, средства и данные синхронизации в реальном времени. Она посвящена мультиплексированию видео и звуковых потоков MPEG совместно с потоками вспомогательных данных в программные и транспортные потоки. Общие принципы обеспечения синхронизации в MPEG-2 Транспортный поток представляет собой объединение данных, поступающих от совершенно независимых и несинхронных источников. Поэтому концепция синхронизации MPEG-2 заключается в приеме заведомо несинхронных между собой программных потоков с целью дальнейшего обеспечения фиксированной задержки и синхронного воспроизведения всех составляющих программного потока. Реализуется эта концепция посредством ввода в транспортный поток Ссылок на программные часы (PCR). Поскольку все данные программного потока должны поступать в уже синхронизированном виде, то механизм синхронизации программного потока работает схожим образом, но посредством Ссылок на системные часы (SCR).

Рис. 2.5.1 Формирование многопрограммного транспортного потока

Разработчики системы вместо привычного термина "синхронизация" предпочитают говорить о поддержке правильного хода часов (Time keeping). Для этого имеются серьезные основания. Прежде всего, в любом источнике транспортного потока должны иметься Системные часы (STC = System Time Clock). Основная частота часов составляет 90 кГц и вырабатывается из частоты 27 Мгц путем деления ее на 300. С учетом дробной части (тактов 27 МГц) частота часов кратна тактовым частотам всех составляющих потока - видео, звука и т.д. Часы обслуживаются счетчиком с большим числом разрядов (33 разряда). Этого числа разрядов достаточно, чтобы в течение суток значение счетчика ни разу не повторилось. Другими словами, все значения системных часов - уникальны. Значения системных часов через мультиплексор и заголовки пакетов передаются декодеру. При этом безразлично, сколько времени заняло прохождение сигнала от кодера до декодера. Даже, если сигнал подвергался хранению на каком-либо носителе, значения часов сохраняют свой уникальность. Первая задача, решаемая с помощью системных часов, - обеспечение синхронизации тактовых частот кодера и декодера. Она решается с помощью схемы цифровой автоподстройки (NLL = Numerical Locked Loop) в декодере. Вторая задача, решаемая с помощью системных часов, - обеспечение синхронного воспроизведения видео и звуковой информации на выходе декодера. Для этого в заголовки некоторых некоторые пакетов периодически вставляются Временные метки воспроизведения (PTS = Presentation Time Stamps). Интервал между временными метками в транспортном потоке может достигать 700 мс, а в программном - до 100 мс. PTS представляет собой значение системных часов в момент, совпадающий с началом Единицы воспроизведения. Единица воспроизведения для видео - это один видеокадр, а для звука - блок отсчетов длиной 24 мс. Третья задача, решаемая с помощью системных часов, - обеспечение правильного декодирования сжатых видеоданных. Временные метки декодирования (DTS = Decoding Time Stamps) позволяют декодеру правильно разместить сжатые видеокадры в памяти для обработки. После обработки все разжатые видеокадры имеют одинаковый размер. Однако их выгрузка из памяти (воспроизведение) происходит, не в порядке поступления, а в соответствии с Временными метками воспроизведения.

Page 44: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

44

Мультиплексор транспортного потока периодически вставляет в расширенные заголовки пакетов текущие значения отдельного программного счетчика. Числовые значения показаний счетчика, собственно, и называются Ссылками на программные часы. Демультиплексор выбирает из транспортного потока только пакеты с выбранной программой и извлекает содержащиеся в них Ссылки на программные часы. Если бы это был не транспортный, а программный поток, то из заголовков длинных пачек извлекались бы Ссылки на системные часы. Различие здесь не только терминологическое. Дело в том, что различна природа этих Ссылок. Для нормальной работы декодера необходимо восстановить (регенерировать) тактовую частоту 27 Мгц, синхронную с тактовой частотой кодера. Единственным опорным источником для декодера выступают Ссылки на часы (PCR/SCR). Как показано на рис. 2.5.2 декодер содержит схему фазовой автоподстройки частоты (АПЧФ), обеспечивающую управление местным генератором тактовой частоты 27 МГц через 48-разрядный счетчик. Из-за сравнительно низкого быстродействия системы синхронизации на передающей стороне действуют довольно жесткие ограничения на тактовую частоту 27 Мгц и на скорость ее дрейфа. Частота должна отклоняться от номинальной не более, чем на 810 Гц, а скорость ее изменения не должна превышать 0.075 Гц в секунду.

Рис. 2.5.2 Восстановление тактовой частоты в декодере по Ссылкам на часы

Положительным свойством цифровой автоподстройки является быстрое время захвата. При переключении несинхронных программ декодер способен перенастроить свою тактовую частоту за доли секунды, практически незаметно для зрителя. Недостатком столь медленной автоподстройки является то, что она принципиально не способна отслеживать ВЧ составляющие фазового дрожания, а это потенциально чревато цифровыми ошибками. Поэтому эксперты MPEG сейчас заняты подготовкой норм на допустимое фазовое дрожание сигналов PCR.

Кодерсжатия

Счетчик

Мульти-плексор

Исходныевидеоданные

АПЧФ27 МГц

PCR (SCR)

Транспортныйпоток

Демульти-плексор

Элементарныйпоток К декодеру

Сравнение

СчетчикФНЧ

АПЧФ27 МГц

К декодеру

К декодеру27 МГц

PCR (SCR)

Счетвремени

27 МГц

Page 45: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

45

Стыки (интерфейсы) для передачи потоков MPEG-2 Передача транспортных потоков, например - от кодера сжатия к мультиплексору и от мультиплексора к модулятору, может производиться в различных форматах. Исторически, на ранних стадиях развития систем применялись различные параллельные стыки. Среди них довольно широкое распространение получил стык LVDS (Low Voltage Differential Signalling). Он был рекомендован DVB для применения в головных станциях кабельных сетей и сетей коллективного приема. Второй популярный стык - M2P (MPEG-2 Parallel) применялся фирмой Divicom и другими фирмами. На этом этапе были хорошо отработаны методы пакетной кодозащиты. Главный недостаток всех параллельных стыков - они совершенно не пригодны для передачи сигнала на расстояние более нескольких метров. Поэтому в больших центрах, обслуживающих десятки каналов должны применяться только последовательные стыки. Здесь развитие MPEG попросту повторило (в ускоренном темпе) путь развития цифровых ТВ студий, где тоже вначале пытались применять более дешевые параллельные стыки. Наиболее вероятный победитель в борьбе за стандартизованный стык - формат SDTI (Serial Data Transport Interface) по стандарту SMPTE305M, в основе которого лежит идея передачи произвольных, по существу, - асинхронных, пакетированных данных через инфраструктуру широко распространенного формата SDI. Основная идея стыка SDTI - укладка любых входных данных в формат вспомогательных данных видеопотока 4:2:2 и отказ от ввода байтов дополнительного потока для достижения обычной для SDI скорости 270 Мбит/с. Такой подход обеспечивает сочетание гибкости с достаточно высокой пропускной способностью. Через стык SDTI можно передавать сигналы DV, DVCPro, DVD, SX, потоки MPEG-2 различной, в том числе переменной, скорости, и многие другие виды данных. Информационная скорость передачи 9-битных данных - до 200 Мбит/с через тракты SDI 270 Мбит/с, и до 270 Мбит/с через тракты SDI 360 Мбит/с. С другой стороны, на практике наиболее распространенным в настоящее время является формат DVB-ASI (ASI = Asynchronous Serial Interface, называемый также "MPEG2 Serial Interface" или "M2S"). Он лишь частично совместим с форматом SDI 270 Мбит/с (из-за фиксированной полярности импульсного сигнала) и применяется только для передачи сжатых потоков MPEG-2. Описание этого стыка приведено в документе DVB Specification EN50083-9, подготовленном Европейским Институтом Стандартов Связи (ETSI). Основные идеи стыка ASI - укладка 8-разрядных данных в 10-разрядный параллельный формат и массированный ввод байтов дополнительного потока для достижения обычной для SDI скорости 270 Мбит/с. Дополнительный поток (stuffing) состоит из байтов уникального шаблона k28.5 причем они вводятся только между пакетами транспортного потока. Такой режим называется "пакетным" и не вызывает особых проблем. Однако, некоторые фирмы применяют "пачечный" режим, в котором байты дополнительного потока вводятся в пределах пакета. На приемной стороне опознавание и удаление байтов дополнительного потока k28.5 делается на этапе последовательно-параллельного преобразования. В США и других странах делаются, пока весьма ограниченные, попытки внедрения формата SSI по стандарту SMPTE310M - Synchronous Serial Interface for MPEG-2 Digital Transport Stream. Стык SSI хорошо обеспечивает подачу потоков до 40 Мбит/с от кодера сжатия на блок канального кодирования, однако этим область его применения практически полностью исчерпывается. В тексте стандарта прямо указывается на непригодность этого стыка для работы в условиях наличия даже весьма редких ошибок передачи. Стандарт MPEG-2 не оговаривает способы кодозащиты. Эти вопросы были решены в стандартах SMPTE и DVB. Короткие кабельные соединения обычно достаточно надежны и не требуют защиты от ошибок. Однако при передаче на большие расстояния, особенно через радиочастотные каналы, требуется надежная кодозащита. Ее обеспечивает так называемый внешний слой кодирования с применением кодов Рида-Соломона (RS). Помехоустойчивое кодирование заключается в перемешивании битов внутри полезной 184-битной нагрузки пакета с добавлением в его конце дополнительных 16 битов кода Рида-Соломона. Эта операция потенциально влечет за собой увеличение фазового дрожания. Поэтому некоторые разработчики с самого начала формируют в кодере сжатия (не вполне стандартный) транспортный поток, состоящий из пакетов длиной 188+16=204 байта, но место битов кода RS занимают пустые биты. Модулятор заменяет пустые биты битами кодозащиты, однако никакого дополнительного фазового дрожания не возникает.

Page 46: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

46

Формирование и передача цифровых потоков по стандарту MPEG-2

2.6 Предобработка и обработка сигналов MPEG-2 Общие сведения Программные видео и звуковые материалы поступают на кодеры сжатия из разных источников и в разных форматах. Сжатые видеоданные сегодня применяются не только для вещания, но и для производства программ. Следующий рисунок иллюстрирует применение MPEG на всех этапах видеопроизводства - от видеосъемки до выдачи в эфир и архивирования. Следует отметить, что в разных звеньях тракта применяются различные варианты потоков MPEG. Отсюда ясна потребность в многократном транскодировании с изменением не только скоростей потоков, но структуры GOP, структуры дискретизации и т.д.

Рис. 2.6.1 Применение различных вариантов MPEG в различных звеньях студийного тракта

Простой пример. Допустим, канал новостей получил издалека "горячий" сюжет и немедленно включил его в текущий выпуск. Формат полученного извне "эфирного" сигнала MPEG-2 был вполне обыкновенный - с длинными GOP, а скорость потока составляла вполне достаточные 6 Мбит/с. Однако, студийная часть канала новостей в целом работает на скоростях 25 Мбит/с и 270 Мбит/с, сервер выпуска использует формат M-JPEG, а в эфир уходит MPEG-2 с длинными GOP на скорости 3.8 Мбит/с. При таком построении тракта весьма трудно обеспечить приемлемое качество результата. "Наивное" каскадное преобразование с многократным разжатием потока до 270 Мбит/с и последующим повторным сжатием может привести к существенным искажениям. На следующем рисунке показано как ухудшается отношение сигнал-шум при многократном перекодировании с одинаковыми параметрами MPEG-2 (длинные GOP, скорость 4 Мбит/с). Особенно заметное ухудшение происходит, если границы GOP при повторном кодировании не выровнены, т.е. не совпадают с первоначальными, т.е. когда видеокадры типа I перекодируются в кадры типа B и наоборот.

Page 47: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

47

Рис. 2.6.2 Многократное перекодирование MPEG-2 на скорости 4 Мбит/с

На первый взгляд ситуация не такая плохая. Однако, измерения относились к статистической оценке возникающих искажений. Субъективное же качество изображения зависит, прежде всего, не от "усредненных" искажений, а от худшего варианта. На следующем рисунке показано, как снижается субъективная оценка качества при многократной перезаписи видеофонограмм формата "SX", что означает MPEG-2 "профессионального" профиля 4:2:2 основного уровня 422P@ML на сравнительно высокой скорости 18 Мбит/с, но с короткими GOP. Испытания проводились в Техническом Центре Европейского Союза Вещания по стандартным методикам ITU-R.

Рис. 2.6.3 Многократное перекодирование видеофонограмм формата "SX" на скорости 18 Мбит/с

В левом нижнем углу графика для контроля показаны оценки исходных тест-сюжетов. Горизонтальная красная линия отмечает порог заметности искажений (12.5%). Видно, что четвертая копия уже создает заметные искажения на некоторых "критических" сюжетах, а седьмая копия, даже по оценке "в среднем", находится за пределами приемлемого качества.

Page 48: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

48

Экономическая эффективность требует снижения скоростей потоков, но при сохранении приемлемого уровня качества. В иерархических сетях вещания все чаще возникает потребность в преобразовании скорости потока. Как правило, речь идет о понижающем преобразовании. Ключевой здесь является технология MOLE, которая впервые обеспечивает свободное от потерь перекодирование, переключение и монтаж цифровых потоков MPEG в ТВ студиях. Важность этого вопроса трудно переоценить. Именно поэтому SMPTE ускоренно разработала проект стандарта 327М "MPEG-2 Re-coding Data Set".Фактически, это стандарт, основанный на запатентованной фирмой Snell & Wilcox совместно с Би-Би-Си технологии MOLE™, с дополнениями, внесенными фирмами Sony и Thomson. Технология MOLE Любой сигнал MPEG содержит описание всех решений, принятых сформировавшим его кодером. При обычном декодировании MPEG эти сведения используются однократно - только для расжатия сигнала, и недоступны последующим звеньям тракта. Поэтому повторное сжатие добавляет свои новые искажения. Напротив, декодер MOLE сохраняет эти сведения и включает их в свой выходной сигнал, поэтому последующий кодер сжатия, по существу, просто повторяет действия первого кодера, т.е. искажения не накапливаются. Более того, даже, если второй "местный" кодер уступает первому высококачественному "центральному" кодеру, качество сквозного тракта будет ограничено, в основном, качеством первого кодирования. Важно, что сведения MOLE пространственно совмещены с исходным изображением. Каждый макроблок разжатого изображения содержит сведения о кодировании сжатого изображения. Поэтому при последующем микшировании, вводе титров, логотипов и прочих подобных операциях пространственная корреляция сохраняется.

Рис. 2.6.4 Карта данных MOLE для одного макроблока изображения

Другое достоинство этой технологии заключается в том, что данные MOLE передаются совместно с сигналом изображения через тот же физический стык. Из следующего рисунка видно, что они передаются в десятом (младшем) разряде цветоразностных сигналов. Поэтому, хотя данные расположены в активной части изображения, они фактически "спрятаны" ниже уровня заметности (даже ниже уровня шумов хорошего студийного источника). На яркостной составляющей изображения наличие или отсутствие данных MOLE никак не сказывается. Их, вообще, очень трудно обнаружить. Отсюда и произошло название технологии: MOLE по-английски означает "крот". Интересно, что второе, жаргонное, значение английского слова MOLE - шпион, осведомитель.

Page 49: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

49

Рис. 6.2.5 Данные MOLE передаются в младшем разряде канала цветности

Многочисленные эксперименты подтвердили высокую эффективность этой технологии. После одиннадцати перекодирований на скорости 3.8 Мбит/с качество изображения все еще сохраняется практически неотличимым от исходного. Предобработка и шумоподавление сигналов для эффективного сжатия MPEG-2 Все присутствующие в ТВ программе шумы и помехи по признаку их происхождения можно грубо разделить на две категории: шумы видеотракта и шумы кинопленки. Шумы видеотракта подразделяются на четыре основные категории: 1. Шумы тракта передачи: обычно это широкополосные шумы истинно случайного характера. При приеме спутниковых сигналов проявляются искровые помехи, вызываемые локальной потерей (выпадениями) ЧМ сигнала.

2. Помехи декодирования: зависят от типа обработки, качества декодера и от локальной структуры изображения. Включают перекрестные помехи яркость-цветность и цветность-яркость, а также остаточный сигнал цветовой поднесущей.

3. Шумы видеозаписи: в основном это шумы и выпадения ленты. К ним часто добавляются геометрические шумы, вызываемые временными искажениями. Особенно сильно проявляются в аппаратуре бытовой видеозаписи

4. Цифровые шумы: вызываются одиночными и пакетными ошибками передачи битов в цифровых трактах. Проявляются в виде коротких точек и линий, обычно случайного характера.

Имеется два основных источника шумов видеосигналов, полученных из киноматериалов. 1. Структура кинопленки: обычно шумы зернистости кинопленки равномерно распределены по площади кадра. Особенно заметны на 16-мм пленке и при масштабном увеличении кинокадров 35-мм пленки. Царапины появляются вследствие повреждения эмульсии при плохом обращении с пленкой или с проекционным оборудованием.

2. Дефекты кинофильма: наиболее часто встречаются загрязнения и царапины. Многие студии располагают специальной аппаратурой с устранением загрязнений перед телекинопроекцией. Однако, полностью снять загрязнения обычно не удается.

Дополнительным, не носящим принципиального характера, но достаточно существенным источником шумов может стать телекинодатчик при телепроекции кинопрокатных копий. Дело в том, что для получения видеосигнала полного размаха при телепоказе оптически плотных (проще говоря, темных) прокатных копий приходится увеличивать усиление видеотракта, усиливая шумы. Для коррекции контраста и цветокоррекции также требуется дополнительно усиливать сигналы (к сожалению, при этом усиливаются и шумы).

Page 50: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

50

В условиях острого дефицита программных материалов в эфир все чаще идут архивные киноматериалы, изобилующие загрязнениями и царапинами. Помехи, нестабильность положения кадра и мерцания его средней яркости не просто неприятны зрителю. На кодирование межкадровых разностей повышенной энергии впустую тратятся драгоценные ресурсы кодера сжатия. Векторы движения определяются с большими ошибками. Если взглянуть на экран анализатора, то можно видеть, как входной шум превращает решения кодера сжатия в совершенно хаотическую картину. Кодирование полезных элементов изображения при этом существенно затрудняется. Результат - качество декодированного изображения у зрителя оказывается крайне низким - заметно ниже, чем качество исходного архивного материала. Ситуацию осложняет неоднородность качества исходных материалов. Часть программных материалов оказывается уже подвергалась композитному декодированию и/или сжатию потока, что-то заимствуется у других сетей вещания, иногда надо вставлять новый логотип, добавляются еще и проблемы с изменяемым форматом кадра. Например, сравнительно малозаметные остаточные сигналы цветовой поднесущей и перекрестные искажения яркость-цветность существенно затрудняют работу кодера сжатия. В этих условиях, чтобы достичь эффективного использования цифровых каналов при сохранении качества, вещатели должны не только тщательно следить за входными сигналами кодеров сжатия и мультиплексоров транспортных потоков, но и подвергать их специальной предобработке. Уже создан целый набор средств, помогающих достичь поставленных целей. Хотя это уже и не совсем новость, но имеет смысл еще раз напомнить - без предобработки сигналов многоступенчатыми блоками шумоподавления и фильтрации нельзя даже надеяться на их эффективное сжатие кодерами MPEG. Дело в том, что случайные по своей природе шумы и помехи не обладают той самой избыточностью, которую так эффективно устраняет кодер сжатия. Поэтому значительная часть ресурса кодера сжатия оказывается истраченной "попусту" - на передачу шумов, а на передачу собственно изображения ресурсов уже не хватает. В результате качество разжатого изображения существенно снижается. Так как различные виды шума требуют разных методов их устранения, целесообразно сочетать классическую временную фильтрацию (с кадровым буфером) и медианную. Рекурсивная адаптивная фильтрация с автоматической настройкой порога шумоподавления обеспечивает понижение уровня случайного "белого" шума, а мощная трехмерная медианная фильтрация идеальна для устранения импульсных помех, таких как "искры" при приеме спутниковых программ, а также повреждения и загрязнения кинопленки.

Рис. 6.2.6 Адаптивный рекурсивный фильтр

Рекурсивная фильтрация подавляет шум путем усреднения близких значений видеосигнала в группе последовательных кадров. Порог и глубина фильтрации рекурсивного фильтра устанавливаются микропроцессором в каждом видеокадре раздельно для каналов яркости и цветности. При больших различиях в текущем и предыдущем значениях выходному видеосигналу немедленно присваивается входное значение. Тем

Page 51: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

51

самым исключаются типичные для рекурсивных фильтров искажения в виде тянущихся продолжений за движущимися объектами.

Рис. 6.2.7 Конфигурации медианной фильтрации

При трехмерной медианной фильтрации в анализе обычно участвуют отсчеты, расположенные выше, ниже, слева, справа, до и после текущего значения видеосигнала. Если текущее значение сигнала попадает в центр зоны разброса значений всех отсчетов, то оно считается истинным и подается на выход без изменения. Однако. если текущее значение оказывается на краю зоны, то оно считается ошибочным, т.е. вызванным импульсом шума, и заменяется на искусственно сформированное замещающее значение. Специальная асимметричная конфигурация медианного фильтра, при которой в анализе участвуют только отсчеты текущего и предыдущего кадра, позволяет обеспечить минимальную задержку распространения. Форма и размер апертуры медианного фильтра могут регулироваться для наилучшего согласования со свойствами обрабатываемого видеоматериала. Например, для киноматериалов с особо грубым зерном оптимальной является широкая апертура, а для компенсации выпадений размер апертуры не столь критичен. В некоторых случаях лучшие результаты могут быть достигнуты, применяя чисто пространственный (без отсчетов соседних кадров) или чисто временной (без соседних элементов кадра) медианный фильтр. Организация отдельного канала управления для адаптивного выбора оптимального фильтра превращает медианный фильтр в чрезвычайно мощное средство подавления разнообразных помех. Массированная выдача в эфир архивных киноматериалов сделала актуальной задачу "очистки" видеосигналов от загрязнений и царапин. В таких случаях "классическая" медианная фильтрация уже не справляется. Необходимы еще более сложные алгоритмы. И такие алгоритмы были разработаны. В частности, чтобы отличить царапину кинокадра от, скажем, фонарного столба на заднем плане, необходимо учесть такие факторы, как резкость горизонтальных переходов, вертикальный размер объекта и долговременная стабильность его положения в кадре. Сложность такого "разумного" фильтра на порядок превышает сложность классического медианного фильтра. Специализированные шумоподавители (предпроцессоры) не только снижают уровень шумов, но и подавляют те компоненты изображения, которые практически незаметны для зрителя, однако особенно сильно расходуют ресурс кодера сжатия, - например движущиеся диагональные структуры. Именно поэтому аппаратура предобработки и шумоподавления так широко применяется во всем мире. При очень сильном сжатии (до скоростей менее 2 Мбит/с) возникает, на первый взгляд, парадоксальная ситуация, когда кодирование расфокусированного изображения дает лучшие результаты, нежели кодирование исходного резкого изображения студийного качества. Дело в том, что на таких скоростях перегрузка кодера вносит очень сильные и неравномерные искажения, а некоторая общая потеря четкости гораздо более приемлема для зрителя. Поэтому наиболее совершенные блоки предобработки не только подавляют шумы и малозаметные движущиеся диагональные структуры, но также обеспечивают коррекцию излишней резкости (de-enhancement). Напротив, при высокой скорости потока и низкой четкости исходного изображения имеет смысл применить линейную и/или нелинейную коррекцию резкости (enhancement). Например, для оптимизации результата в различных применениях предпроцессор CPP200 серии PREFIX фирмы Snell & Wilcox содержит семь различных настраиваемых фильтров. Кроме сохраняемых настроек пользователя, предлагаются девять стандартных заводских установок: "Очистка кино", "Очистка видео", "Кино MPEG - низкая, средняя или высокая скорость", "Видео MPEG - низкая, средняя или высокая скорость".

Page 52: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

52

Формирование и передача цифровых потоков по стандарту MPEG-2

2.7 Контроль и измерение сигналов MPEG-2 Общие сведения Стандарт MPEG-2 и связанные с ним стандарты DVB и ATSC потребовали не только новой терминологии, но и совершенно новых методов контроля и измерений. Если несколько устройств со сжатием цифрового потока оказываются не в состоянии успешно взаимодействовать, то не всегда ясно, что именно неправильно. Хотя на этапе разработки оборудования со сжатием потока можно применять методы нереального времени, эксплуатация такого оборудования однозначно требует анализа и контроля в реальном времени. Контроль и измерения сигналов MPEG необходимы на всех уровнях - от букета услуг, включающего несколько транспортных потоков, до уровня решений, принимаемых кодером сжатия для отдельных макроблоков элементов изображения. Аппаратура для приемочных испытаний сетей MPEG, кодеров, декодеров, мультиплексоров, и приемников существенно отличается от рутинных проверок отлаженной системы. Особый случай представляет автоматизированная проверка приемников-декодеров в условиях их массового производства. На первое место по числу изделий сейчас выходит сравнительно простая аппаратура автоматизированного контроля корректности транспортного потока, - проще говоря, непрерывного или периодического контроля исправности. Совершенно иные задачи решают сложные анализаторы сжатых виде- и звукоданных. Они позволяют сравнивать кодеры сжатия, оценивать "разумность" и эффективность принимаемых кодером решений и, в конечном счете, оценивать качество результирующего изображения и звука. Третий вид задач, решаемых аппаратурой контроля и измерений - формирование широкого набора эталонных испытательных потоков для проверки демультиплексоров и декодеров. Эти устройства особенно необходимы для предприятий-изготовителей приемной аппаратуры. Важным параметром контрольно-измерительной аппаратуры MPEG является способ ее реализации. Дешевые, но менее надежные, программные средства вовсе не вытеснили аппараты реального времени, а периодический контроль с последующим анализом оказался совсем не подходящим для многоканальных вещательных комплексов. Контроль исправности транспортного потока Только, чтобы составить список типов данных и ситуаций, которые требуют контроля (по английски проверка исправности традиционно именуется Health Check = "медосмотр"), эксперты ETSI потратили немало времени. В результате появился Отчет ETSI 290, который подразделяет все виды испытаний транспортных потоков на три категории, называемые "Приоритетами": 1. Приоритет первого уровня: Жизненно важные испытания, результаты которых могут выявить ситуацию

потери декодирования вещательной службы

2. Приоритет второго уровня: Испытания, результаты которых могут выявить ситуацию, способную повлиять на функционирование системы в целом

3. Приоритет третьего уровня: Испытания, результаты которых отражают соответствие правилам DVB использованных средств MPEG

Все оговоренные документом параметры должны записываться устройством контроля в файл отчета, например с указанием начала и окончания периода контроля, числа отказов, статистики отказов, времени их появления и т.п.

Page 53: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

53

Приоритет первого уровня 1.1.TS_Sync_loss

Потеря синхробайта (0х47) в двух пакетах (не обязательно в двух соседних пакетах). Потенциальная опасность потери синхронизации в демультиплексоре/декодере. Флаг TS_Sync_loss должен сниматься после успешного приема синхробайта в течение пяти пакетов подряд.

1.2. Sync_byte_error

Ошибка синхробайта (0х47) в любом отдельном пакете. Прием значения байта, не равного правильному 0х47.

1.3. PAT_error

Ошибка Таблицы объединения программ. Таблица объединения программ должна передаваться с PID=0 не реже, чем каждые 0.5 секунды. Она должна содержать поле table_id с нулевым значением. Пакеты с PID=0 не должны содержать ничего, кроме разделов PAT. В пакетах с PID=0 не должны быть подняты флаги шифрования.

1.4. Continuity_count_error

Ошибка счетчика непрерывности. 4-разрядный счетчик должен непрерывно продвигаться в цикле 0-15 для всех пакетов с каждым PID. Флаг ошибки этого типа поднимается при потере пакета, неправильном порядке следования пакетов и повторе пакета.

1.5. PMT_error

Ошибка Таблицы состава программы. Таблица PMT должна передаваться в составе пакетов с PID, указанными в таблице PAT. Пакеты с этими PID должны содержать поле table_id 02, указываюшее на то, что передается PMT и ничего более. Таблица PMT должна передаваться не реже, чем каждые 0.5 секунды, и в ней не должны быть подняты флаги шифрования.

1.6. PID_error

Ошибка пакетного идентификатора. Любой PID, заявленный в таблицах PAT и PMT, но не найденный в составе потока. Например, если компонент элементарного потока (допустим, пакет звукоданных) не был включен ремультиплексором в состав транспортного потока, а все остальные компоненты были успешно включены.

Приоритет второго уровня 2.1. Transport_error

Ошибка передачи. В заголовке пакета имеется такой однобитный флаг. Он обычно поднимается демодулятором, установленным на выходе радиочастотного тракта. Означает, что кодозащита тракта была сломлена, а следовательно, полезная нагрузка пакета содержит ошибки.

2.2. CRC_error

Ошибка контрольной суммы. Таблицы MPEG-2 и DVB оканчиваются циклическими контрольными суммами, что позволяет обнаруживать ошибки при их передаче. Пакеты с ошибочными данными обычно игнорируются, что может привести к чрезмерному снижению скорости обновления таблиц.

2.3. PCR_error

Ошибка Ссылки на программные часы. По правилам DVB коды PCR должны передаваться каждые 40 мс, или чаще. Указанные в Ссылках значения времени должны контролироваться и, если обнаружится скачок часов более, чем на 100 мс, то оно считается ошибкой.

2.4. PCR_accuracy

Неточность Ссылки на программные часы. Измеренное дрожание часов (относительно каких-либо заведомо стабильных часов) превышает 500 нс.

2.5. PTS_error

Ошибка Временной Метки Воспроизведения. Для каждого из элементарных потоков Временные Метки Воспроизведения должны поступать не позднее, чем за 700 мс.

2.6. CAT_error

Ошибка Таблицы условного доступа. В составе транспортного потока имеются зашифрованные пакеты, но отсутствуют какие-либо разделы Таблицы условного доступа (они должны иметь идентификатор table_id 01). Пакеты с PID =0001 содержат данные, не относящиеся к разделам PSI table_id 01.

Page 54: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

54

Приоритет третьего уровня 3.1. NIT_error

Ошибка Таблицы сетевой информации. Пакеты с PID = 0010 должны содержать только данные, относящиеся к разделам table_id 40 и table_id 41 (или к Пустой таблице 72). Отсутствие пакетов NIT в течение более 10 секунд считается ошибкой.

3.2. SI_repetion_error

Ошибка периодичности Таблицы информации службы. В документах DVB и ETS 300 468 приведены нормы, оговаривающие период обновления всех таблиц SI.

3.3. Buffer_error

Ошибка буфера. Идеализированный эталонный декодер содержит буферы демультиплексирования, буферы для каждого элементарного потока и буферы системной информации. Во избежание потери данных кодер MPEG должен не допускать опустошения или переполнения буферов декодера. Поднятие этого флага означает приближение потенциально опасной ситуации в управлении буфером.

3.4. Unreferenced PID

Неуказанный идентификатор. Прием PID, значение которого не упомянуто в содержании декодированных таблиц PSI, или не относится ни к идентификаторам частных данных, ни к зарезервированным PID.

3.5. STD_error

Ошибка Таблицы описания службы. Эта таблица играет жизненно важную роль для приемников DVB. Пакеты PID = 0011 с разделом table_id 0x42 должны передаваться не реже, чем каждые 2 секунды. В пакетах с PID = 0011 должны передаваться только разделы 42, 26, 4A, или 72. 3.6. EIT_error

Ошибка Таблицы оглавления программ. . Пакеты PID = 0012 с разделом table_id 0x4Е должны передаваться не реже, чем каждые 2 секунды. В пакетах с PID = 0012 должны передаваться только разделы от 4Е до 6F, или 72. 3.7. RST_error

Ошибка Таблицы текущего состояния. В пакетах с PID = 0013 должны передаваться только разделы 0x71, или 0x72 (stuffing). 3.8. TDT_error

Ошибка Таблицы времени и даты. В пакетах с PID = 0014 должны передаваться только разделы 0x70 (TDT), или 0x72 (stuffing). 3.9. Empty_buffer_error

Транспортный буфер декодера должен быстро опустошаться по получении от мультиплексора рассортированных пакетов. Этот флаг указывает на то, что опустошение буфера происходит некорректно.

3.10. Data_delay_error

Буферы декодера вносят в сигнал чрезмерную задержку (более 1 секунды) =============================================================== Более подробные сведения о процедурах контроля исправности транспортного потока можно найти в следующих документах: 1. ETS 300 468 (1994) Digital Broadcasting systems for television, sound and data services; Specification for Service

Information (SI) in DVB systems 2. ETR 211 (1996) Digital broadcasting systems for television; Guidelines on implementation and usage of SI. 3. ETR 154 (1994) Digital broadcasting systems for television; Implementation Guidelines for the usage of MPEG-2

systems;… 4. ETR 290 Measurements Guidelines for DVB Systems.

Page 55: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

55

Анализаторы транспортного потока Анализ транспортного потока может проводиться на трех уровнях: • Проверка синтаксиса. Включает чисто формальные проверки на соответствие компонентов транспортного

потока правилам MPEG и DVB. Этот уровень рассмотрен на предыдущих страницах. Проверка синтаксиса - необходимое предварительное условие для любых других проверок. Если поток не соответствует стандарту, то нет смысла обсуждать качество изображения или совместимость оборудования.

• Контрольное декодирование. Анализатор при этом играет всего лишь роль заведомо исправного декодера. Функция не столь тривиальна, как может показаться на первый взгляд. Имеется огромное число разновидностей источников и приемников MPEG. Большинство из них претендует на то, чтобы считаться "стандартными". Одно только успешное декодирование потока сертифицированным анализатором уже является веским аргументом в споре между поставщиком сигнала и изготовителем приемников.

• Отображение решений кодера для оценки эффективности кодирования. Этот уровень часто называют "анализом видео и звука". В данном случае речь идет не о формальных проверках, отвечающих на вопрос о соответствии четко определенным формулам или допускам.

Назначение системы непрерывного контроля (мониторинга) - подтверждение того, что цепочка Вещательная Служба / Мультиплекс / Букет Услуг / Сеть Передачи (Service / Multiplex / Bouquet / Network) функционирует нормально. Однако, что означает "нормально" в данном контексте? На практике это вовсе не означает, что оборудование соответствует буквально каждой строке стандарта MPEG. Обычно это означает, что все интегральные приемники-декодеры (IRD) успешно справляются с сигналами выбранных служб и потребители не обращаются с жалобами (по крайней мере, не с жалобами технического характера). Поэтому необходимо соответственно сконфигурировать контрольное оборудование, дабы не требовать от системы, чтобы она была "святее папы римского". Зачастую система контроля не имеет доступа к полностью дешифрованным транспортным потокам, поэтому оценка должна в основном базироваться на той части информации, которая передается "клером". Оперативный контроль (мониторинг) помогает ответить на вопрос "Что неправильно?" Оперативный же анализ помогает ответить на вопрос "Почему неправильно?" Рассмотрим несколько типичных примеров. Аббревиатурами обозначены: IRD - приемник-декодер, MSA - синтаксический анализатор транспортного потока, MVA - видеоанализатор транспортного потока.

network

IRD

MSA

MVA

PC

Рис. 2.7.1 Выборочный контроль транспортных потоков с ведением журнала ошибок

IRD MVAMSA

IRD MVAMSA

IRD MVAMSA

Рис. 2.7.2 Эфирный контроль многопрограммной службы

Page 56: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

56

Encoder

Encoder

Encoder

Encoder

MUX

MVA

MSA

Рис. 2.7.3 Студийный мониторинг многопрограммной службы Конкретная конфигурация системы оперативного контроля зависит от требуемой глубины обнаружения отказов и от ассигнованных на контроль финансовых средств: • Например, фирма, предоставляющая вещательную службу (вещатель), требует стопроцентного мониторинга

своей службы внутри букета услуг. Для этого необходим доступ к дешифрованным транспортным потокам и анализ как транспортного, так и элементарного, потоков.

• Владеющая мультиплексом связная фирма, скорее всего, потребует полного контроля исправности транспортного потока, однако анализ элементарных потоков может быть и выборочным с поочередным обращением к различным службам в пределах данного транспортного потока. Связистам, грубо говоря, не интересно содержание программ. Они отвечают за целостность конверта, а не за правописание отправителя письма.

• Фирма, предоставляющая букет услуг, и владельцы сетей передачи требуют лишь поочередного контроля транспортных потоков путем перестройки на различные несущие частоты и на соответствующие транспондеры. Инвесторы хотят "держать руку на пульсе", не особенно углубляясь в детали.

Измерения, производимые в процессе оперативного контроля, должны подтверждать, что транспортный поток удовлетворяет основным действующим нормативным документам. В частности, должны присутствовать правильно закодированные данные MPEG-PSI (Program Specific Information - Программно Зависимая Информация) и DVB-SI (Service Information - Информация Вещательной Службы), которые позволяют идентифицировать отдельные составляющие транспортного потока. Для декодирования потока необходимо также наличие достаточного количества синхробайтов, к которым мог бы привязаться демультиплексор. Частота ошибок должна быть достаточно низкой, чтобы число нарушений непрерывности (continuity count errors) и несовпадений контрольных циклических сумм (CRC errors) было в допустимых пределах. Чтобы цепи автоподстройки декодеров оставались в состоянии синхронизма дрожание временных отметок (PCR timing values) не должно выходить за определенные пределы, Чтобы вовремя заметить переход аппаратуры к хаотическим сбоям необходимо проверять соблюдение ею скоростей потоков и других предустанавливаемых величин. Например, не должна быть чрезмерно большой величина дополнительного потока (стаффинга). Используемые кодером профили не должны выходить за пределы списка профилей, возможных для декодеров, применяемых в данной конкретной системе. Рассмотрим несколько подробнее третий уровень анализа. Количественные результаты подобного анализа обычно оцениваются экспертами, исходя из их опыта и, в какой-то степени, предрассудков. Например, имеется ситуация, когда значительную часть потока составляет "пустые" байты. Анализатор честно показывает высокий процент этих "пустых" байтов. Однако мнения двух экспертов могут оказаться прямо противоположными. Один скажет: "Это очень плохой кодер, смотрите - он же крайне неэффективно использует пропускную способность канала, в результате зрители смотрят изображение пониженного качества". Другой эксперт возразит: "Напротив, это очень хороший кодер, он бережет ресурсы, и, когда через секунду начнется прямая трансляция футбола с большим количеством динамических деталей, никакого скачка качества не произойдет и, наверное, буфер не переполнится"

Page 57: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

57

В настоящее время многие фирмы и исследовательские организации проводят интенсивные работы по выработке общепринятых методов объективных измерений, заменяющих субъективные оценки. Примерно так обстояло дело несколько десятилетий назад, когда в аналоговом телевидении стали внедряться сигналы испытательных строк и автоматизированные методы измерений. Общее качество вещания при этом резко повысилось, а продолжительность дискуссий резко снизилась. В конечном счете, только опытный глаз и хорошее ухо, в сочетании с изрядной толикой здравого смысла, способны удостоверить качество изображения и звука. Сейчас имеется весьма ограниченное число методик объективного измерения субъективного качества и большинство из них не подходит для непрерывного контроля. Человеческий мозг - наиболее мощный из известных корреляторов, однако он требует большого объема исходных данных. Хотя тренированный глаз - единственный надежный прибор для оценки качества изображения, когда проблема замечена, выяснить ее причины можно и должно только путем анализа цифровых данных. Высокие затраты времени и денег при анализе в нереальном времени приводят к тому, что в жертву приносится собственно достоверность испытаний в целом. При этом видеоанализатор MVA непосредственно показывает разработчикам на каких участках изображения кодер принимает то или иное решение. Режимы кодера отображаются поверх нормального изображения в виде цветных меток. Тем самым в оценку пространственной и временной корреляции между режимами кодера и локальными свойствами изображения непосредственно вовлекаются ресурсы человеческого мозга. Следующие два рисунка = это фотографии, полученные из "живых" выходных видеокадров анализатора MPEG типа MVA. Хорошо видно, как параметры кодирования соотносятся с содержанием изображения.

Рис. 2.7.4 Анализ режимов предсказания и параметров квантования

При анализе управления скоростью потока на левом краю изображения видны горизонтальные белые полосы, отображающие выбор шкалы квантования для данного слайса (горизонтальной группы макроблоков). Чем длиннее полоска, тем точнее выбранная шкала (мельче шаг квантования). Можно дополнительно наложить цветные метки, указывающие на использование данного значения параметра q_scale в каждом отдельном макроблоке вдоль данного слайса. Альтернативно, можно наложить метки, указывающие на режим предсказания макроблока.

Page 58: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

58

Рис. 2.7.5 Анализ режимов предсказания и векторов движения

При анализе компенсации движения наложенные линейные метки показывают направление и длину первого вектора движения каждого макроблока. |Можно наложить цветные метки, указывающие на используемый тип компенсации движения (вперед, назад, или двунаправленно) и даже, как показано на рисунке, сочетать эти два режима отображения, регулируя размер и положение выделяющего окна. Тем не менее, будущее - за объективными измерениями. Наиболее передовой здесь является технология PAR (Picture Appraisal Rating), применяемая в видеоанализаторах фирмы Snell & Wilcox. Она дает простую числовую оценку искажений изображения, вносимых кодированием MPEG, наподобие школьной системе оценок, применяемой также и при субъективных оценках качества по Рекомендации ITU-R. При этом учитывается сразу несколько факторов: выбранные шкалы квантования, заметность границ блоков, и т.д. Весьма важно, что технология PAR позволяет отделить искажения MPEG от других дефектов изображения, таких как зернистость кинопленки или перекрестные помехи композитного декодирования. Численное значение PAR - это не общее качество изображения, а именно потеря качества, обусловленная дефектами кодирования MPEG. Оценка качественных показателей трактов передачи сигналов MPEG Тракт передачи может быть просто отрезком кабеля, соединяющим кодер с декодером, но может быть и весьма сложной, - например спутниковая система доставки, питаемая от асинхронного ствола (ATM backbone). В общем случае, на вход тракта должен подаваться прецизионный повторяемый цифровой поток, а сигнал на выходе тракта должен проверяться на отсутствие ошибок системного уровня, а также подвергаться контрольному декодированию. На ранних стадиях разработки новой аппаратуры часто возникают ошибки синтаксического характера. Их хорошо обнаруживают устройства диагностики нереального времени, позволяющие записать подозрительные фрагменты и предоставить их экспертам для подробного анализа. Напротив, при эксплуатации хорошо отработанной аппаратуры обязательным является непрерывный контроль в реальном времени. В таких условиях, если что-то не так, то решение приходится принимать немедленно. Когда на выходах миллионов индивидуальных декодеров вдруг пропадает изображение, нужны экстренные действия и источник неприятностей должен быть выявлен как можно быстрее. В такой ситуации контроль с промежуточной записью и последующим анализом просто неприемлем. Необходим анализ видеоданных и синхросигналов в реальном времени, а для среднесрочной оценки состояния системы весьма желательна также регистрация частоты и времени появления ошибок.

Page 59: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

59

При испытаниях вещательных трактов, наземных или спутниковых каналов на вход тракта через соответствующий модулятор подается сжатый цифровой поток тест-таблицы. Этот вариант предпочтительнее подачи обычного видеосигнала тест-таблицы на вход кодера сжатия, поскольку он гарантирует определенность испытательного потока с точностью до каждого отдельного бита и снимается вопрос о возможной несовместимости кодера с испытываемым трактом и декодером. Влияние параметров тракта на работу системы MPEG проявляется, прежде всего, в виде потери части данных и сбоев синхронизации. Хотя интерфейсы и являются всего лишь составными элементами тракта MPEG, они все еще могут создавать проблемы, поэтому их имеет смысл проверять отдельно. Стандарт MPEG подразумевает, что данные передаются без ошибок и все пакеты данных поступают от кодера к декодеру с одной и той же задержкой. Теоретически, это означает, что декодер, синхронизируемый кодером, получает в каждом пакете данных значение PCR, точно совпадающее с местным значением, сформированным на основе местного тактового сигнала. На практике, это условие часто нарушается и выделенное из транспортного потока значение PCR не совпадает с местным значением. Подобное несоответствие обычно называется "дрожанием" (PCR jitter), хотя в данном контексте лучше бы подошел какой-либо другой термин.

Выдел.PCR A

РасчетОшибки

B

ПамятьPCR

МестныеPCRАПЧФ

TS

Сигналошибки

Рис. 2.7.6 Измерение дрожания Ссылок на программные часы (PCR) Можно написать множество страниц о тонкостях измерения временного дрожания, однако применительно к реальностям жизни наиболее существенным представляется следующий вопрос: "В какой степени дрожание временных ссылок влияет на работу моей системы?" Не очень-то воодушевляющий ответ звучит так: "Только, в той степени, в какой оно снижает ее надежность" Некоторые фирмы обеспечивают спутниковую доставку многопрограммных транспортных потоков с дрожанием PCR для сигналов всех служб не более 100 нс, т.е. менее 3 тактов частоты 27 МГц. Однако встречаются и системы с дрожанием до 12 мкс (более 320 тактов!). Такой уровень дрожания может привести к переполнению или опустошению буфера, если только декодер не снабжен входным подавителем дрожания (de-jitter). Очень большие величины дрожания могут также приводить к сбоям синхронизации декодера и нарушать формирование цветовых поднесущих на композитных выходах. При измерениях дрожания исходной предпосылкой считается отсутствие дрожания источника, т.е. исходные посылки PCR предполагаются стабильными. Если это требование не выполнено, то дрожание вызывается собственно нестабильностью тактового сигнала. Следует уделить внимание общей конфигурации испытательной установки. Если используются не очень качественные интерфейсы типа ASI, то каждое соединение может вносить дрожание до одного такта частоты 27 МГц. Три коротких соединения, связывающих кодеры с мультиплексорами, могут внести больше дрожания, чем целая спутниковая система! В самом измерителе цепи фазовой автоподстройки, отслеживающие величины PCR, должны обладать очень большой постоянной времени (в предположении, что источник был абсолютно стабилен). Тщательность при соединении источников и измерительной аппаратуры позволяет получать достоверные оценки дрожания PCR. Например, анализатор MSA100 фирмы Snell & Wilcox показывает не только величину дрожания PCR, но и отклонения тактовой частоты источника

Page 60: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

60

Испытания индивидуальных декодеров "Никогда не удается проверить, что декодер полностью соответствует стандарту". Это расхожее утверждение не совсем точно. Фактически, можно проверить, что декодер не нарушает стандарта, а в силу презумпции невиновности отсутствие обнаруженных нарушений означает соответствие стандарту, и от такого устройства в обычных условиях вполне можно ожидать успешной работы. Испытания такого рода - далеко не простое дело. Исчерпывающие испытания, в принципе, должны включать все возможные комбинации всех ожидаемых режимов кодирования MPEG. На завершение подобных испытаний не хватит и всей жизни испытателя. "Кодер MPEG - это не тот источник, который нужен для проверки декодеров". Другое популярное, но на этот раз абсолютно справедливое, утверждение. Дело в том, что подавая на вход серийного кодера 1000 раз один и тот же закольцованный фрагмент видеоматериала, например, от цифрового видеомагнитофона, Вы получите 1000 различных цифровых потоков. Кроме того, обычный кодер не склонен динамически переключать разрешение изображения, изменять частоту кадров, режимы кодирования и т.д. Только специальный источник испытательных последовательностей MPEG способен выдавать такие потоки неоднократно и с точной привязкой по времени. Источник испытательных потоков MSP обеспечивает прецизионное и гибкое управление формированием потока данных. При системных испытаниях он может подменять как кодеры сжатия, так и мультиплексоры с различными скоростями потока. Программное обеспечение MSP обеспечивает гладкое соединение в кольцо любой видеопоследовательности MPEG таким образом, что декодер не отмечает сбоев временных меток (time stamps).

modulator

MVAdemod

MSA

IRD

IRDMUX

network

encode

MSPPC

Рис. 2.7.7 Контрольно-испытательная станция на производстве приемников-декодеров

Функционирование декодера можно проверять при помощи схемы, показанной на рисунке. Здесь цифровой поток через модулятор направляется к индивидуальному декодеру (set-top box decoder) и одновременно (через демодулятор) к видеоанализатору. Анализатор при этом выполняет следующие функции: • функцию "эталонного" декодера ("эталонный" в данном случае означает заведомую исправность и соответствие

стандарту)

• функцию блока записи, регистрирующего состояние входного потока в момент отказа испытуемого индивидуального декодера.

Этот метод позволяет быстро и точно выяснять проблемы, возникающие при сопряжении различных моделей аппаратуры. Выявление всех режимов кодирования, вызывающих сбой декодера, позволяет существенно ускорить решение проблем. Схема представляет собой, по существу, схему стенда для испытания декодеров на этапе их разработке. Комбинация "живых" и искусственных источников, реальных и имитированных мультиплексоров с гибкой перестройкой радиочастот обеспечивает необходимое разнообразие режимов работы. Анализ результатов декодирования осуществляется просмотром, прослушиванием, обычными осциллографическими и другими традиционными методами, а также сравнением с эталонным декодером. Разумеется, при массовом производстве приемников-декодеров необходимы иные, сильно упрощенные подходы. Отсюда ясна потребность в разработке более сложных по составу, но, по возможности, простых в использовании тестовых потоков.

Page 61: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

61

Испытательные потоки MPEG-2 Когда заходит речь об измерениях в цифровом ТВ, то неизбежно возникает вопрос: "А что же случилось с традиционными испытательными таблицами?" Они по-прежнему составляют важную часть измерительного арсенала современного вещания. В аналоговых системах тест-таблица передается и принимается в более или менее неискаженном виде. ТВ приемники подстраиваются путем просмотра (и прослушивания) этого теста с целью достижения "наилучшего качества" изображения и звука. Имеет смысл напомнить, что в цифровых системах такой подход попросту не работает, поскольку принимаемое изображение либо характеризуется как "полнокачественное", либо вовсе пропадает. В какой-то момент цифровой приемник может оказаться на пределе своих возможностей, но все еще выдавать хорошую картинку, а затем при изменении на доли децибела вдруг обрушиться и вовсе перестать декодировать сигнал. Для создания практически полезной цифровой испытательной таблицы необходим тщательный учет новых факторов при сохранении простоты использования, свойственной традиционным тест-таблицам. Фирма Snell & Wilcox возглавила проект Test Card "M" (Испытательная таблица "М"), в котором объединили свои усилия ведущие вещательные компании Великобритании и Независимая Комиссия по Телевидению (ITC). Основная идея такого рода теста проста и известна - изображение на экране ТВ приемника содержит различные элементы, позволяющие судить о правильности настройки и качестве тракта передачи. Точная настройка ориентации антенны, подстройка яркости и цветопередачи, и другие подобные операции производятся прямо по изображению на экране. К сигналу тест-таблицы можно добавлять фоновую музыку, данные телетекста и управления форматом отображения. Таким образом, весь тракт MPEG, от выхода программного микшера АПБ и далее, может быть проверен и оценен, имея в своем распоряжении лишь тюнер, устройство отображения, да еще пару глаз (в некоторых случаях желательно также наличие органов слуха). Испытательная таблица "М" затрагивает три аспекта цифрового ТВ. • Во-первых, цифровое ТВ, представляющее во многом больший технологический скачок, нежели цветное ТВ,

требует соответственно большего объема приемо-сдаточных испытаний вещательных комплексов. Поэтому необходим надежный набор общепринятых тестов.

• Во вторых, появляется новое поколение ТВ приемников, изготовляемых различными фирмами во многих странах. При оценке правильности их функционирования также требуется некая надежная опора.

• В третьих, при развертывании сети вещания, как правило, постоянно выявляются все новые и новые проблемы несовместимости различных видов оборудования, поэтому приходится постоянно прибегать к использованию проверенных тестов.

Второй часто встречающийся вопрос: "Почему бы просто не использовать оцифрованные варианты старых тест-таблиц?" В определенном смысле, именно это и было сделано, но новая таблица имеет существенно больше функций. Старые таблицы - это статические изображения, но системы сжатия работают по межкадровым разностям, поэтому необходимы движущиеся тесты. Кроме того, прямое кодирование видеопоследовательности не гарантирует повторяемости результатов, - так уж устроены кодеры MPEG. Повторяемость результатов гарантирует только сохранение и проигрывание тщательно подготовленного и закольцованного сжатого цифрового потока. Все компоненты цифрового потока, включая звук, телетекст, дополнительные данные и т.д., соответствуют стандарту и протоколам DVB (в Америке - стандарту ATSC). Проверке правильности "упаковки данных" нет соответствия в аналоговых системах и ее не так легко отобразить на экране. Разработчикам тест-таблицы "М" пришлось проявить немало изобретательности, чтобы обеспечить требования проверки как традиционных, так и новых параметров. Для проверки великого множества цифровых параметров было создано семейство цифровых потоков, большинство из которых основано на одном и том же "визуальном" содержании. Как же удалось визуализировать "невидимые" цифровые свойства? Это было сделано, добавляя "стрессовые" изменения в параметры потока. Сигнал остается в рамках стандарта DVB, но приемнику все труднее его

Page 62: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

62

декодировать. Сила стресса постепенно нарастает до тех пор, пока приемник не обрушивается и видимое изображение не исчезает. Тест-таблицу "М" можно сравнить с айсбергом, на вершине которого располагается легко декодируемое традиционное тест-изображение, а ниже имеются разнообразные подвиды тестов для проверки приемников, мультиплексоров, трактов передачи, и т.п. Верхняя часть этого айсберга доступна всем и может применяться, например, при коммерческих демонстрациях ТВ приемников. В определенное время суток она может быть составной частью передаваемых программ (точно так же, как это делается сейчас в аналоговом ТВ). Подводная же часть предназначена для более квалифицированных пользователей - поставщиков комплексов и отдельных устройств, эксплуатационного персонала вещательных компаний, и т.д. Эти тесты могут передаваться во время регламентных работ и/или распространяться в виде дисков CD-ROM для проигрывания на специализированном оборудовании.

Рис. 2.7.8 Испытательная таблица "М"

Набор тестов включает в себе потоки различной скорости, различные номенклатуры GOP, тесты для проверки синхронизации, тест синхронности звука и субтитров, а также многое другое. Разработаны варианты для 625-строчного вещания по стандарту DVB, 525-строчного - по стандарту ATSC, и вариант ТВЧ по формату ATSC 1080i. Таблица рекомендована для применения в сети наземного цифрового вещания в Великобритании, лицензии на право использования приобрели многие предприятия, выпускающие бытовые приемники-декодеры. Физическим носителем записи для испытательных потоков тест-таблицы "М" является CD-ROM. Его можно загружать и проигрывать на аппаратуре многих ведущих фирм: Adherent, Tektronix, Rhode-Swarz , Snell & Wilcox и т.д. На рынке имеется довольное большое число программных продуктов, именуемых "тестами MPEG ". Проблема только в том, что они, как правило, не являются транспортными потоками по стандартам DVB. Например, фирма Philips выпускает весьма совершенный набор звуковых тестов формата DVD, пригодный для испытания, как встроенных в проигрыватели DVD, так и отдельных декодеров звукопотока MPEG. Он обеспечивает проверку декодера и многоканальных акустических систем. Следует напомнить, что на выходе проигрывателя DVD присутствует не транспортный поток, а однопрограммный поток MPEG.

Page 63: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

63

2. Формирование и передача цифровых потоков по стандарту MPEG-2

Словарь терминов и сокращений AAU Audio access unit - Единица доступа звука: один звуковой кадр AES/EBU

AC-3 Система кодирования и сжатия звукоданных, разработанная фирмой Dolby; применяется в ТВ вещании по стандарту ATSC и при записи дисков формата DVD; система AC-3 именуется также Dolby Digital

ASI Asynchronous Serial Interface - Асинхронный последовательный стык (другие названия - DVB-ASI, MPEG2 Serial Interface и M2S): однополярный коаксиальный стык транспортного потока

AU Access Unit - Единица доступа: общий термин для обозначения единиц доступа видео звука. Единица доступа включает целый видеокадр или блок звукоданных, плюс сопровождающие "пустые" данные (stuffing)

ATM Asynchronous transfer mode - Асинхронный режим передачи: транспортный протокол передачи данных по широкополосным цифровым сетям

Bouquet Букет: Группа транспортных потоков, в которой отдельные программы идентифицируются путем комбинирования идентификаторов сети (Network ID) и пакетных идентификаторов (PID)

CAT Conditional access table - Таблица условного доступа: совокупность пакетов с идентификатором PID = 1, содержащих информацию о системе зашифровывания (см. ECM и EMM)

Channel code Канальный код: способ модуляции цифрового сигнала с целью улучшения процессов передачи и записи информации

CIF Common Interchange Format - Общий формат обмена: формат передачи изображений для систем видеоконференций с частотой 30 кадров/с и разрешением 352 х 240 пикселов

Closed GOP Замкнутая группа видеокадров: группа видеокадров, в которой последними передаются кадры, не использующие предсказание назад. Пригодна для создания монтажной склейки сжатых видеопотоков

Coefficient Коэффициент: Число, характеризующее амплитуду составляющей спектрального преобразования с определенной частотой

Concatenation Каскадирование: Последовательное соединение нескольких кодеков сжатия-расжатия

DCT Discrete cosine transform - ДКП: Дискретное Косинусное Преобразование

DTS Decoding Time Stamp - Временная метка декодирования: часть заголовка ПЭП пакета, указывающая когда следует декодировать определенную Единицу доступа

DVB Digital video broadcasting - Цифровое видеовещание: вещание телевизионных программ в цифровой форме на радиочастотной несущей; включает наземное и спутниковое вещание

DVB-IRD см. IRD

DVB-SI DVB Service information - Информация службы DVB: часть транспортного потока, описывающая его и другие транспортные потоки. Включает таблицы NIT, SDT, EIT, TDT, BAT, RST, ST

DVC Digital video cassette - Цифровая видеокассета: торговая марка формата бытовой видеозаписи

DVD Digital video disk (именуется также Digital versatile disk) - Цифровой видеодиск: формат оптической записи цифровых данных, в том числе видеоданных

ECM Entitlement control message - Сообщение управления доступом: информация системы условного доступа, содержащая определенные кодовые слова или другие параметры шифрования

EIT Event information table - Таблица оглавления программ: часть информации DVB-SI

EMM Entitlement management message - Сообщение разрешения доступа: информация системы условного доступа, указывающая на разрешение доступа определенных декодеров к определенным службам

EOB End of block - Конец блока: кодовая комбинация, передаваемая в случае, если все остающиеся коэффициенты блока ДКП равны нулю.

Elementary stream Элементарный поток: общий термин для обозначения потока данных одного вида - сжатых видеоданных, звукоданных, или иных данных, не объединенных с какими-либо другими данными

Page 64: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

64

Event Набор элементарных потоков, обычно видеопотоков и звукопотоков, обладающих общей временной шкалой, моментом начала и окончания

FEC Forward error correction - Кодозащита: кодирование с обнаружением и устранением ошибок, при котором к исходным данным добавляются дополнительные данные, позволяющие декодеру обнаруживать и исправлять ошибки передачи

GOP Group of pictures - Группа видеокадров: обычно начинается с видеокадра типа I и заканчивается видеокадром любого типа, за которым следует видеокадр типа I следующей группы

Huffman coding Код Хафмана: обеспечивает сжатие данных путем кодирования длин серий

Interleaving Перемежение: способ коррекции ошибок, приводящий к разбиению длинной серии ошибок на несколько коротких серий

Intra-coding Внутрикадровое кодирование: способ сжатия, затрагивающий только один видеокадр; именуется также пространственным кодированием

IRD Integrated receiver decoder - Приемник-декодер: устройство, объединяющее функции приема радиочастотного сигнала и расжатия цифровых данных; предназначено для сопряжения телевизора с системой цифрового вещания

Level Уровень кодирования: определяет размер (разрешение) передаваемого изображения; обычно сочетается с указанием на какой-либо профиль кодирования

Macroblock Макроблок: данные части изображения, одномоментно обрабатываемые ДКП; включает информацию яркости и цветоразностных сигналов

Masking Маскирование: Психо-акустический эффект, снижающий слышимость некоторых звуков при наличии других звуков

NIT Network information table - Таблица сетевой информации: содержащиеся в транспортном потоке сведения о других транспортных потоках вещательной сети

Null packets Пустые пакеты: пакеты дополнительного потока, необходимые для поддержания постоянной скорости потока при переменной информационной скорости

Overflow Переполнение буфера: возникает в случаях, когда поступление новых данных превышает их расход

PAT Programme association table - Таблица объединения программ: пакеты данных с PID = 0, содержащие сведения обо всех программах транспортного потока. Указывает на Таблицы состава программы (PMT), которые, в свою очередь, указывают на видеопотоки, звукопотоки и другие потоки определенной программы

PCM Pulse code modulation - ИКМ: Импульсно-кодовая модуляция. В техническом жаргоне обозначает исходные данные на входе кодера сжатия, а также любые не сжатые данные

PCR Programme clock reference - Ссылка на программные часы: Фрагмент показаний счетчика тактовой частоты, посылаемый кодером в составе заголовка программы с целью синхронизации декодера

PCRI Interpolated programme clock reference - Интерполированная ссылка на программные часы: формируется декодером для оценки ухода часов в перерывах между приемом основных ссылок

PID Packet Identifier - 13-битный код в заголовке транспортного пакета: все пакеты одного элементарного потока должны иметь одно и то же значение PID

PMT Programme Map Table - Таблица состава программы: содержит указания на видеопотоки, звукопотоки и другие потоки определенной программы

PSI Programme specific information - Программно-зависимая информация: совокупность таблиц, координирующих связи между программными потоками в составе транспортного потока и между элементарными потоками в составе программных потоков. Включает таблицы NIT, PAT, PMT, CAT, ECM и EMM

PSI/SI Общий термин для совокупности данных MPEG-PSI и DVB-SI

PTS Presentation time stamp - Временная метка воспроизведения: часть заголовка ПЭП пакета, указывающая когда следует выдавать зрителю определенную Единицу воспроизведения

PU Presentation unit - Единица воспроизведения: общий термин для обозначения единиц воспроизведения видео звука. Единица воспроизведения включает целый видеокадр или блок звукоданных, но не включает сопровождающие "пустые" данные (stuffing)

Page 65: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

65

Pack Пачка: набор ПЭП пакетов, в заголовке которого может передаваться информация SCR

Padding Набивка: жаргонный термин для "пустых" выравнивающих данных (см. Stuffing)

Packet Пакет: организованная группа последовательно передаваемых байтов. В транспортном потоке пакет имеет небольшую и фиксированную длину, а в программном потоке пакет включает целое число единиц воспроизведения и его длина не фиксирована

Payload Полезная нагрузка: все данные пакета, за исключением заголовка

Pre-processing Предобработка: операции шумоподавления, фильтрации, передискретизации, выявления границ видеокадров в последовательности 3:2, и другие операции, обеспечивающие повышение степени сжатия и/или качества разжатого изображения

Profile Профиль: подмножество вариантов кодирования MPEG, выбранное для определенных приложений

Programme stream Программный поток: совокупность видеопотока, звукопотока (или звукопотоков) и синхроданных, относящихся к одной ТВ программе

QSIF Формат изображения, представляющего собой четвертую часть изображения формата SIF (176 x 144 пиксела)

RLC Run-length coding (RLE = Run-length encoding) - Кодирование длин серий: способ сжатия данных путем замены длинных серий одинаковых значений битов кодом их количества (длины серии)

SCR System clock reference - Ссылка на системные часы: Фрагмент показаний счетчика тактовой частоты, посылаемый кодером в составе заголовка программы

STC System time clock - Системные часы: общие часы для синхронизации видео и звуковых потоков одной программы

SDT Service description table - Таблица системного описания: содержит список всех провайдеров всех служб, содержащихся в транспортном потоке

SDTI Serial Data Transport Interface - Последовательный транспортный стык: соответствует стандарту SMPTE305M, обеспечивает передачу произвольных асинхронных пакетированных данных через инфраструктуру широко распространенного формата SDI

SI System information - Системная информация: см. DVB-SI

SIF Source input format - термин MPEG-1, обозначающий изображение половинного разрешения

SSI Synchronous Serial Interface - Синхронный последовательный стык: соответствует стандарту SMPTE310M и хорошо обеспечивает подачу потоков до 40 Мбит/с от кодера сжатия на блок канального кодирования, непригоден для работы в условиях наличия даже весьма редких ошибок передачи

ST Stuffing Table - Пустая таблица

Stuffing Набивка, выравнивание: биты или байты "пустых" данных, добавляемые для поддержания постоянной скорости потока

Syndrome Синдром: результат первого этапа обнаружения ошибок. Нулевое значение указывает на отсутствие ошибок

TDAC Time domain aliasing cancellation - Компенсация помех дискретизации во временной области: способ сжатия звукоданных, применяемый в системе AC-3

TDT Time and data table - Таблица времени и даты: входит в состав обязательных таблиц DVB-SI

TS Transport stream - ТП, Транспортный поток: содержит пакетированный набор нескольких программных потоков

Underflow Опустошение буфера: возникает в случаях, когда расход данных превышает поступление данных

VAU Video access unit - Единица доступа видео: один видеокадр

VBV Video buffer verifier - Рекомендованная задержка буфера: определяет объем буферной памяти, требующейся для декодирования определенного элементарного потока

Vector Вектор [движения]: параметр подсистемы компенсации движения, указывающий на величину и направление сдвига, необходимого для наилучшего соответствия макроблоков сжимаемых изображений

Weighting Взвешивание: способ снижения заметности шумов квантования путем усиления слабых спектральных компонентов перед их квантованием

Page 66: MPEG2 DVB

Техническое обеспечение производства и выпуска ТВ программ для цифрового спутникового вещания www.solarforce.narod.ru/DVBtransmitter.htm

66

Zero-run-length Длина серии нулей: число нулевых коэффициентов ДКП, следующих подряд при определенном типе сканирования

Zig-zag scanning Z-упорядочение: способ расстановки коэффициентов ДКП с целью сосредоточения нулевых значений в конце последовательности считываемых коэффициентов