Слайд 2
Применяя эффективные методы
кодирования отдельно для контуров (резкие перепады
яркости) и текстуры (всё, что не контуры) можно получить
очень
высокую степень сжатия,
стандарт MPEG.
Слайд 3
СТАНДАРТ ЦИФРОВОГО СЖАТИЯ MPEG-1
• MPEG означает Motion Pictures
Experts
Group (Группа экспертов по движущимся
изображениям)
• Полное название группы
- ISO/IEC
JTCI/SC29/WG11
• Группа создана в 1988 г. для выработки
международного стандарта движущихся
изображений и звуковых сигналов до
скорости порядка 1,5 Мбит/с с целью записи
на CD-ROM с качеством бытового стандарта
VНS. Исходные скорости - 270 (360) Мбит/с.
Слайд 4
• Стандарт принят в 1993 г. и получил
индекс ISO/IEC 11172.
• Стандарты MPEG не определяют схему и
конструкцию кодера и декодера, они лишь описывают средства, используемые для обработки сигнала, определяют правила построения последовательности символов
совместимого цифрового потока и дают примеры реализации декодера.
• Состав и построение кодера оставлены на усмотрение разработчика. Декодер должен декодировать любой цифровой поток, совместимый со стандартом MPEG-1.
Слайд 5
MPEG-1 - методы компрессии:
• предсказание, когда передаются не
сами элементы изображения, а разность между элементами в строке,
в соседних строках и смежных кадрах;
• внутрикадровое и межкадровое кодиро-вание,
• дискретно-косинусное преобр. Компен-сация движения.
Слайд 6
Определены три типа видеокадров:
• I - видеокадры (от intra-внутри)-внутрикадровое кодирование.
• P - видеокадры (predicted) первый Р кадр
предсказывается по I - кадру, второй и последующие по предыдущему Р кадру;
• B - видеокадры кодер рассчитывает как прямое, так и обратное предсказание и посылает декодеру данные, имеющие наименьший объём (отсюда - bidirectional, то есть двунаправленный). Польза В - кадров проясняется при рассмотрении задней границы движущегося объекта, для передачи открывающегося фонового изображения выгоднее воспользоваться данными более позднего кадра.
Слайд 7
• Ограничения, определяющие область применения:
• размер изображения по
горизонтали < 768 пикс.;
• размер изображения по вертикали
576 строк;
• частота кадров < 30 Гц;
• развёртка прогрессивная (в ТВ системах стандартного качества - черезстрочная);
• число макроблоков < 396 (для ТСЧ надо иметь (720: 16) х (576: 16) = 1620 макроблоков /кадр );
• скорость цифрового потока < 1,856 Мбит/с.
396 макроблоков соответствует формату разложения CIF (352х480), не для вещательного телевидения.
Слайд 8
СТАНДАРТ ЦИФРОВОГо сжатия MPEG - 2
• Стандарт MPEG-2
принят в 1996 г., дополнен в 1997 г. и
получил индекс ISO/IEC 13818.
• Стандарт MPEG-2 значительно улучшен по
сравнению с MPEG-1, имеется возможность
обработки черезстрочных изображений, набор
уровней и профилей, масштабируемый синтаксис, системный уровень с программным и транспортным потоками, новые средства кодирования звука и др.
Слайд 9
• Стандарт MPEG-2 значительно сложнее MPEG-1
(кодер примерно
на 50%), охватывает более широкий круг применений, включая вещательное
телевидение.
MPEG-2 может использоваться и для ТВЧ, поэтому были прекращены работы над
стандартом MPEG-3, для систем ТВЧ.
• Стандарт MPEG-2 называется Информационные
технологии – Обобщённое кодирование движу-щихся изображений и сопровождающей звуковой информацией.»
Слайд 10
• В стандарте приняты 5 основных и
один дополнительный
профессиональный
Профиль "4:2:2",
введённый позднее.
• Внутри каждого Профиля выделено
4
уровня, определяющие
допустимые пределы изменения
параметров цифрового потока.
Слайд 11
уровни основного профиля MPEG-2
• ВысокийMP@HL Число отсчётов
на строку 1920. Число строк на кадр 1152. Частота
кадров, Гц 60. Частота отсчётов сигнала яркости, отсч/с 62668800. Скорость потока Мбит/с 80. Размер буфера, бит 9781248.
• ВысокийMP@H1440. Число отсчётов на
строку 1440. Число строк на кадр 1152. Частота кадров, Гц 60. Частота отсчётов сигнала яркости, отсч/с 4700,1600. Скорость потока Мбит/с 60. Размер буфера, бит 7340032
Слайд 12
• ОсновнойMP@ML. Число отсчётов на строку 720. Число
строк на кадр 576. Частота кадров, Гц 30. Частота
отсчётов
сигнала яркости, отсч/с 10368000. Скорость потока Мбит/с 15. Размер буфера, бит 1835008
• НизкийMP@LL. Число отсчётов на строку352. Число строк на кадр 288. Частота кадров, Гц 30. Частота
отсчётов сигнала яркости, отсч/с 3041280. Скорость потока Мбит/с 4. Размер буфера, бит 475136
Слайд 13
Сжатие звуковых сигналов (стандарты MPEG)
• Уровень 1 –
Fв =15 кГц, n = 4, tз=20 мс, v=192
кбит/с. Рассчитан на упрощенный кодер. Используется полосное кодирование (32 полосы), слуховая модель создаётся по уровням в самих частотных полосах.
Слайд 14
• Уровень 2 - Fв=15 кГц, n=6, tз=40-50
мс, v=128 кбит/с. Тот же набор фильтров и отдельный
частотный анализатор, который создаёт более точную слуховую модель. Масштабирующие коэффициенты создаются более сложным образом, учитывается сходство этих коэффициентов в соседних кадрах звуковых данных.
Слайд 15
Уровень 3- Fв=15 кГц, n=12, tз = более
50 мс, v=64 кбит/с.
Намного сложнее. Попытка создать точную модель
слухового восприятия. Моделируется ширина критических полосок слуха. Применяется код Хаффмана.
Слайд 16
Кодирование звука в MPEG-2
• В MPEG-2, совместимом с
MPEG-1 используются трёхуровневые системы кодирования звука. Различие между стандартами
начинается при переходе от двухканального звука к много-
канальному звуку (5+1).
• Одной из разновидностей многоканального звука является многоязычное звуковое сопровождение. Оно может осуществляться :
• либо передачей отдельного цифрового потока для каждого языка,
• либо добавлением нескольких (до7) языковых каналов 64 кбит/с к многоканальному потоку 384 кбит/с.
Слайд 17
• В дополнение к основному режиму с частотами
дискретизации 32, 44,1 и 48 кГц в MPEG-2 введён
низкочастотный режим (Low Sampling RATE) с пониженными вдвое частотами дискретизации:
16, 22,05 и 24 кГц. Это позволяет субъективно повысить качество звучания речевого сигнала. Отбрасывание верхних частот почти не влияет на качество речи, а высвобождающиеся ресурсы битов используются кодером для более точной передачи нижней части спектра.
Слайд 18
Высокоэффективная cистема кодирования MPEG-2 AAC (Advanced Audio Coding)
•
Частоты дискретизации могут изменяться от 8 до 96 кГц.
•
Скорости от 48 до 567 кбит/с на каждый канал. до 48 каналов.
• Используется время-частотное преобразование, технологии предсказания и кодирования по Хаффману.
• Достигается вещательное качество. Низкая скорость.
Слайд 19
• Предусмотрено три профиля конфигурации:
- Главный профиль (Maine
profile). Наилучшее качество. Наиболее сложный алгоритм обработки.
- Профиль пониженной
сложности (Low-Complexity). Проще процедура обработки. Качество высокое.
- Профиль с масштабированием частоты дискретизации. Проще, чем главный профиль и профиль LC.
для сжатия изображений с
прогрессивной разверткой;
fк до 30 Гц; z =576 ; Nca= 720;
в поток со скоростью до 1856 кбит/с.
MPEG-2 - развитие и расширение MPEG-1
в MPEG-2:
- применяется масштабируемость (не всегда)
-нет ограничений на размеры кодируемых изображений ;
- используется чересстрочная развертка.
-многоканальный /до7 / звук (МРEG-1 - 2-х канальный)
Отличия MPEG-1 от MPEG-2
Слайд 21
MPEG4 Кодирование видеообъектов
В отличие от MPEG-1, MPEG-2,
в которых
применяется фиксированный алгоритм
кодирования, в MPEG-4 используется целый
набор методов
кодирования, включающий как
алгоритмы сходные с применяемыми в MPEG-1 и
MPEG-2, так и принципиально новые методы
кодирования основанные на понятии
видеообъекта.
Выбор метода кодирования в конкретном случае
определяется характером изображения и
требуемым коэффициентом сжатия информации.
Слайд 22
MPEG4 Видеообъекты, аудиообъекты и аудио-визуальные объекты
Видеообъектами (VO -
visual object) могут быть
изображения людей и предметов, перемещаю- щиеся
перед неподвижным фоном, и сам неподвижный фон.
Аудиообъектами (AO - audio object) могут быть голоса людей, музыка, другие звуки.
Аудио-визуальными объектами (AVOs – audio-visual object) могут быть связанные видео и аудио объекты, например, изображение человека и его голос.
Слайд 23
Сцены MPEG-4
MPEG-4 содержит специальный язык описания сцен –
BIFS (Binary Format for Scenes)
Слайд 24
В описании структуры: координаты объектов в пространстве, их
привязка ко времени.
VO в разных плоскостях перекрываются
(находящиеся
ближе перекрывают дальних).
Иерархическая структура сцены
Слайд 25
Сцена содержит все объекты, информация о которых есть
в потоке, или только часть объектов.
В интерактивном режиме
можно влиять на развитие сцены.
MPEG-1, MPEG -2 - фиксированный алгоритм кодирования,
МРЕG-4 - множество методов кодирования:
-алгоритмы, сходные с MPEG-1, MPEG-2;
-методы кодирования, основаные на понятии VO
Выбор метода кодирования - по характеру изображения и коэффициенту сжатия. MPEG-4 сжимает натуральные, синтетические изображения и объединяет их при воспроизведении.
Слайд 27
ДКП - прямое дискретно-косинусное преобразование;
ДКП-1
- обратное ДКП;
Кв - квантователь;
Кв-1 - деквантователь;
ЗУ - запоминающее устройство;
Пред. 1, Пред.2 - блоки, формирующие предсказанные изображения в разных режимах кодирования;
ОД - оценка движения и формирование векторов движения;
Мп - мультиплексор;
БЗУ - буферное запоминающее устройство;
УКС - управление коэффициентом сжатия;
«Выбор» - подключение блоков предсказания в зависимости от метода кодирования.
На схеме:
Слайд 28
Взаимодействие с наблюдаемой сценой
• Изменять точку обзора сцены.
•
Менять местоположение объектов в сцене.
• Выбрать желаемый язык.
Слайд 29
Кодирование звука
• Кодирование как натуральных, так и синтезированных
объектов.
• В MPEG-4 сохранён синтаксис MPEG-2 AAC.
• Скорости 2-4
кбит/с (частота дискретизации 8 кГц) и 4-16 кбит/с (16 кГц) с параметрическим кодированием.
• Кодирование речи (6-24 кбит/с) – используется CELP - Лине́йное предсказа́ние с мультико́довым управле́нием (англ. Code Excited Linear Prediction).
• Синтезированная речь – передаются фонемы (звуки букв, двух и трёх их комбинаций, смех, кашель).
• Имитация звуков музыкальных инструментов.
Слайд 30
MPEG-4 H. 264
Рекомендация является заметным шагом вперед
по
сравнению с версией стандарта MPEG4
(рассмотренная рекомендация должна стать
расширением
стандарта MPEG 4).
Формат кодирования позволяет добиваться
эффективности представления информации,
превосходящей эффективностью, допустимую
в рамках стандарта MPEG4, более чем на 30%.
Естественно, вычислительная сложность несколько выше вычислительной сложности стандартных решений, однако, это обстоятельс-тво не должно стать препятствием для использо-вания этой рекомендации.
Слайд 31
5 названий на одно и то же:
H.264, MPEG-4 Part 10, AVC, H.26L, JVT
Слайд 32
H.264 - профили и уровни
.
• Разные конфигурации
- разные возможности
– Профиль:набор алгоритмических особенностей
– Level: уровень возможностей.4
профиля H.264
• Baseline - наименее сложный (нет B-slices).
Области применения: видеотелефония, видеоконференции, беспроводные системы
– Main - наилучшее сочетание уровня компрессии и качества видео под выбранную скорость передачи.
Области применения: широковещательное телевидение+DVD стандартного разрешения
Слайд 33
– Extended - потоковое видео с очень высокой
скоростью передачи.
Области применения: сервисы мобильного видео Mobilevideo services
– High
(High,High10,High4:2:2,High4:4:4) кодирование видео без потерь.
Области применения:ориентирован на HDTV
Слайд 34
Формат сжатия Windows Media
• Создан компанией Microsoft на
базе видеокодека
Windows Media 9 Series. Тестировался обществом
инженеров кино и
телевидения (SMPNE).
• Первая версия VC-1, известен как VC-9.
• Алгоритм менее сложный, чем MPEG-4, проще
реализуется.
• Качество, как в MPEG-2 при равном качестве.
• Кодирование VLC (Variable length Coding); блок
компенсации движения 16Х16, опорный кадр
подобен MPEG-2.
• Включён как формат сжатия для дисков Blu-Ray
и HD DVD .