Реферат
по курсу «Основы телевидения»
«HDTV – телевидение высокой четкости»
2002г.
Содержание:
· Часть 1:
HDTV
– телевидение высокой четкости
1. Начало HDTV
2. Раннее телевидение
3. Решение проблемы формата
4. Преимущества цифровой передачи
5. Стандарты цифрового телевидения
6. Наследие старого телевидения
7. Проблемы формата
8. Угол зрения
9. Проблема передачи сигнала
10. Проблема просмотра
· Часть 2: Компрессия сигнала в
HDTV
1. Немного истории
2. Стандарт кодирования MPEG-2
3. Компрессия видеоданных
4. Кодирование кадров
5. Компенсация движения
6. Дискретно-косинусное преобразование
7. Профессиональный профиль стандарта MPEG-2
http://www.zdnn.ru/?ID=176641 - talkback#talkback
Н
ачало
HDTV
Всего 60 лет назад сама идея передачи изображения и звука на огромные расстояния казалась абсурдной. Но человечество поверило в нее, а затем овладело ею. Мы создали гигантскую индустрию и продолжаем питать ее своими ожиданиями и огромным количеством рекламных долларов. В недавнем исследовании в ответ на вопрос, каково величайшее изобретение ХХ века, около 50% всех опрошенных жителей США назвало телевидение.
7 сентября 1927 года в мастерской на чердаке своего дома на Грин-Стрит в Сан-Франциско молодой изобретатель по имени Фило Тэйлор Фернсуорт (Philo Taylor Farnsworth) продемонстрировал нетерпеливым инвесторам свое изобретение. Ему удалось передать по радио изображение толстой белой линии, нанесенной на стеклянную пластину, в устройство с маленьким круглым экраном. Он поворачивал стекло, и принимаемое изображение линии одновременно меняло свое положение. Эта демонстрация и блестяще организованная подготовка к ней позволили Фернсуорту опередить всех, кто занимался той же проблемой, и положили начало судебной баталии с компанией RCA за право на патент, которую Фернсуорт в конечном счете выиграл.
Первые телепередачи Фернсуорта велись самодеятельными эстрадниками из маленькой студии в Филадельфии и передавались маломощным передатчиком на короткое расстояние для живших в миле от студии первых телевизионных инженеров-владельцев опытных устройств.
Фернсуорт и его помощники изготовили несколько прототипов и первые коммерческие приемники, но настоящим производством и распространением телевизоров занялись компании типа RCA и Philco. Эти первые устройства в деревянных корпусах выглядели как маленькие гардеробы с оконцем в волшебный мир. Постепенное совершенствование технологии этих черно-белых телевизоров привело к более крупным и четким изображениям, а где-то в 50-х появились средства передачи цветных сигналов — это было первое и единственное принципиальное изменение технологии и конструкции телевизора. Но сигнал продолжал передаваться с тем же разрешением (около 400 строк на кадр), тем же слабым звуком и тем же прямоугольным форматом изображения.
Раннее телевидение.
Формат традиционного телевизионного экрана восходит к раннему кинематографу. Его ввел человек по имени У.К.Л. Диксон (W.K.L. Dickson), работавший в конце XIX века в лаборатории Томаса Эдисона. Диксон сконструировал кинокамеру, называемую Kinescope (ее разновидность до сих пор применяется для переноса видео на пленку). Диксон использовал специальную пленку с размером кадра 1 х 3/4 дюйма, что дает отношение длины к ширине 4:3. Когда индустрия приняла этот формат в качестве стандарта, кино- и телевизионные изображения соответствовали друг другу независимо от размеров экрана. И так продолжалось довольно долго.
Но в 50-х все переменилось Голливуд почувствовал угрозу со стороны телевидения, вдруг ставшего популярным. Люди, увлекавшиеся рок-н-роллом, перестали ходить в кино, а проводили семейные вечера у телеэкрана. Тогда владельцы студий собрали своих инженеров и сказали: «Сделайте что-нибудь большое
!» — так появились форматы типа Cinerama, Cinemascope и VistaVision. Форматов с красивыми названиями много, но все они шире, чем 4х3. Съемка фильмов (а теперь и видео) в этих форматах создает для операторов более широкие композиционные возможности, и мир в этих фильмах выглядит более естественным.
Решение проблемы формата
HDTV изменит эту ситуацию, и можно будет увидеть фильмы в оригинальном формате 16х9, которые до сих пор могли смотреть только в «сплюснутой» версии.
Преимущества цифровой передачи
Кроме очевидных преимуществ формата, сам способ формирования цифрового изображения высокой четкости также несет в себе существенные преимущества. Цифровой сигнал не ослабляется при передаче на расстояние, как аналоговый сигнал. Поэтому если он принимается вообще, то принимается без искажений. Цифровой сигнал не подвержен помехам, характерным для работы нецифрового оборудования, таким как тени, «туман» или «снег». Передается же цифровой сигнал в компрессированном виде, что намного сужает требуемую полосу пропускания канала. В цифровом телевидении применяется схема компрессии MPEG-2 — та же, что и на DVD.
Любая компрессия — это компромисс. Самое высокое качество у некомпрессированного цифрового видео, но для этого необходимо передавать невероятное количество данных (эквивалентное примерно 27 дискетам в секунду). Такую пропускную способность можно обеспечить только в локальной сети. Чтобы передавать цифровой сигнал по существующим каналам, изображение с разрешением примерно вчетверо выше по сравнению с обычным нецифровым компрессируется в соотношении 55:1. Но это незаметно, так как алгоритм MPEG-2, хотя и не идеален, но достаточно хорош: он «знает», что компрессирует. В этом алгоритме используются особенности восприятия глазом оттенков цветов и движения. В каждом кадре MPEG-2 учитывает ровно столько деталей, чтобы не было заметно никаких искажений. Кроме того, шифратор сравнивает соседние кадры и передает только те участки изображения, которые изменились или переместились. В результате качественно отснятая сцена выглядит естественно.
«Чудо компрессии» позволяет не только передавать в эфир превосходное изображение. Благодаря запасу полосы пропускания, появляется возможность передавать цифровое аудио 5.1, то есть настоящий окутывающий звук (surround sound),
Важнейшим компонентом HDTV служит совсем крошечная деталь... скромный пиксел. В аналоговом телевидении элементы изображения, из которых состоит красная, зеленая и синяя компоненты, представляют собой вертикальные прямоугольники. В HDTV они квадратные, как на компьютерных мониторах, и более, чем в четверо меньше пикселов аналогового ТВ, так что мелкие детали получаются намного четче, что позволяет разглядеть каждую пору на коже кинозвезды.
Стандарты цифрового телевидения
Аналоговое телевидение формата NTSC обеспечивает 720 строк (линий пикселов) по вертикали на 486 строк (колонок пикселов) по горизонтали. HDTV дает гораздо более четкое, резкое изображение с большим цветовым насыщением, так как его разрешение составляет 1920 строк по вертикали на 1080 строк по горизонтали.
В настоящее время существует 18 разных стандартов цифрового телевидения (если в такой «стандартизации» вообще есть смысл). Пять из них определяются как HDTV: 1125-, 1080-, и 1035-строчные с чередованием строк (i) и 720- и 1080-строчные с последовательными строками (p). Однако бытовой телевизор HDTV обязан отображать один из сигналов 720p или 1080i в формате 16:9. Практически все разрабатываемые сегодня телевизоры HDTV воспроизводят оба формата, а телевещательные компании будут транслировать свои передачи в одном из них. У каждого из этих форматов много своих особенностей, и их не следует сравнивать, так как по существу это разные системы. У 1080i более высокое горизонтальное разрешение, зато у 720p нет полукадровых искажений. Эти искажения могут сказываться как на качестве воспроизведения объектов на экране, так и на качестве шифрования сигнала MPEG-2. Чтобы лучше понять разницу, сопоставим все это с обычным телевизором.
Наследие старого телевидения
В общем случае обычное аналоговое изображение на HDTV-телевизоре будет выглядеть лучше. Однако производство телепередач остается нецифровым, поэтому, чтобы вещать их по новой технологии, необходимо выполнить преобразование в соответствии со спецификациями HDTV. Этот процесс называется ап-конверсией. В стандартном телевидении луч пробегает по экрану со скоростью 30 кадров в секунду. Каждый из этих кадров делится на два поля, так что всего отображается 60 полей в секунду. В этих полях чередуются четные и нечетные строки, что дает «чересстрочную» развертку, характерную для современных телевизоров. Но хотя такое чередование кадров создает эффект более плавного движения по сравнению с последовательной разверткой, оно может стать причиной размытого изображения, теней и искажений.
В HDTV-телевизоре эти 60 полей ап-конвертируются в изображение с последовательной разверткой. Это означает, что строки передаются последовательно одна за другой без всякого наложения полей. Именно так отображается информация на мониторе компьютера. При более низком разрешении в 480p такой формат, возможно, уже следует называть форматом не высокой, а «повышенной четкости» изображения. В некоторых цифровых телевизорах возможен другой процесс ап-конверсии, в котором аналоговое изображение преобразуется в 1080 чередующихся строк, или 1080i. При этом используется т.н. метод удвоения строк. Так что когда во время дневных передач вам предлагают посмотреть пример «цифрового» телевидения, то на самом деле это не HDTV, а аналоговое изображение с удвоением строк.
Проблемы формата
К сожалению, до сих пор не существует единого мирового стандарта HDTV. Все вроде бы согласны, что кадр такого изображения должен состоять из примерно тысячи строк, а экран телевизора — быть широким (отношение ширины к высоте не 4:3, как у обычного телевизора, а 16:9, поскольку большинство современных кинофильмов имеет именно такую размерность). В связи с этим американская организация под названием Гильдия режиссеров (Guild оf Directors) ратует за размерность 18:9, однако соотношение
HDTV японцы придумали еще в 1964 году, когда вещательная компания NHK решила, что пора прокладывать путь для телевидения следующего поколения. В основе этого решения лежали неприязнь ко всему иностранному (стандарт телевидения в Японии — NTSC, то есть американский) и эксцентричная задача добиться «мирового превосходства в телевидении». После неудачной попытки самим изобрести телевидение и разработать толковый способ организации вещания в цвете стремление стать зачинателями следующего этапа в развитии телевещания казалось японцам вполне естественным.
В 80-х NHK предложила стандарт HDTV, который, по ее расчетам, должен был ознаменовать начало новой телевизионной эры. Однако европейские компании приняли его в штыки, заявив, что японское предложение о частоте полукадров — шестьдесят в секунду — несовместимо с существующими системами PAL и SECAM, основанными на развертке с частотой пятьдесят полукадров в секунду.
Вместо японского стандарта европейцы предложили свою систему HD-MAC, основанную на стандарте для спутникового телевидения (МАС).
Американская же федеральная комиссия по связи (FCC) утвердила стандарт, согласно которому картинка ТВЧ формируется из 1080 горизонтальных строк при развертке шестьдесят полукадров в секунду и формате 16:9. Европейцы же предлагали формировать изображение из 1225 строк.
Угол зрения
Для правильного восприятия фильма (то есть для обеспечения эффекта присутствия) особенно важен угол обзора.
Иными словами, если вы сидите на правильном расстоянии от телевизора (при размерности экрана 16:9 это расстояние равно утроенной высоте экрана), угол охвата зрением должен составлять тридцать градусов. Между тем мы обычно смотрим телевизор 4:3, находясь на расстоянии от восьми до десяти высот экрана, и угол зрения при этом составляет от силы десять градусов. В пределах этого сектора мы очень хорошо видим все детали изображения, а движение воспринимаем плохо. За пределами сектора наблюдается обратная картина: реакция на движение заметно улучшается, зато способность различать детали падает. Без движений, отмечаемых периферийным зрением, сцены выглядят искусственными.
Следовательно, для создания максимального эффекта присутствия необходим такой угол охвата зрением, чтобы различать все детали в середине и отмечать движение по краям экрана периферийным зрением. Этот угол составляет те самые тридцать градусов, о которых говорилось выше. Так что дальнейшее увеличение ширины экрана нецелесообразно. Вот почему киношники отказались снимать панорамные фильмы (размерность кадра порядка 25:9).
На практике все гораздо сложнее: в домашних условиях, когда мы сидим на расстоянии трех метров от телевизора, ширина его экрана, необходимая для обеспечения угла охвата в тридцать градусов, должна быть около 2,8 метра. Ни один телевизор трехметрового экрана не имеет — создать картинку такого размаха способен лишь видеопроектор. И на ней будут заметны все огрехи обычного телевизионного сигнала. Эту проблему и позволяет решить HDTV.
Проблема передачи сигнала
Но мало отснять HDTV-программу — нужно еще передать ее потребителю. Одно из условий, поставленных американской FCC, состояло в том, чтобы обладатели обычных телевизоров могли смотреть программы HDTV. Для выполнения этого требования HDTV-сигнал нужно втиснуть в полосу частот шириной 6 мГц (стандартная полоса для одного телеканала). А это на первых порах оказалось очень сложно, поскольку HDTV-сигнал содержит больше информации, чем обычный телевизионный. Настолько больше, что решение так и не было найдено вплоть до появления сжатия видеоданных.
Проблема просмотра
Для того, чтобы воспользоваться всеми преимуществами HDTV, необходимо сидеть от экрана на расстоянии, равном его высоте, умноженной на три. А это недоступно большинству владельцев даже самых последних моделей телевизоров. Предел для диагонали экрана телевизора 16:9 составляет 36 дюймов. Высота такого экрана примерно 40 см. Значит, для получения максимального эффекта присутствия необходимо сидеть приблизительно в полутора метрах от экрана. Конечно, есть плазменные и проекционные телевизоры с экраном более метра в диагонали, но они стоят очень дорого. Так что лишь немногие смогут насладиться HDTV в полном объеме, даже если передачи появятся в эфире. Еще хуже обстоит дело с домашним HDTV-кинотеатром. Видеомагнитофонов, способных записывать сигнал HDTV, нет и не предвидится. Однако на выставке CES 2000, проходившей в Лас-Вегасе в начале этого года, были представлены прототипы DVD для HDTV и устройство записи цифрового телевизионного сигнала на хард-диск, в принципе совместимое с HDTV. Более того, FCC постановила прекратить с 2006 года трансляции в США передач в NTSC и заменить их на HDTV.
У Европы в общем и у России в частности, где никто и не заикается о трансляциях HDTV-программ, таких проблем не существует. Вам не нужен HDTV-аппарат, поскольку нет программ, которые по нему можно было бы смотреть.
Компрессия сигнала в
HDTV
.
Как уже отмечалось ранее в HDTV в качестве основного стандарта кодирования используется MPEG-2. Рассмотрим его подробнее.
Немного истории
Стандарт MPEG-2 был специально разработан для кодирования ТВ сигналов вещательного телевидения. Он позволяет получить полную четкость декодированного ТВ изображения, соответствующую Рекомендации 601 МККР. (При скорости передачи видеоданных 9 Мбит/с качество ТВ изображения соответствует студийному).
С принятием стандарта MPEG-2 работы по компрессии видеоданных перешли в область практической реализации. На данный момент можно назвать, по крайней мере, десяток фирм, которые выпускают для продажи кодеры и декодеры по стандарту MPEG-2. Наиболее известны из них Philips, Panasonic, Page Micro Technology, CLJ Communi-cation, Wegener Communications, Scientific-Atlanta, NTL, Segem Group и др.
В октябре 1995 г. через спутник Pan Am Sat начато 20-канальноеТВ вещание по стандарту MPEG-2, осуществляемое на территории Скандинавии, Бельгии, Нидерландов, Люксембурга, Ближнего Востока и Африки. В этой сети будет использовано более миллиона декодеров MPEG-2.
На стандарт MPEG-2 ориентированы и создаваемая сейчас 100-канальная система непосредственного телевизионного вещания (НТВ) Канады, и 150-канальная система НТВ оператора спутника "Эхостар", а также 10-канальная система НТВ Австралии, как и системы НТВ других стран.
В Российской Федерации телекомпания ВГТРК ввела в эксплуатацию четырехканальную систему НТВ по стандарту MPEG-2. Другие российские телекомпании также планируют начать НТВ по этому стандарту. Например РАО "Газпром" создает систему цифрового вещания в России по стандарту MPEG-2 c использованием спутников "Горизонт" и "Ямал". Здесь по одному стандартному каналу будет передаваться от трех до восьми ТВ программ. К созданию системы привлечены многие известные зарубежные фирмы. Вот некоторые из них: NEC, Vistek, Fuba, Scientific Atlanta и др.
Стандарт кодирования MPEG-2
Даже в рамках одного стандарта, как показывает практика, передача сигналов телевидения - и цифровое здесь не исключение, ведется на разных уровнях качества. То же самое можно сказать и о телевизионных приемниках. Жесткие, а главное узкие допусковые интервалы, не жизненны, поскольку лишают систему гибкости, приспосабливаемости к разным условиям функционирования с ориентацией на различные слои потребителей. При этом любая перспективная система должна иметь резервы для перехода на более высокие уровни качества. Эти и многие другие соображения и требования легли в основу очень важного документ: ISO/IEC 13818-2.
В этом документе определено, что стандарт MPEG-2 - это целое семейство взаимносогласованных совместимых цифровых стандартов информационного сжатия телевизионных сигналов с различной степенью сложности используемых алгоритмов.
Градации качества ТВ изображения для вещательных систем в стандарте ISO/IEC 13818-2 устанавливаются введением четырех уровней для формата разложения строк ТВ изображения и пяти профилей для форматов кодирования сигналов яркости и цветности. Общая идеология построения стандарта поясняется таблицей.
ПРОФИЛИ, УРОВНИ, СОГЛАСОВАННЫЕ ТОЧКИ
|
|||||
Высокий
1920 отсчетов 1152 строки (активных) |
80 | 100 | |||
Высокий
уровень 1440 отсчетов 1152 строки (активных) |
60 | 60 | 80 | ||
Основной
уровень 720 отсчетов 576 строки (активных) |
15 | 15 | 15 | 20 | |
Низкий
уровень 352 отсчета 288 строки (активных) |
4 | 4 | |||
Простой профиль без B кадров формат 4:2:2 | Основной профиль без B кадров формат 4:2:0 | Профиль с масштабируемым отношением с/ш B кадры формат 4:2:0 | Специальный масштабируемый профиль B кадры формат 4:2:0 | Высший профиль B кадры формат 4:2:0 или 4:2:2 |
Примечание:
не отмеченные профили и уровни не определены как согласованные точки (нестандартизованы). Все цифровые параметры даны в Мб/с.
Расположенный в нижней части таблицы уровень называется "низким уровнем" и ему соответствует новый класс качества ТВ изображения, которое вводится в стандарте MPEG-2 - телевидение ограниченной четкости. В этом случае в кадре ТВ изображения содержится 288 активных строк (в два раза меньше, чем в телевидении обычной четкости) и каждая строка дискретизируется на 352 отсчета.
Кодирование сигналов телевидения обычной четкости выполняетсяв соответствии с основным уровнем, т.е. с форматом разложения на 576 активных строк в кадре, которые кодируются с использованием 720 отсчетов на строку.
Высокий-1440 и высокий-1920 предусматриваются для кодирования сигналов телевидения высокой четкости (ТВЧ). В обоих "высоких" уровнях кадр ТВ изображения содержит 1152 активные строки (вдвое больше, чем в телевидении обычной четкости). Эти строки дискретизируются соответственно на 1440 или 1920 отсчетов.
В стандарте используются 5 профилей, которым соответствует 5 наборов функциональных операций по обработке (компрессии) видеоданных. Некоторые из теоретически возможных наборов функциональных операций по компрессии видеоданных на этапе создания стандарта не были включены в таблицу. Они могут быть введены и стандартизованы в дальнейшем, если будет доказана их необходимость или полезность.
Профиль, в котором используется наименьшее число функциональных операций по компрессии видеоданных, назван простым профилем. В нем при компрессии видеоданных используется компенсация движения изображения и гибридное дискретно-косинусное преобразование.
Следующий профиль назван основным профилем. Он содержит все функциональные операции простого профиля и одну новую: предсказание по двум направлениям. Эта новая операция, естественно, повышает качество ТВ изображения.
Следующий за основным назван профилем с масштабируемым отношением сигнал/шум. Термин "масштабирование", в данном случае, означает возможность обмена одних показателей системы на другие. Этот профиль к функциональным операциям основного профиля добавляет новую - масштабирование. Основная идея - повышение устойчивости цифрового телевидения и сохранение работоспособности при неблагоприятных условиях приема. Операция масштабирования позволяет в рассматриваемом случае повысить устойчивость системы за счет некоторого снижения требований к допустимому уровню отношения сигнал/шум в воспроизводимом ТВ изображении.
При масштабировании поток видеоданных разделяют на две части. Одна из них несет наиболее значимую часть информации - ее называют основным сигналом. Вторую часть, несущую менее значимую информацию, называют дополнительным сигналом. Декодирование только одного основного сигнала позволяет получить ТВ изображение с пониженным отношением сигнал/шум. Одновременное декодирование основного и дополнительного сигналов повышает отношение сигнал/шум до исходного значения.
И все же, что можно извлечь из идеи деления потока данных на более и менее значимые части? А все дело в защите системы от ошибок. Помехоустойчивое кодирование требует введения дополнительных бит, что повышает общий поток информации. Задача упрощается, когда более мощная защита применяется только к части информации и тем самым соблюдается разумный баланс между уровнем потока видеоданных и степенью их защиты. При неблагоприятных условиях приема (например, при низкой напряженности радиополя, при приеме на комнатную антенну и т.п.) сохраняется возможность устойчивого декодирования более защищенного основного сигнала, а неустойчиво воспринимаемый дополнительный сигнал просто
Не так уж редки ситуации, когда сигналы приходится передавать по каналам с ограниченной пропускной способностью. Деление потока видеоданных на два, позволяет использовать и "плохие" каналы, ограничивая передачу основным сигналом.
Следующий, четвертый профиль назван специально масштабируемым профилем. Здесь, естественно, сохранены все операции предшествующего профиля и добавлена новая - разделение потока видеоданных по критерию четкости ТВ изображения. Этот профиль обеспечивает переходы между нынедействующими системами и телевидением высокой четкости. С этой целью видеоданные сигнала ТВЧ разделяются на три потока. Первый - это основной (значимый) поток видеоданных, например, по стандарту разложения на 625 строк. Второй поток несет дополнительную информацию об изображении с числом строк до 1250. Одновременное декодирование первого и второго потоков видеоданных позволяет получить телевизионное изображение высокой четкости, но с пониженным отношением сигнал/шум. В третьем потоке сосредоточена менее значимая информация, его декодирование позволяет повысить отношение сигнал/шум в видеоканале до уровня, принятого в ТВЧ. Обычно первый поток видеоданных, представляющих сигнал 625-строчного ТВ, - это 6 Мбит/с, дополняющий его до ТВЧ - 6 Мбит/с, а повышающий отношение сигнал/шум до уровня, когда шумы визуально незаметны - 12 Мбит/с.
В рассмотренных четырех профилях при кодировании сигналов яркости и цветности используется формат представления видеоданных 4:2:0, в котором число отсчетов сигналов цветности по сравнению с сигналом яркости уменьшается в два раза не только по горизонтальным, но и по вертикальным направлениям. Следующий, пятый профиль называется высшим профилем, и он включает в себя все функциональные операции специального профиля 4:2:2, при котором число отсчетов сигналов цветности в вертикальных направлениях остается тем же, что и у сигнала яркости (см. рис.).
Рис. 1 Форматы представления видеоданных
Приведенные в таблице пять профилей и четыре уровня образуют двадцать возможных комбинаций видеосигнала, из которых, вероятнее всего, только одиннадцать будут полезными или необходимыми. Для этих комбинаций (согласованные точки) в таблице указаны максимальные значения скорости передачи видеоданных. Комбинации, которые сегодня не вызывают интереса, в стандарте MPEG-2, пока, не нормированы и в таблице отмечены крестами.
Для всех стандартизованных точек указаны максимальные потоки видеоданных, которые позволяют получить ТВ изображение, свободное от каких-либо дефектов. В иных случаях они могут проявиться в процессах кодирования/декодирования видеосигнала. Используемые в конкретных кодеках потоки видеоданных могут быть меньше (в несколько раз) указанных значений. Выбор уровня компрессии и, в конечном итоге, уровня потока зависит от допустимой степени искажений ТВ изображения.
Таким образом, стандарт MPEG-2 позволяет гибко менять скорость передачи видеоданных в очень широких пределах. Надо заметить, что системы кодирования стандарта MPEG-2 могут работать как с чересстрочной, так и с прогрессивной развертками, при частоте полей 50 или 60 Гц и т. д. Для каждой стандартизованной точки таблице оговорено число отсчетов сигнала яркости на активной части строки. Рассмотренные комбинации параметров информационного кодирования пригодны для работы с различными цифровыми трактами и накопителями (записывающими устройствами).
Стандарт MPEG-2 принципиально нацелен в будущее, все богатство упомянутых выше комбинаций станет работать, хотя и скоро, но не сейчас. Так, промышленность готова и будет выпускать в этом году ТВ приемники только одной системы кодирования: "Основной уровень - Основной профиль" с чересстрочным разложением изображения на 625 строк. Эта система принята для первого поколения цифровых телевизоров для непосредственного ТВ приема со спутников, работающих в диапазоне 11/12 ГГц, и кабельной сети распределения.
Сказанное не означает, что массовый выпуск бытовых телевизоров для иных профилей и уровней, пока и до лучших времен, закрыт. Любая вещательная организация вправе использовать систему нового уровня кодирования. Просто следует публично заявить о намерениях и начать "переговорный процесс" с возможными изготовителями соответствующих телевизоров. Следует добавить, что при реализации системы по конкретному уровню/профилю необходимо пронормировать и поток видеоданных, который не должен превышать максимальные значения скоростей, указанные в стандартизованных точках (см. табл.). Если в системе планируется использовать несколько скоростей передачи видеоданных, следует указать максимальную из них.
Компрессия видеоданных
Телевизионный сигнал, как известно, избыточен. Различают статистическую избыточность, избыточность по восприятию, структурную и спектральную избыточность. По теории вероятностей избыточность является следствием определенных корреляционных связей. Корреляция означает, что некоторый элемент изображения более или менее существенно зависит от соседей в пространстве и во времени. Под статистической избыточностью понимают корреляционные связи между соседними (по вертикали и горизонтали) отсчетами ТВ сигнала. Сразу же надо подчеркнуть, что снижение избыточности в этом случае до определенных пределов обратимо, т. е. без потерь информации. Примером такого "беспроигрышного" кодирования служит предсказание на основе дискретно-косинусного преобразования. Можно назвать и другие разностные методы.
Избыточность по восприятию связана с особенностями зрения человека. Например, цветовое разрешение нашего зрения ниже яркостного. Эта особенность учтена во всех стандартных аналоговых системах цветового кодирования. В NTSC, PAL, SECAM цветовое разрешение существенно понижено по отношению к яркостному. То же самое зафиксировано в цифровом стандарте 4:2:2, где, по определению, две цветоразностные компоненты представлены таким же по объему информационным массивом, что и один яркостный сигнал.
Учитывая эту особенность нашего зрения по восприятию мелких деталей цветного изображения, можно в несколько раз сократить полосу частот при передаче и кодировании сигналов цветности.
Структурная избыточность - итог особенностей стандарта разложения или, по иному, преобразования изображения в ТВ сигнал. В нем, например, периодически передаются неизменные по форме элементы сигнала: гасящие импульсы строк и полей. В цифровом ТВ сигнале нет необходимости передавать эти импульсы по каналу связи, т.к. они могут быть восстановлены в декодере по опорным сигналам синхронизации. Устранение из состава цифрового ТВ сигнала гасящих импульсов строк и полей снижает скорость передачи видеоданных примерно на 23%. Естественно, эта особенность сигнала учтена в стандарте MPEG-2.
Спектральная избыточность проявляется как результат излишне высокой частоты дискретизации. В частности, принятая ортогональная структура дискретизации ТВ изображения в общем случае не является оптимальной в частотном пространстве. Используя интерполяцию и передискретизацию определенным образом выбранных групп отсчетов ТВ сигнала, можно, в принципе, видоизменить спектральный состав и снизить частоту дискретизации. Такая обработка обычно необратима и, как правило, ведет к некоторому снижению качества восстановленного ТВ изображения. В стандарте MPEG-2 этот вид избыточности не устраняется.
Итак, в MPEG-2 применены известные, давно апробированные методы сокращения избыточности. Вместе с ними использованы и новые подходы. В особенности это относится к совокупности согласованных алгоритмов сокращения статистической избыточности. Здесь особо эффективными оказались два метода: кодирование ТВ отсчетов с предсказанием и дискретно-косинусное преобразование
Кодирование с предсказанием реализуется с помощью дифференциальной импульсно-кодовой модуляции (часто используется аббревиатура ДИКМ). При кодировании с предсказанием вычисляется разность между истинным и предсказанным значением отсчета. Затем разность квантуется по уровню. От точности предсказания зависит среднее число бит, необходимых для передачи разностной информации. Предсказание может быть экстраполяционным. В этом случае (его часто называют предсказанием вперед) по предшествующим значениям отсчетов ТВ сигнала оцениваются последующие отсчеты. Интерполяционное (двунаправленное) предсказание означает, что оценка среднего по положению отсчета ТВ сигнала выполняется по известным значениям предшествующих и последующих отсчетов. Такое предсказание наиболее точно оценивает текущие отсчеты. Однако за точность приходится расплачиваться возросшим объемом вычислений и соответственно памяти, необходимой при реализации. При этом эффект не окупает затраты.
Как уже отмечалось, предсказание выполняется по соседним с предсказываемым отсчетам, причем под соседними надо понимать отсчеты, расположенные "до и за" рассматриваемым. К ним надо добавить соседей в предшествующей и последующей строках, полях и кадрах. Таким образом, возможно построчное, межстрочное, внутриполевое, внутрикадровое, межполевое и межкадровое предсказание. Это полный набор возможных направлений корреляций. Но уже подчеркивалось, что предсказание вдоль отдельной строки по предшествующему и последующему элементу неэффективно. По этому же критерию можно отсеять и некоторые другие возможные направления.
При простейшем внутриполевом предсказании вперед предшествующий отсчет ТВ строки принимается как ожидаемый уровень последующего отсчета. Фактически это означает вычеркивание постоянной составляющей или, что тоже самое, выделение разностной информации. Такой метод предсказания особенно эффективен, когда передаются крупные, не содержащих мелких деталей, фрагменты изображения, где яркость постоянна или изменяется медленно.
Другой способ - межкадровое предсказание вперед. В этом случае текущий отсчет оценивается по отсчету с теми же координатами, но предыдущего кадра. Это очень эффективный метод предсказания для неподвижных изображений. Ситуация усложняется, когда изображение содержит движущиеся объекты или изменятся в целом. В этом случае отсчеты, принадлежащие однотипным элементам изображения от кадра к кадру будут смещаться. Возникает разностная информация, даже если в остальном никаких изменений не происходит. Это можно ослабить, если ввести компенсацию движения. Для этого необходимо определить векторы перемещения движущихся частей изображения при последовательном переходе от кадра к кадру. Векторы движения позволяют определить положение кодируемого отсчета в новом кадре (скомпенсировать его перемещение) и, таким образом, сохранить высокую точность предсказания.
Кодируемые кадры
Базовым объектом кодирования в стандарте MPEG-2 является кадр ТВ изображения. Это не случайно и обеспечивает преемственность со стандартом JPEG, принципиально ограничивающимся внутрикадровым кодированием. При этом очевидно, что для ТВ сигналов, в которых смешаны различные сюжеты с разными типами движений "от ничего до много" простое предсказание, в принципе, не обеспечит высокую эффективность. По этой причине в стандарте используются три вида предсказаний: внутрикадровое и межкадровое предсказание вперед с компенсацией движения, межкадровое двунаправленное предсказание также с компенсацией движения.
Так называемые I кадры обрабатываются только с применением внутрикадрового предсказания. Обработка ведется на основе алгоритмов, подобных используемым в стандарте JPEG. Это первый этап, где сжатие видеоданных относительно невелико, но зато при восстановлении ТВ изображения оно менее всего деградирует и зависит от ошибок кодирования и передачи видеоданных по каналу связи. I кадры служат опорными при межкадровом предсказании Р и В кадров. Кодирование Р кадров выполняется с использованием алгоритмов компенсации движения и предсказания вперед по предшествующим I или Р кадрам. В Р кадрах, если сравнивать их с I кадрами, в три раза выше достижимая степень сжатия видеоданных.
Обработка видеоданных в Р кадре выполняется по макроблокам. Это квадратные матрицы 16 х 16 (отсчетов х строк). Такой макроблок обрабатывается с использованием алгоритмов компенсации движения и предсказания вперед, пока в блоке не появится новый объект. С этого момента процесс кодирования переключается на алгоритмы, используемые в I кадрах, т. е. на внутрикадровое предсказание. Р кадры являются опорными для последующих Р или В кадров. Отметим, что необходима высокая точность восстановления исходного изображения при декодировании опорных Р кадров. Дело в том, что ошибки опорного кадра распределяются по всем кадрам, связанным с опорным.
Алгоритмы кодирования В кадров зависят от характера ТВ изображения. Предусмотрено четыре способа кодирования. В одном применяется компенсация движения и предсказание вперед по ближайшим предшествующим опорным I или Р кадрам, в другом - компенсация движения и обратное предсказание по ближайшим последующим I или Р кадрам. Обратное предсказание используется в тех случаях, когда в кодируемом В кадре появляются новые объекты изображения. Третий алгоритм - компенсация движения и двунаправленное предсказание, при котором опорными являются предшествующий или последующий I или Р кадры. И, наконец, это внутрикадровое предсказанием без компенсации движения. Такое кодирование нужно при резкой смене передаваемых сюжетов, а также при больших скоростях перемещения объектов ТВ изображения. С В кадрами связано наиболее глубокое сжатие видеоданных. Поскольку высокая степень сжатия снижает точность восстановления исходного ТВ изображения, В кадры не используются в качестве опорных. Ошибки при их декодировании не распределяются по другим кадрам.
Очевидно, что точность кодирования должна быть максимальной для I кадров, ниже для Р кадров и минимальной для В кадров.
Типичным является следующий порядок кодирования I, Р, В кадров: В кодере вырабатываются следующие группы, состоящие из 12 чередующихся кадров: I0, B1, B2, P3, B4, B5, P6, B7, B8, P9, B10, B11, I12, B13, B14, P15 и т. д., в которых I кадры следуют с интервалом: (1/25 Гц) х 12= 0,48 с.
При передаче по каналу связи порядок следования I, Р и В кадров меняется. В декодер в начале поступают опорные I и Р кадры, без которых нельзя начать декодирование. Типичным является следующий порядок передачи I, P, B кадров: I0, P3, B1, B2, P6, B4, B5, P9, B7, B8, I12, B10, B11 - P15, B13 и т. д.
Компенсация движения
В стандарте MPEG-2 используется метод компенсации движения, основанный на макроблоках. Два смежных кадра, содержащих только активные строки сигнала яркости (576 активных строк), разбиваются на макроблоки и более крупные зоны поиска. Размеры макроблока должны быть согласованы со структурой дискретизации кадра ТВ изображения. В стандарте MPEG-2 блок -это квадратная матрица отсчетов размером 16 строк по вертикали и 16 столбцов (отсчетов) по горизонтали. Отметим, что при таком формате блока, ТВ кадр разбивается на целое число зон. По вертикали (576 активных строк/16) - это 36 зон, по горизонтали (704 активных отсчета/16) - 44 зоны.
Зона поиска должна быть достаточно большой, чтобы быстро движущийся макроблок изображения первого кадра не вышел из зоны поиска второго кадра. Размеры зоны поиска ограничиваются объемом вычислений, которые необходимо выполнить в реальном масштабе времени. Эти размеры также должны быть согласованы с принятой структурой дискретизации ТВ кадра. Обычно, они в 4 раза больше размеров отдельного макроблока. Иными словами, размеры зоны поиска - это 64 х 64. Таким образом, в ТВ кадре создается 576/64 = 9 зон поиска по вертикали и 704/64 = 11 зон по горизонтали.
К примеру, надо определить координаты движения при предсказании вперед, Для этого берется макроблок отсчетов первого кадра и ищется его новое положение в зоне поиска второго кадра, вычисляются межкадровые разности отсчетов. Положение макроблока, при котором суммарное значение модулей межкадровых разностей макроблока получается наименьшим, принимается за его реальное перемещение, после чего координаты вектора движения рассчитываются как смещение макроблока по вертикали и горизонтали относительно его начального положения.
Дискретно-косинусное преобразование
Это преобразование выполняется поблочно, для чего ТВ изображение разбивается на блоки. Каждый блок - квадратная матрица. Ее размеры: 8 отсчетов (строк) по вертикали и 8 отсчетов по горизонтали. Таким образом, матрица содержит 8 х 8 = 64 отсчета ТВ сигнала. Она называется сигнальной матрицей. При этом в ТВ кадре создается : 576/8 = 72 зоны по вертикали и 704/8 = 88 зон по горизонтали, что в общей сложности дает: 72 х 88 = 6336 блоков, подлежащих дискретно-косинусному преобразованию (ДКП) в реальном масштабе времени. В результате ДКП исходная сигнальная матрица 8 х 8 = 64 ТВ отсчетов преобразуется в матрицу частотных коэффициентов ДКП такого же размера 8 х 8 = 64.
Поскольку положение ТВ отсчетов сигнальной матрицы определяется двумя координатами, то частотные коэффициенты (С) матрицы ДКП являются функциями этих двух переменных и обозначаются двузначными номерами. Отметим , что матрица частотных коэффициентов ДКП уже не имеет прямой геометрической связи с положением отсчетов ТВ сигнала на ТВ растре, а представляет собой только удобную форму математической записи, при которой частотные коэффициенты ДКП можно трактовать как двумерный спектр ТВ изображения в горизонтальном и вертикальном направлениях ТВ кадра.
Спектр ДКП имеет очень важную, если ее оценивать с позиций компрессии видеоданных, особенность: основная энергия частотных составляющих этого спектра концентрируется в небольшой области около нулевых частот. Амплитуда высокочастотных составляющих или мала, или просто равна нулю. На этом и строится вся игра. Передаче подлежат только те частотные коэффициенты матрицы ДКП, величины которых превышают принятые пороговые значения. Коэффициенты ниже порогового значения считаются нулевыми.
Введение пороговой (нелинейной) обработки, строго говоря, ведет к потерям информации и, соответственно, к снижению качества восстановленного в декодере ТВ изображения. Однако, при разумном выборе величины порога это ухудшение окажется практически незаметным или же допустимым.
Следует отметить, что при кодировании динамический интервал коэффициентов ДКП возрастает в 8 раз. Так, при уровневом кодировании видеосигнала 8 бит его динамический интервал 0 - 255 дискретных уровней. При этом динамический интервал коэффициентов спектра ДКП составит от 0 до 2040 и от -1020 до +1020 дискретных уровней для коэффициентов постоянной и переменных составляющих ДКП, соответственно.
Кодирование коэффициентов ДКП в таком широком динамическом интервале потребует в последующих узлах кодера перехода от 8 битового к 11-битовому коду. Чтобы избежать этого, после ДКП производится масштабирование (сжатие) динамического интервала сигналов коэффициентов ДКП за счет увеличения шага квантования в 8 раз. Эта операция сводится к делению полученных в матрице значений коэффициентов ДКП на 8. Результат деления затем округляется до ближайших целых значений уровней новой шкалы квантования. Так, например, если исходное значение коэффициента ДКП было 22, то после деления на 8 и округления до ближайшего целого значения (22/8 = 2.75) новое значение будет 3. При этом новый динамический интервал составит от -255 до +255 дискретных уровней.
После выравнивания динамического диапазона коэффициенты ДКП подвергаются взвешенному квантованию для сокращения избыточности в высокочастотной области. Надо заметить, что чувствительность глаз здесь наименьшая. Точность кодирования зависит от шага квантования. Он выбирается разным для разных коэффициентов матрицы ДКП, его масштаб в процессе кодирования может меняться от 1 до 31.
Коэффициент, соответствующий постоянной составляющей ТВ сигнала, кодируется с использованием 10 бит, потому что при более грубом квантовании соседние блоки начинают отличаться по яркости. На экране они проявляются в виде шахматной структуры.
Последний алгоритм сокращения избыточности связан с кодами переменной длительности. При этом те коэффициенты ДКП, которые повторяются наиболее часто, кодируются короткими кодовыми комбинациями, а редкие значения коэффициентов - более длинными. Отметим, что в стандартах MPEG-2 и MPEG-1 применяются схожие алгоритмы сжатия видеоданных. Поэтому более подробные сведения по этому вопросу можно найти в статье "Стандарт MPEG", опубликованной в 625, N6, 1996 г.
Профессиональный профиль стандарта MPEG-2
С позиций видеопроизводства самым серьезным недостатком рассмотренных выше алгоритмов кодирования является отсутствие простых способов монтажа ТВ программ из типовых групп I, P и В кадров. Монтаж новой ТВ программы может выполняться только законченными группами из I, Р и В кадров других ТВ программ. Поэтому точность монтажа для типовых кодеров MPEG-2 составляет 12 или 15 ТВ кадров, т. е. 0,48 или 0,6 с. Такая временная точность стыковки сюжетов разных ТВ программ считается недостаточной. Напомню, что в аналоговом телевидении точность монтажа равна одному кадру (или по времени 40 мс). Для устранения этой неприятной ситуации было предложено ввести в стандарт MPEG-2 новый профиль, который был назван профессиональным или студийным (монтажным) профилем. В этом профиле используются только I кадры. По сути речь идет о внутрикадровой компрессии, близкой к JPEG. В итоге достигается точность монтажа ТВ программ в один кадр. При этом эффективность кодирования заметно снижена, а скорость передачи видеоданных I кадров возросла до 50 Мбит/с.
Зависимость качества ТВ изображений от скорости передачи видеоданных для основного профиля (кривые 1 и 2) и разных вариантов профессионального профиля (кривые 3, 4 и 5) при кодировании по стандарту MPEG-2 показаны на рис.2. При использовании низкого уровня (288 активных строк в кадре) и основного профиля (I, Р и В кадры) лучшее качество ТВ изображения достигается при скорости передачи видеоданных менее 3,5 Мбит/с - это зона I, кривая 1 на рис. 2.
Для основного уровня (576 активных строк в кадре) и основного профиля (I, Р и В кадры) - наилучшее качество ТВ изображения получается при скорости передачи видеоданных в интервале от 3,5 до 15 Мбит/с - зона, кривая 2, рис. 2.
Рис.2 Качество ТВ изображений при кодировании по стандарту MPEG-2: I,P,B кадры, основной профиль, низкий уровень -1 и высокий - 2, професиональный профиль и низкий уровень -3; I,B кадры, профессиональный (4:2:2) профиль и основной уровень - 4; только I кадры, профессиональный (4:2:2) профиль и основной уровень - 5. Зоны высокого качества ТВ изображения: основной профиль, низкий уровень - I и высокий II; профессиональный (4:2:2) профиль и сновной уровень III
Изменение качества ТВ изображения для профессионального профиля в зависимости от скорости передачи видеоданных характеризуются кривой 5 (используются только I кадры), кривой 4 (I и В кадры) и кривой 3 (I, Р и В кадры).
Отметим, что параметры профессионального профиля окончательно еще не выбраны, ведутся работы по их оптимизации и стандартизации.
Список литературы:
1. Дин Мермелл «Секреты HDTV»
2. Вячеслав Саввов «Телевидение высокой четкости»
3. Константин Гласман «Методы передачи данных в цифровом телевидении»
4. Лев Севальнев «Международный стандарт кодирования с информационным сжатием MPEG-2»