Федеральное агентство по образованию Дальневосточный государственный технический университет (ДВПИ им. В.В. Куйбышева)
...
235 downloads
164 Views
601KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Федеральное агентство по образованию Дальневосточный государственный технический университет (ДВПИ им. В.В. Куйбышева)
Цифровое телевидение Часть I Методическая разработка для самостоятельной работы студентов очной и заочной форм обучения по специальности 210405 «Радиосвязь, радиовещание и телевидение»
Владивосток 2005
Одобрено научно-методическим советом университета УДК 621. 375 Ц75 Цифровое
телевидение:
метод.
разработка/сост.
Ю.В.
Беляев,
Ю.И. Галочкин. Ч.1 - Владивосток: Изд-во ДВГТУ, 2005. – 91 с.
Приведены основные теоретические сведения о передаче и приеме цифрового телевизионного сигнала,
схемах передающих и приемных
устройств, кодировании видеоинформации, а также сведения о модуляциях, используемых в цифровом телевизионном вещании. Многочисленные примеры практических схем современных ТВ-приемников познакомят студентов с решениями цифровой телевизионной схемотехники. Методическая
разработка
предназначена
для
студентов
радиотехнических специальностей вузов.
Печатается с оригинал-макета, подготовленного авторами.
Ю.В. Беляев, Ю.И. Галочкин, 2005 ДВГТУ, изд-во ДВГТУ, 2005
2
1. ЦИФРОВОЕ ТЕЛЕВИЗИОННОЕ ВЕЩАНИЕ Цифровая телевизионная передача включает передачу движущегося изображения и стереофонического звука. Точно так же обстоит дело и с цифровыми видеосигналами. Используются достаточно сложные способы, обеспечивающие доступность соответствующих полос видеосигналов. В Европе для цифрового телевизионного вещания приняты спецификации сжатия MPEG-2 (Motion picture expert group —
группа экспертов по
движущимся изображениям ). Стандарт MPEG-2 устанавливает 4 уровня (Levels) разрешения кадра (LL - низкий уровень с разрешением 352 х 288, ML - основной уровень - 720 х 576, HL-1440 - высокий уровень - 1440 х 1152 и HL-1920 - высокий уровень - 1920 х 1152) и 5
базовых профилей (Profiles)
кодирования сигналов яркости и
цветности (SP - простой, МР - основной, 2 масштабируемых профиля и HP высокий). По
сравнению
с
традиционной
аналоговой
системой
цифровое
телевизионное вещание имеет следующие преимущества: • очень высокое качество изображения ; • большее число программ; • пониженные требования к мощности передаваемого сигнала; • пониженные требования по отношению сигнала к шуму; • отсутствие повторных изображений. Пониженные требования к мощности передаваемого сигнала означают меньшее взаимное влияние соседних каналов. 1.1. Преобразование телевизионного изображения в цифровую форму Преобразование в цифровую форму содержит как элемент сканирование
3
изображения или кадра строка за строкой и выборку значений содержимого строки. Для сохранения качества изображения число выбранных значений в строке должно равняться числу пикселов; каждое выбранное значение (отсчет) представляет один пиксел. Общее число пикселов в телевизионном изображении представляет один кадр. Число пикселов в телевизионном изображении определяется числом строк в изображении и форматом изображения. Система SECAM использует 625 строк, 576 из которых являются «активными» в том смысле, что их можно использовать для передачи видеоинформации . Формат изображения выбирается равным 5:4,
это соотношение наиболее
приемлемо для операции декодирования видеосигнала , которая включает организацию элементов изображения в блоки и микроблоки.
Рис.1.1. Дискретизацияизображения Разрешающие способности по вертикали и по горизонтали должны быть одинаковыми; число пикселов в строке можно вычислить следующим образом: 576 ⋅ 5 4 = 720. Таким образом, каждая строка будет представлена 720 отсчетами, причем каждый отсчет будет представлять один пиксел: отсчет 1 - пиксел 1, отсчет 2 пиксел 2 и т. д. (рис. 1.1).
4
Процесс повторяется для второй, третьей и т. д. строки до конца кадра, а затем снова для следующего кадра и т. д. Чтобы отсчеты осуществлялись точно в одних и тех же точках строки в пределах каждого кадра, частота выборки должна быть синхронна с частотой строк. Поэтому частота выборки должна быть в точности кратна частоте строк. Если каждый отсчет или группа отсчетов идентифицируется как пиксел или группа пикселов, то отсчеты можно реструктурировать , перегруппиро вывать или манипулировать ими по своему усмотрению, а потом обрабатывать и вновь собирать в исходном порядке. Полный период одной строки полного видеосигнала составляет 64 мкс. Из них 12 мкс используются для импульса синхронизации , его передней и задней площадок; для передачи видеоинформации остаются 52 мкс. Для 720 пикселов в строке частота выборки составляет:
fв =
число пикселов в строке 720 = = 13,8 МГц. время передачи видеоинформации 52
Однако, поскольку частота выборки должна быть целым кратным частоты строк , Международный
консультативный
комитет
по радиосвязи
(МККР) рекомендует частоту выборки 13,5 МГц (864-строчная частота). Частота выборки должна быть не менее чем вдвое больше максимальной частоты в спектре аналогового входного сигнала во избежания наложения спектров и других искажений,. Для видеосигнала, имеющего в своем спектре максимальную частоту 6
МГц, необходима частота выборки
не менее
f в = 2 ⋅ 6 = 12 МГц . Следовательно , выбранная частота 13,5 МГц достаточна.
1.2. Требования к полосе
5
Цветное телевизионное вещание связано с передачей трех сигналов: сигнала яркости Y и двух цветоразностных сигналов Y—R ( обозначается C R) и Y—В ( СB). В системе аналогового телевидения эти сигналы передаются непосредственно
с
использованием
амплитудной
модуляции ( наземное
вещание) или частотной модуляции ( спутниковое вещание). В цифровом телевизионном вещании эти три сигнала сначала преобразуются в потоки цифровых данных, а затем модулируются и передаются (рис. 1.2). Для сигнала яркости,
который
содержит
наибольшие
видеочастоты ,
используется
максимальная частота выборки 13,5 МГц. Для сигналов цветности C R
И
СB,
которые содержат меньшие частоты, можно использовать и меньшую частоту выборки . МККР рекомендует применять половину частоты, используемой для сигнала
яркости,
т.
е.
f = 0,5 ⋅ 13,5 = 6,75 МГц.
Таким
образом,
для
составляющих цветности выборке подвергается только половина пикселов (каждый второй пиксел).
Рис.1.2. Цифровое ТВ-вещание (одна программа) Общее число отсчетов в секунду составляет 13,5 + 6,75 + 6,75 = 27 ⋅ 10 6 . За узлом выборки следует узел квантования , в котором каждый отсчет преобразуется в многобитовый код. Кодом минимального размера для адекватного представления изображения считается 8- битовый код, который 6
дает 28 = 256 дискретных уровней сигнала. Скорость передачи битов при таком кодировании составит υ = 27 ⋅10 6 ⋅ 8 = 216 ⋅10 6 бит/с. Для столь высокой битовой скорости нужна очень широкая полоса. Точная ширина полосы зависит от типа модуляции, используемой в передатчике. Например, в случае импульсно-кодовой модуляции ( ИКМ) требуется полоса ∆f = 0,5 ⋅ 216 = 108 МГц. Ширину полосы можно уменьшить, применяя сложные способы модуляции, в частности, квадратурную фазовую манипуляцию (КФМн) и квадратурную амплитудную модуляцию ( КАМ). Тем не менее полоса остается ограничивающим фактором для всех типов вещания: наземного, спутникового и кабельного. Поэтому необходимо применять средства сжатия данных и уменьшения числа битов. Эти средства позволяют уменьшить число битов, необходимое для кодирования изображения при сохранении его качества. 1.3. Качество изображения Качество
изображения
при
цифровом
телевизионном
вещании
ограничивают два фактора: полоса видеосигнала (или число пикселов на один кадр) и битовая скорость. При 720 пикселах на строку и 576 активных строках на кадр общее число пикселов на кадр составит 720 ⋅ 576 = 414 720. Для
каждой
пары
пикселов
требуется
один
период
полного
видеосигнала , поэтому максимальная частота аналогового видеосигнала составляет 7
f max = 414 720 ⋅ 25 2 = 5,18 МГц. При такой частоте сохраняется то же качество изображения, что и в традиционном аналоговом вещании. Вторым ограничением на качество изображения является битовая скорость. При сжатии данных в соответствии со стандартом MPEG-2 для цифрового телевизионного вещания хорошего качества требуется битовая скорость на входе модулятора 15 Мбит/с. Меньшая битовая скорость приведет к ухудшению качества изображения. Для телевизионного вещания высокой четкости, использующего 1152 строки, требуется битовая скорость 60 Мбит/с для 1440 пикселов на строку и 80 Мбит/с для 1920 пикселов на строку. 1.4. Общая характеристика системы На рис. 1.3 представлены основные компоненты системы цифрового телевидения, осуществляющей вещание четырех программ по одному ВЧ каналу. Программы, содержащие сжатую видеоинформацию и звук, вместе с пакетами служебных данных мультиплексируются ( уплотняются) в один битовый поток, называемый элементарным программным потоком (program elementary stream - PES). Элементарный поток каждой программы мультиплексируется еще раз в общий битовый поток, называемый транспортным потоком . Элементарный программный поток содержит идентификационные данные , временную метку и специфическую программную информацию ; эти составляющие потока поз-
8
Рис. 1.3. Цифровое ТВ-вещание: мультиплексирование воляют распаковывать пакеты данных на стороне приемника по программам и кадрам для восстановления исходного изображения. Транспортный поток поступает в модулятор и затем передается по одному ВЧ-каналу частотой 8 МГц. 1.5. Кодирование программ Основные компоненты системы кодирования программ показаны на рис. 1.4. Сначала аналоговые видео- и звуковые сигналы подвергаются дискретизации на соответствующей частоте (13,5 МГц для Y и 6,75 МГц для C R и СB), а затем передаются на свои кодирующие устройства. Кодирующие устройства удаляют несущественные или избыточные детали видео- и звуковых сигналов и выполняют операции уменьшения числа битов, формируя индивидуальные пакеты данных. Индивидуальные пакеты данных вместе со служебными пакетами данных передаются на мультиплексор , который формирует
элементарный
программный
поток.
Поскольку
объем
видеоинформации превышает объем звуковой или служебной информации , элементарный программный поток содержит больше пакетов видеоданных,
9
чем пакетов звуковых или служебных данных ( рис. 1.5). Затем элементарные программные потоки объединяются
в мультиплексоре
и поступают в
модулятор для передачи. Тип применяемой модуляции определяется типом вещания (наземное, спутниковое или кабельное).
Рис. 1.4. Кодирование программ: А — кодирование видеосигналов по стандарту MPEG-2; Б — кодирование звуковых сигналов по стандарту MPEG-2
Рис. 1.5.Структураэлементарногопрограммногопотока 1.6. Кодирование видеоинформации Кодирование видеоинформации состоит из трех основных этапов: подготовка видеоданных, их сжатие и квантование ( рис. 1.6).
На этапе
подготовки данных исходные кодированные данные кадров организуются так, чтобы их было удобно сжимать. Сжатие видеоданных осуществляется в соответствии с международными стандартами , установленными системой 10
MPEG-2. По стандарту MPEG-2 выполняются две основные операции сжатия: удаление
временной
избыточности
и
удаление
пространственной
избыточности.
Рис. 1.6. Кодирование видеоданных по стандарту MPEG-2. А - удаление пространственнойизбыточностина основе ДКП Удаление временной избыточности представляет собой межкадровое сжатие данных, при котором происходит сравнение двух последовательных видеокадров , удаление одинаковых областей и формирование разностей кадров для обработки. Удаление пространственной избыточности, называемое также внутрикадровым сжатием, исключает ненужные повторения содержимого конкретного видеокадра . Операции удаления выполняются на основе сложных математических выражений, называемых дискретным косинусным преобразованием ( ДКП); отсюда происходит название этого способа: « сжатие данных на основе ДКП». За блоком сжатия данных стоит блок квантования, который
обеспечивает
дальнейшее
битовое сжатие. Блок квантования
преобразует коэффициенты ДКП в 8- битовые коды, образующие битовый поток данных. Подготовка видеоданных. Видеоинформация, поступающая на вход видеокодера, представлена
последовательностью
сигнала яркости Y и сигналов цветности C R
И
кодированных отсчетов
CB; затем кадры этих сигналов
перегруппировываются в блоки, макроблоки и вырезки. Сначала кадры Y, C R И CB делятся на ряд блоков пикселов (рис. 1.7). Каждый блок представляет собой матрицу 8x8
закодированных в цифровом виде отсчетов пикселов. Три
11
компонента, представленных базовыми блоками , объединяются и образуют макроблок ( рис.1.8). Каждый макроблок состоит из четырех блоков яркости и двух блоков каждой составляющей цветности - C
R
и СЕ. Это дает так
называемый формат 4:2:0. Затем макроблоки выстраиваются в том порядке, в каком они появляются на изображении , чтобы получить вырезку. Вырезка может состоять из одного или нескольких макроблоков . На этом этапе к каждой вырезке добавляются биты обнаружения ошибки. Если в ступени декодирования приемника обнаруживаются ошибки, то декодер игнорирует информацию, содержащуюся в данной вырезке, и переходит к следующей . Последовательность вырезок восстанавливает полный видеокадр, содержащий все три составляющие изображения (Y, C R, CB), готовые к следующему этапу кодирования видеоданных.
Рис. 1.7. Базовые блоки Y,CR, CB
12
Рис. 1.8. Подготовка видеоданных Удаление временной избыточности. Рассматриваемый способ основан на том обстоятельстве, что различие между двумя последовательными изображениями очень мало. Таким образом, нет необходимости передавать 13
содержание каждого видеокадра полностью, поскольку
большая
часть
текущего кадра просто повторяет предыдущий кадр. Временное сжатие выполняется на группе изображений (group of pictures - GOP), состоящей из 12 нечетных кадров. Содержимое первого кадра группы, называемого кадром Э, сохраняется в памяти и используется как эталонный кадр для последующих кадров (рис. 1.9).
Э
Э
Рис. 1.9. Группа изображений(GOP). Содержимое кадра, следующего сразу же за эталонным кадром, сравнивается с кадром Э для образования разностного кадра, называемого кадром Р ( от predicted —
предсказываемый ), который используется для
обработки . Затем с первым кадром после кадра Э сравнивается второй кадр после кадра Э, третий кадр со вторым и т. д. до конца группы из 12 видеокадров. Затем для следующей группы из 12 кадров образуется новый эталонный кадр Э и т.д. Величина сжатия кадров Э ограничена; максимальное битовое сжатие получается в кадрах Р. Повышенное сжатие можно получить, используя два других способа: прямое предсказание и предсказание с компенсацией движения .
14
Прямое предсказание — это метод, который используется для создания кадров Р; он включает в себя предсказание ожидаемой разности между макроблоками последовательных кадров и передачей предсказанных кадров на обработку. Для этого требуется хранение более одного видеокадра. В прямом предсказании в качестве эталонного можно использовать кадр Э или ранее восстановленный кадр Р. Недостатком этого способа является то, что возникающие в кадре Р ошибки будут передаваться в последующие кадры до поступления очередного кадра. Предсказание с компенсацией движения заключается в сравнении содержимого предыдущего кадра и последующего кадра для конструирования текущего кадра. Конструируемый кадр называется кадром В ( от backward-prediction — обратное предсказание, или от bidirectional —
двунаправленный ,
поскольку его содержимое зависит как от предыдущего кадра, так и от последующего). В отличие от кадров Э и Р кадры В нельзя использовать как эталоны. Они также требуют хранения двух кадров в памяти изображения . На рис. 1.10 показана типовая последовательность из 12 кадров Э, P и В (0—11).
Э
Э
Рис. 1.10. Кадры Э, P и В
15
Поток данных MPEG-2 содержит, таким образом, непрерывную последовательность кодированных кадров, состоящих из комбинации предсказываемых кадров и эталонных кадров. Поскольку предсказываемые кадры Р и В обеспечивают более эффективное сжатие данных, желательно , чтобы предсказываемые кадры передавались гораздо чаще. Компенсация движения. Компенсация движения используется для того, чтобы корректировать ошибки, которые могут появиться в предсказываемых кадрах. Сравнивая положение объекта в последовательных кадрах, можно точно вычислить скорость и направление движения объекта. На основе этих вычислений можно предсказать положение объекта в последовательных кадрах ( обычно в кадрах яркости). Чтобы описать вектор скорости и направления движения, требуется относительно малый объем данных; эти данные поступают на генераторы кадров Р и В. Как только вектор движения определен,
он
используется
для
формирования
трех
составляющих
изображения - Y, C R И СВ. Удаление пространственной избыточности ДКП. Основное устройство кодирования
видеоинформации —
процессор дискретного
косинусного
преобразования (ДКП). Процессор ДКП получает кадры изображения Э, P и В в виде потока блоков 8x8,
организованных в макроблоки и вырезки,
образующие один видеокадр. Блоки могут являться частью кадра яркости (Y) или кадра цветности (C R
И
СB). Данные, представляющие отсчеты в каждом
блоке, поступают затем в процессор ДКП ( рис. 1.11), который переводит их в матрицу коэффициентов 8x8, представляющих видеообраз блока.
Рис. 1.11. Удаление пространственной избыточности на основе ДКП 16
Рис. 1.12. Процесс ДКП Перед
ДКП
каждое
число
в
блоке 8x8
представляет
значение
соответствующего отсчета, т. е. яркость пиксела, представленного этим отсчетом ( рис. 1.12). Процессор ДКП проверяет пространственные частотные компоненты блока в целом и переводит матрицу временной области в матрицу частотной области. Эта операция связана с созданием нового набора коэффициентов в матрице 8x8,
начиная с верхней левой ячейки, представля-
ющей постоянную составляющую, т. е. составляющую с частотой 0 Гц. Коэффициент в этой ячейке представляет среднюю яркость блока. Каждая из остальных ячеек представляет составляющую блока с возрастающей частотой (рис. 1.13).
Значения коэффициентов
в других ячейках определяются
количеством деталей изображения в блоке. Следовательно , блок, содержащий везде одинаковую яркость ( или цвет), например, представляющий участок чистого неба, будет иметь только постоянную составляющую; коэффициенты в других ячейках будут нулевыми. Блок, содержащий деталь изображения, будет иметь ненулевые коэффициенты в соответствующих ячейках. Грубая деталь изображения представляется малыми коэффициентами, и всего несколько ячеек будут содержать ненулевые коэффициенты ; тонкая деталь изображения представляется коэффициентами большей величины, и много ячеек будут содержать
ненулевые
коэффициенты .
Тонкие
горизонтальные
детали
изображения (высокая горизонтальная частота) представляются перемещением по горизонтали вправо; более крупные вертикальные детали ( более высокая 17
вертикальная частота) представляются движением по вертикали вниз, как показано на рис. 1.13. Самая тонкая деталь изображения, т. е. самая высокая видеочастота, представляется нижней правой ячейкой матрицы.
Рис. 1.13. Блок частотной области Как можно заметить на рис. 1.12, на котором представлена матрица ДКП типичного блока, наибольшие коэффициенты и, следовательно , большая часть энергии сосредоточены в верхнем левом углу и вблизи него; в нижнем
18
правом квадранте очень мало коэффициентов значительной величины . Такое расположение
коэффициентов
не
является
неожиданным ,
поскольку
маловероятно, что блок пикселов 8x8 передает сколько-нибудь тонкую деталь изображения. Коэффициенты ДКП округляются в сторону увеличения или уменьшения , чтобы получить меньший набор возможных величин, что приводит к сильно упрощенному набору коэффициентов (рис. 1.14).
Рис. 1.14. Блок ДКП с округлением
Зигзагообразное
сканирование
матрицы
ДКП.
До
квантования
матрица ДКП каждого блока переводится в последовательную форму путем сканирования по зигзагообразному пути, начиная с верхнего левого элемента (постоянной составляющей ), как показано на рис. 1.15. Для блока, показанного на рис. 1.14, результат сканирования будет следующим: 315, 2, -4, -2, -3, -1, -2, -2, -3, 0, 2, 0, 0 и 1. Оставшиеся коэффициенты можно не учитывать, поскольку они равны нулю и поэтому не содержат информации. Конец блока обозначается специальным кодом ( ЕОВ — end-of-block),
который присоединяется
к
последовательности коэффициентов в конце сканирования. Иногда среди
19
последовательности нулей может встретиться существенный коэффициент, в этом случае используется другой специальный код для обозначения длинной последовательности нулей.
Рис. 1.15. Зигзагообразноесканирование Квантование с переменной длиной. Квантование коэффициентов ДКП не носит линейного характера. На практике используется энтропийное кодирование. В способе энтропийного кодирования каждому коэффициенту присваивается индивидуальный уровень квантования в соответствии с его положением в матрице. Каждому коэффициенту присваивается весовой, или масштабный, множитель для указания его относительной значимости. Самый высокий уровень квантования присваивается верхнему левому элементу матрицы, который представляет постоянную составляющую. Коэффициент постоянной составляющей кодируется с наивысшим уровнем точности , поскольку
видимость
шумов
максимальна
видеоинформации.
20
на
низкочастотной
Рис. 1.16. Квантованиес переменной длиной Высокочастотная информация может допускать более высокий уровень ошибок квантования, поэтому ей присваиваются более низкие уровни квантования. Весовые ( масштабные) множители квантования затем модифицируются, чтобы учесть битовую скорость на выходе процессора ДКП. Если имеется грубая деталь изображения и большинство коэффициентов ДКП равны или близки к нулю, т. е. несущественны, процессор ДКП формирует короткую строку коэффициентов, что вызывает минимальные требования к битовой скорости и полосе. Однако блок с более тонкими деталями изображения будет представлен длинной строкой коэффициентов, а это предъявляет более высокие требования к битовой скорости и полосе, которые могут выйти за установленные границы. Чтобы избежать этого, используется кодирование с переменной длиной ( рис. 1.16). Такое кодирование обеспечивает динамическое изменение весовых коэффициентов квантования в зависимости от битовой скорости, возникающей в самом процессоре ДКП. Квантованные биты поступают сначала в буферную память, а затем передаются с постоянной скоростью в кодирующее устройство передачи.
Если
битовая
скорость
увеличивается
и
буфер
начинает
переполняться, то запускается блок управления битовой скоростью, уровень квантования уменьшается, и битовая скорость данных снижается. Другими словами, выходная битовая скорость поддерживается постоянной.
21
Сравнение векторов. Действительное число битов, требуемое для представления каждого отсчета, можно дополнительно уменьшить , используя кодированные двоичные последовательности , такие, например, как при неравномерном
кодировании
или
векторном
кодировании .
При
неравномерном кодировании укорачиваются длинные последовательности одинаковых чисел, например, последовательность 3, 3, 3, 3, 3, 3 заменяется на 6, 3 ( число 3,
повторенное шесть раз). Векторное кодирование является
разновидностью кодирования с предсказанием, при котором квантованная группа пикселов, например матрица 8x8,
представляется кодовым вектором.
Вектор, математически представляющий блок пикселов , сравнивается с набором векторов , заранее загруженных в ПЗУ. Выбирается вектор с наилучшим соответствием, который и передается должным образом. На приемной стороне переданный вектор вновь преобразуется в первоначальный блок на основе таблицы преобразования , которая содержит тот же набор векторов и соответствующие им изображения. 1.7. Устройство кодирования звука Кодирование звука заключается в расщеплении звуковой полосы на 32 поддиапазона равной ширины (рис. 1.17). Частоты звукового сигнала, попадающие внутрь каждого поддиапазона , подвергаются дискретизации и преобразуются в многобитовый код. Возможны три частоты выборки : 32, 44,1 и 48 кГц. Информация о принятой частоте выборки включается в управляю щую часть звукового пакета. Сжатие звуковой информации осуществляется с помощью специальных алгоритмов, которые удаляют часть звуковых данных, не снижая качества звука; эта операция называется маскированием. При маскировании используются две особенности слуха человека: 1) слабый звук становится неслышимым из-за громкого звука на близкой частоте; 2) слабые высокие частоты маскируются более громкими низкими частотами. Кроме то-
22
Рис. 1.17. Принципиальнаясхема кодированиязвука го, человеческий слух имеет конечную разрешающую способность по частоте, вследствие чего звуки в некотором диапазоне частот воспринимаются как одинаковые. Звуковое маскирование выполняется с помощью преобразования Фурье. Звуковые сигналы поступают на процессор быстрого преобразования Фурье ( БПФ), который коэффициентам ,
раскладывает
используемым
для
звуковой
определения
спектр
по частотным
уровней
квантования
различных поддиапазонов. Квантованные поддиапазоны вместе с необходимой информацией управления и обнаружения ошибок поступают на мультиплексор для формирования звукового пакета MPEG-2,
показанного на рис. 1.18.
Отсчетам в поддиапазонах предшествуют заголовок, циклический избыточный код (ЦИК), данные о размещении битов и масштабировании . Заголовок несет информацию о синхронизации и системе ; биты ЦИК используются для коррекции ошибок; данные о размещении битов определяют разрешающую способность выборки, а биты масштабирования несут информацию о масштабных
коэффициентах.
Вспомогательные
данные
относятся
к
центральному и окружающему звуку Долби . Кодирование по стандарту MPEG-2 обеспечивает двухканальное стереозвучание, а также до пяти каналов видеовещания с битовой скоростью 64 – 256 кбит/с.
23
Рис. 1.18. Пакет звуковыхданных 1.8. Пакет служебных данных Пакет служебных данных является третьей составляющей элементарного программного потока (programmer elementary stream - PES)
цифрового теле-
видения. Он содержит служебные и программные данные. Называемый также частным пакетом данных, он содержит среди других управляющих данных специфическую информацию о программе , необходимую для идентификации канала и выбора соответствующих видео- и звуковых пакетов из числа других мультиплексированных программ. 1.9. Структура элементарного программного потока Элементарный программный поток ( рис. 1.19) содержит заголовок и пакет видео-, звуковых или служебных данных. Длина пакета данных обычно равна 2 кб (2048 байтов), но может достигать и 64 кб. Заголовок содержит информацию, необходимую для идентификации и определения пакета, включая: • стартовый код (24 бита), в частности, 000001 (шестнадцатеричный ); • идентификационный код PES (8 битов), например , видео-, звукового или частного пакета; • код длины пакета (16 битов); 24
Рис. 1.19. Пакет данных PES • код управления скремблированием (2 бита). Заголовок может содержать метку времени представления, которая сообщает информацию о времени, когда кадр должен быть отображен, звуковой фрагмент — услышан или титр — вставлен. Эти временные метки важны для синхронизации звуковых и видеоданных . 1.10. Мультиплексирование программ На рис. 1.20
показана блок-схема устройства для двухпрограммного
мультиплексирования . Сначала пакеты видео-, звуковых и служебных данных каждой программы мультиплексируются
для образования элементарных
программных потоков PES1 и PES2. Затем два элементарных программных потока мультиплексируются , чтобы получился транспортный поток. Таким образом, транспортный поток содержит индивидуальные пакеты каждой программы , которые идентифицируются по специальной информации о программе, содержащейся в пакете служебных данных. Затем транспортный поток поступает в кодирующее устройство канала, где вводится прямая коррекция ошибок, и далее в модулятор и передатчик, который может быть передатчиком линии связи «земля -спутник» для спутникового телевидения ,
25
26
Рис. 1.20. Мультиплексирование программ
ным передатчиком для наземного телевидения или усилителем для кабельного телевидения. Модулируемому транспортному потоку, как и в случае одного аналогового канала, отводится полоса 8 МГц. В одном транспортном потоке может содержаться до четырех различных программ без ущерба качеству изображения. 1.11. Структура пакетов транспортного потока Транспортный поток MPEG-2
состоит из последовательности 188-
байтовых пакетов данных. Каждый пакет содержит 4- байтовый заголовок, за которым следуют 184 байта видео-, звуковой или служебной информации , называемой
полезной
нагрузкой
Заголовок
(рис. 1.21).
начинается
со
стандартного 1- байтового слова синхронизации ( шестнадцатеричный код 47), которое определяет для пакета последовательность вхождения в синхронизм . Заголовок ( рис. 1.22) распаковки
различных
предоставляет программ
необходимую и
информацию
воспроизведения
для
выбранного
элементарного программного потока на приемной стороне. Перечень битов заголовка и их назначение представлены в табл. 1. Транспортные пакеты короче пакетов элементарного программного потока, длина которых обычно составляет 2 кб, поэтому пакеты PES следует делить на блоки данных по 184 байта для обеспечения соответствия с пакетом транспортного потока. Один пакет PES распределяется по нескольким пакетам транспортного потока. Поскольку длина пакета PES в байтах не кратна 184, последний транспортный пакет ( который содержит остаток пакета PES) будет только частично заполнен. Незаполненная
часть транспортного пакета
занимается полем адаптации, длина которого равна разности между 184 байтами и остатком PES ( рис. 1.23). Кроме выполнения этой функции заполнения поле адаптации служит эталоном программной синхронизации (programmer clock reference - PCR),
который используется на приемной стороне для
27
синхронизации базовых синхроимпульсов 90 кГц и является средством для измерения временных меток программы (PTS — programmer time stamp).
Рис. 1.21. Пакет данных транспортного потока
Рис. 1.22. Структура заголовка транспортного потока
28
Таблица 1 Содержаниезаголовкатранспортногопотока MPEG-2 Поле Слово синхронизации
Биты Назначение 8 Стартовая последовательность заголовка, шестнадцатеричный код 47 1 Указывает ошибки на предыдущих этажах полезной 1 Указывает начало полезной нагрузки
Индикатор ошибки Индикатор начала блока нагрузки Приоритет Идентификатор пакета Управление скремблированием
1 13 2
Флаг поля адаптации Флаг полезной нагрузки
1 1
Счетчик связности
1
Указывает транспортный приоритет Указывает содержимое пакета Указывает тип используемого скремблирования Указывает наличие поля адаптации Указывает наличие полезных данных в пакете Ведет счет сокращенных порций PES
Рис. 1.23. Размещениепакетов PES: пакеты PES распределяютсяпо нескольким пакетамтранспортногопотока
1.12. Прямая коррекция ошибок Цифровые сигналы, особенно сигналы с высоким уровнем сжатия, нуждаются в эффективном обнаружении и исправлении ошибок. В цифровом телевизионном вещании интенсивность ошибок в битах должна быть порядка 29
10-10 - 10 -12, что эквивалентно 0,1-10 ошибочным битам за один час передачи. Канал передачи со столь низкой интенсивностью ошибок в битах называют квазибезошибочным каналом. Чтобы выполнить столь строгие условия, приходится предпринимать определенные предупредительные меры, которые гарантируют, что ошибки, вызванные физической средой передачи, будут обнаружены и, если это возможно, скорректированы. В этом заключается назначение блока прямой коррекции ошибок (ПКО). Перед использованием прямой коррекции ошибок ИС ПКО выполняет так
называемое
скремблировании
рассредоточение
энергии,
которое
данных для достижения равномерного
заключается
в
распределения
энергии по каналу. Чтобы обеспечить дескремблирование данных в исходную форму, используют псевдослучайное двоичное скремблирование, аналогичное скремблированию при передаче стереозвука по системе NICAM. ПКО имеет три этапа: • внешнее кодирование (код Рида-Соломона ); • сверточное перемежение; • внутреннее кодирование (сверточное ). Внутреннее кодирование (третий этап) не требуется для кабельного телевидения. На приемной стороне все эти три этапа обращаются (рис. 1.24)
30
Рис. 1.24. Этапы ПКО Внешнее кодирование использует код обнаружения и исправления ошибок Рида-Соломона (PC). При этом кодировании не корректируются пакеты ошибок, т. е. ошибки в смежных битах. Перемежение позволяет преодолеть это ограничение; оно удаляет друг от друга смежные биты перед передачей. Если среда передачи вносит длинные пакеты ошибок, то на приемной стороне ошибки удаляются друг от друга путем обращения переме-жения до поступления на декодер внешнего кода. Код PC, выбранный для цифровой телевизионной передачи, — это код 204:188, в котором к пакетам транспортного потока добавлены 16 дополнительных байтов ( рис. 1.25) Внешний кодер PC может обнаруживать и исправлять 16 байтов ошибок в 204-байтовом пакете. Наконец, уже упомянутое ранее внутреннее кодирование представляет собой иной тип сверхточного кодирования , который обладает большей способностью исправления ошибок. Полное (100%)
устройство сверхточного
внутреннего кодирования формирует два одновременных выходных битовых потока, X и Y, каждый из которых повторяет исходный поток данных. Битовые потоки X и Y модулируются и передаются. Хотя этот способ обеспечивает 31
очень эффективное исправление ошибок, он, по существу, удваивает требования к ширине полосы канала. Избыточность можно снизить, используя способ, называемый прокалыванием , в соответствии с которым из двух одновременных битов потоков X и Y один выбирается для модуляции. Используется чередование битов X и Y в пределах определенного соотношения, называемого отношением прокалывания. Высокое отношение прокалывания увеличивает эффективность коррекции ошибок ценой уменьшения пропускной способности канала. Вещательная компания в зависимости от мощности передатчика, размера антенны и желаемого качества может выбрать отношение прокалывания 3/4 или 2/3.
Рис. 1.25. Транспортный пакет с битами прямой коррекции ошибок 1.13. Модуляция Конечное уменьшение битовой скорости осуществляется с помощью современных способов модуляции. Обычная частотная модуляция, при которой логический 0
и логическая 1
представляются двумя различными
частотами, крайне неэффективна в отношении требований к битовой скорости и диапазону рабочих частот. В цифровом телевизионном вещании используются три типа модуляции: относительная квадратурная фазовая манипуляция ( ОКФМн) для спутникового телевидения, квадратурная амплитудная модуляция для кабельного телевидения и кодированное ортогональное частотное уплотнение (coded 32
orthogonal frequency division multiplexing - COFDM)
для наземного цифрового
телевидения. В спутниковом цифровом телевещании применяется тот же вид модуляции (ОКФМн), что и в системе NICAM. Четыре значения фазы, 45°, 135°, 225° и 315°,
формируются двумя несущими с одинаковой частотой, располо-
женными под прямыми углами друг к другу. Каждая фаза используется для представления комбинации из двух битов. Для работы обычной квадратурной фазовой манипуляции ( КФМн), требуется эталонный фазовый угол. В ОКФМн в качестве эталонного фазового угла используется предыдущая фаза, причем каждое изменение фазы представляется 2-битовой комбинацией . Квадратурная амплитудная модуляция. Фазовую манипуляцию можно улучшить путем увеличения числа фазовых углов от 4 для КФМн, или 4- ФМн, до 8 или 16 для 8- ФМн и 16- ФМн соответственно. В случае кодирования 8ФМн несущая может иметь один из восьми различных фазовых углов ( рис. 1.26), причем каждый вектор будет представлять одну из восьми 3- битовых комбинаций.
Квадратурная
амплитудная
модуляция (
КАМ)
является
расширением ФМн в том смысле, что несущая для увеличения числа битов в представлении изменяется как по амплитуде, так и по фазе. Например, кодирование 16- КАМ увеличивает битовую ширину модуляции до 4, как показано на рис. 1.27. Используются 12 различных фазовых векторов несущей, четыре из которых имеют по две амплитуды, что делает возможным 4-битовое представление. На рис. 1.28 изображены все возможные фазовые углы и амплитуды несущей для 16-ФМн; такую диаграмму называют звездной картой. В кабельном цифровом телевещании используется цифровая модуляция более высокого порядка, 64- КАМ, в которой каждое сочетание значений фазы и амплитуды несущей представляет одну из 64 возможных 6- битовых комбинаций. Звездная карта для кодирования порядка 64-КАМ показана на рис. 1.29.
33
Рис. 1.26 . Векторная диаграмма для 8-ФМн
Рис. 1.27. Векторная диаграмма для 16-КАМ
34
Рис. 1.28. Звездная карта для 16-ФМн
Рис. 1.29. Звездная карта для 64-КАМ Кодированное ортогональное частотное уплотнение . Несмотря на свою высокую эффективность , кодирование 64- КАМ при использовании для наземного вещания страдает от замираний и многолучевой интерференции. В аналоговых системах замирание и многолучевая интерференция вызывают ухудшение изображения. В цифровых системах, особенно когда изменение фазы на отраженном пути составляет 180° по отношению к прямому пути, возможно серьезное ухудшение и даже полное исчезновение изображения. Этого можно избежать, используя модуляцию с несколькими несущими , называемую ортогональным частотным уплотнением (OFDM). Поскольку цифровой сигнал кодируется с применением коррекции
ошибок, этот процесс модуляции
называют
прямой
кодированным
ортогональным частотным уплотнением (COFDM). Способ COFDM включает в себя распределение высокоскоростного после-
35
довательного битового потока по большому числу близкорасположенных индивидуальных несущих, разнесенных по доступной полосе частот; каждая несущая передает только часть общего битового потока. Несущие обрабатываются ( или модулируются) одновременно в течение регулярных интервалов времени. Набор несущих, обрабатываемых на каждом интервале, называют символом COFDM. Вследствие
большого
числа
несущих
длительность
символа COFDM
существенно больше, чем длительность одного бита в исходном битовом потоке.
Рис. 1.30. Частотный спектр одной несущей COFDM Пусть, например, число модулирующих битов равно 500, причем каждый из них используется в течение 0,1 мкс для обработки ( модуляции) 500 несущих с целью формирования символа COFDM. Тогда длительность символа COFDM составит приблизительно 0,1⋅ 500 = 50 мкс. Большая длительность символа позволяет приемнику ждать, пока не придут все отраженные сигналы, и только после этого произвести оценку и обработку сигнала. Таким образом, отраженные
36
колебания, приходящие в этот период времени, будут улучшать путь прямой передачи. Возможно дальнейшее его улучшение посредством введения перед символом защитного интервала (называемого также защитной полосой), во время которого приемник ждет перед тем, как начать оценку несущих. Расстояние между несущими выбирается равным 1Д, где ts — продолжительность модулирующего символа. На рис. 1.30 показан частотный спектр каждой несущей. При использовании всех несущих получается плоский частотный спектр с паразитными боковыми лепестками на каждом его крае (рис.1.31). Введение защитного интервала улучшает частотный спектр, уменьшая вторичные боковые лепестки.
Рис. 1.31. Частотный спектр набора несущих COFDM Быстрое преобразование Фурье. Набор несущих, формируемых OFDM, очень напоминает то, что получается в алгоритме БПФ, которое производит разложение непрерывного колебания на частотные составляющие .
37
Рис. 1.32. Структурная схема передачи с использованием COFDM Для получения непрерывного колебания, которое можно применить для модуляции УВЧ-несущей, над несущими COFDM
выполняется обратное
быстрое преобразование Фурье (ОБПФ). На приемной стороне сигнал от УВЧдемодулятора поступает на кристалл БПФ для получения исходных несущих COFDM (рис. 1.32.) Мощность частотный
спектр
эквивалентного уменьшает
изотропного
требования
излучателя.
к мощности
Плоский
эквивалентного
изотропного излучателя ( МЭИИ) цифрового телевизионного приемника примерно на 20 дБ ( в 100 раз) по сравнению с аналоговым наземным вещанием, при котором мощность несущей концентрируется в узкой полосе вокруг несущей изображения, поднесущих цвета, ЧМ-звука и звука NICAM (рис. 1.33).
Энергия, передаваемая несущими COFDM,
распределена по всему спектру.
38
более равномерно
Рис. 1.33. Распределениеэнергии при аналоговомназемном телевещании Одночастотная сеть. Кроме улучшения качества приема имеется дополнительное преимущество, которое заключается в высокой устойчивости по отношению к замираниям и многолучевой интерференции. Это дает основание вещательным компаниям использовать одночастотную сеть по всей стране. При аналоговом телевещании идентичный сигнал от соседнего передатчика вызовет повторное изображение . Но при цифровом наземном телевещании его невозможно будет отличить от сигнала, передаваемого другим передатчиком, так же как и отраженные колебания. Если посторонние сигналы поступят во время защитного интервала, то будут отвергнуты. Режимы COFDM 8k/2k.
Для цифрового наземного телевидения
европейская система DVB базируется на модуляции COFDM с 8 кб или 2 кб несущими с длительностью символа ( ts) 896
и 224
мкс соответственно.
Эффективное число несущих, т. е. фактическое число несущих, которые можно использовать для модуляции COFDM, составляет 6818 для режима 8кб и 1706 для режима 2 кб. Остальные несущие используются для защитного интервала и как непрерывные и рассеянные пилот-несущие. Непрерывные пилот-несущие передают параметры конкретной передачи, а рассеянные пилот-несущие используются как эталонные несущие. 39
1.14. Управление цифровым мультиплексором Мультиплекс транспортного потока передает две или более программы, каждая из которых содержит несколько элементарных программных потоков. Информация о различных компонентах программы и о том, как они соотносятся друг с другом, содержится в битах данных специальной программной информации (СПИ) внутри пакета служебных данных. СПИ состоит из нескольких таблиц, которые содержат всю информацию, необходимую для настройки и выбора программы. Существуют четыре основные таблицы. • Таблица размещения программ (programme allocation table - PAT) навливает связь между программой и программным
уста-
идентификатором
(PID) пакетов, несущих карту программ. • Таблица карты программ (programme map table программные
идентификаторы
элементарных
РМТ) указывает
потоков ,
составляющих
программу. • Таблица условного доступа (conditional access table - CAT) содержит данные управления доступом. • Частная таблица содержит частную информацию. Изменение программ, или заппинг (быстрая смена телезрителем просматриваемой программы с помощью пульта дистанционного управления), является поэтому намного более длительной операцией по сравнению с аналоговым
телевидением ;
процесс
синхронизации
и
идентификации
занимает более одной секунды в зависимости от того, где происходит изменение: внутри или снаружи канала.
40
Вопросы 1. Приведите три преимущества цифрового телевещания перед аналоговым. 2. Укажите для стандарта DVB: а) число пикселов на строку; б) число пикселов на изображение ; в) частоту выборки для аналогового видеосигнала. 3. Укажите типы модуляции, используемые : а) в спутниковом цифровом телевещании; б) в наземном цифровом телевещании . 4. Укажите два вида удаления избыточности, используемые в видеокодировании MPEG-2. 5. Что означает в цифровом телевещании : а) элементарный программный поток; б) транспортный поток? 6. Объясните причину применения COFDM в наземном цифровом телевещании. Сколько несущих используется в режиме 2кб COFDM?
41
2. ЦИФРОВЫЕ ТЕЛЕВИЗИОННЫЕ ПРИЕМНИКИ Цифровой интегрированным
телевизионный декодером
прием приемника (
обычно ИДП)
обеспечивается или
приставкой .
Интерфейсный узел, называемый канальным декодером, зависит от типа телевещания: спутниковое , наземное или кабельное . Остальные схемы являются общими для всех трех способов вещания. 2.1. Общая характеристика системы На рис. 2.1 показана обобщенная блок-схема цифрового телевизион ного ИДП. Канальный декодер состоит из цифрового демодулятора и узла прямой коррекции ошибок. Он принимает модулированные высокочастотные сигналы и воспроизводит исходный цифровой транспортный поток, содержащий пакеты четырех или пяти мультиплексированных программ. Цифровой транспортный поток поступает в транспортный демультиплексор , который идентифицирует каждый пакет по программному идентификатору и осуществ-
Рис. 2.1. Интегрированныйдекодер приемника для цифрового телевидения: А — ДОЗУ видеоданных; Б — ДОЗУ звуковыхданных 42
ляет
памяти
типа
ДОЗУ ( динамическое
оперативное
запоминающее
устройство). Три составляющие видеосигнала передаются в декодер ПАЛ, который преобразует цифровой видеосигнал в аналоговый полный видеосигнал ПАЛ и затем посылает его в УВЧ-перекомпоновку данных для воссоздания элементарного пакета выбранной программы. Если пакет скремблируется, то он поступает в модуль условного доступа, который обращается к кредитной карте с встроенной микро-ЭВМ с запросом о наличии у пользователя текущей подписки на выбранную программу. Если подписка отсутствует, то модуль условного доступа информирует об этом микроконтроллер системы, который прекращает
всякую
обработку
сигнала.
В
противном
случае
сигнал
возвращается в транспортный демультиплексор для дальнейшей обработки видео- и звуковыми декодерами. Транспортный демультиплексор формирует два набора цифровых сигналов и посылает их на соответствующие декодеры; один набор — это 1- байтовые (8 битов) выходные видеосигналы, другой — последовательные выходные звуковые сигналы. Для буферизации видео- и звуковых
данных
используется
быстрая
память
СОЗУ ( статическое
оперативное запоминающее устройство) 8 кбх8, поэтому дальнейшая передача на видео- и звуковые декодеры может выполняться пакетами. Узел видеосигнала содержит видеодекодер MPEG-2, который распаковывает поток видеоданных и преобразует его обратно в исходные составляющие : Y, C R
И
СB. Изображение восстанавливается по кадрам Э, P и В. Эти кадры
надо хранить одновременно, поэтому необходима большая видеопамять в виде буферного модулятора. Звуковой узел содержит звуковой декодер MPEG, который декодирует звуковой пакет по тем же правилам, что и при кодировании на передатчике; звуковой узел формирует левый и правый аналоговые звуковые сигналы. Буферизация звуковых сигналов осуществляется с помощью ИС памяти ДОЗУ звуковых данных, которое помимо прочих функций создает задержку в 1 с для обеспечения синхронизации звука и изображения. Эта задержка необходима,
43
поскольку обработка видеосигналов длится дольше, чем обработка звуковых сигналов. Левый и правый аналоговые звуковые сигналы от звукового декодера поступают на суммирующий усилитель для формирования монофонического звука для УВЧ-модулятора . Кроме того, формируются отдельные выходные стереосигналы (L и R). 2.2. Управление системой Для выбора программ и обработки сигналов необходимы обычное управление на базе микроконтроллера и микропроцессорный блок, который выполняет всю необходимую программную работу. На рис. 2.2 показана блоксхема системы управления на основе микроконтроллера Ml и микропроцессора М2. Микропроцессор управляет видео- и звуковым декодерами, включая синхронизацию, демультиплексором транспортного потока и модулем условного доступа; кроме того, он поддерживает работу системы меню приемника. Микропроцессор имеет свои собственные синхронизацию , шины адреса, данных и управления, ДОЗУ и флэш-память. ИС ОЗУ типа энергонезависимой
Рис. 2.2. Система управленияинтегрированнымдекодеромприемника
44
флэш-памяти используется для хранения программ , связанных с процессом декодирования . Программы могут обновляться по эфиру путем загрузки нового программного обеспечения в ИС ДОЗУ с последующей перезаписью во флэшпамять или по телефону, с использованием модема. Эфирное обновление и перепрограммирование
выполняются
вещательной
компанией ;
никаких
действий со стороны пользователя не требуется. Обновление через модем включает в себя посылку вещательной компанией эфирного сообщения цифровому телевизионному приемнику, в соответствии с которым приемник должен « позвонить» по заранее загруженному телефонному номеру. Если телефонная линия у абонента свободна , то обновление флэш-памяти будет происходить по обычной телефонной линии. Этот вид связи используется и для кредитного контроля, выставления счетов и других целей. Микроконтроллер следит за источником питания и декодирует инфракрасный информационный сигнал от пульта дистанционного управления и сигнал от кнопок на передней панели; он управляет канальным декодером, включая селектор и цифровой демодулятор, а также декодером ПАЛ. Кроме того, он осуществляет связь с микропроцессором. 2.3. Канальный декодер Канальный
декодер ( называемый
также
внешним
интерфейсом )
является частью приемника и зависит от типа приема. На рис. 2.3 показаны основные компоненты канального блока для спутникового приемника. Селектор
смешивает
входящий
аналоговый
модулированный
высокочастотный сигнал с сигналом гетеродина; в результате получается модулированная
промежуточная
частота.
Перед
тем
как
передать
модулированную ПЧ на цифровой демодулятор, ее следует преобразовать в цифровую форму, используя аналого-цифровой преобразователь ( АЦП). Он
45
использует скорость выборки, которая по крайней мере в два раза выше бодовой скорости передаваемого сигнала. Демодулятор представляет собой ИС процессора
цифровой
обработки
сигналов,
который
может
быть
демодулятором КФМн для спутникового приема или демодулятором COFDM для наземного приема.
Рис. 2.3. Канальный декодер Демодулятор полностью управляется и программируется системным микроконтроллером по шине адреса и данных и линиям управления. Он оценивает мощность входного сигнала и вырабатывает сигнал АРУ для селектора. Кроме того, демодулятор посылает сигнал синхронизации для гетеродина селектора по линии управления ГУН. Выходные данные имеют тот же формат, что и исходный транспортный поток, т.е. состоят из 204- байтовых пакетов данных ( видео-, звуковых или обслуживания программ), включая 16- байтовую контрольную сумму. Затем транспортный поток направляется в блок ПКО. Блок ПКО использует байты контрольной суммы для принятия «жесткого» решения относительно полученных данных. Он определяет, содержат ли полученные пакеты данных какие-либо ошибки . Если содержат , то блок ПКО попытается скорректировать их. При неудачной попытке блок пометит пакеты, 46
которые содержат ошибки, и они не будут подвергаться дальнейшей обработке. В конце этого процесса формируется транспортный поток, который содержит несколько 188-
байтовых (204—16)
мультиплексированных
пакетов,
относящихся к четырем или пяти различным телевизионным программам . Перед восстановлением изображения пакеты , относящиеся к выбранной программе , должны быть идентифицированы и размещены в правильном порядке. Эту операцию выполняет демультиплексор . 2.4. Транспортный демультиплексор Входные данные демультиплексора этого типа ( рис. 2.4) – 8- битовый транспортный поток, содержащий видео-, звуковую и служебную информацию, относящуюся к четырем или пяти различным программам, которые представлены в виде 188- битовых пакетов. Каждый пакет содержит слово синхронизации для процесса вхождения в синхронизм, идентификатор пакета, опорный сигнал синхронизации программы, метку времени представления и биты
видео-,
звуковых
и
служебных
данных.
Если
используется
скремблирование или шифрование, входные данные передаются на модуль условного доступа по специальной 8- битовой шине ( САМ DATAOUT); если доступ разрешается, то данные возвращаются по отдельной 8- битовой шине (САМ DATAIN). Доступом управляет микропроцессор, который обращается к кредитной карте, чтобы установить наличие или отсутствие у пользователя действующей подписки на выбранную программу. Основная задача демультиплексора – идентификация пакетов, относящихся к выбранной программе, и использование их меток времени представления вместе с программной опорной синхронизацией в 27 МГц для синхронизации выбранных пакетов между собой. Затем демультиплексор фильтрует выбранные пакеты и передает их на видеодекодер по шине видеоданных ши-
47
Рис. 2.4. Транспортный демультиплексор риной 1 байт. Что касается звуковых пакетов, то демультиплексор преобразует их в последовательную форму и передает на звуковой декодер . Эта операция выполняется под управлением микропроцессора , который, помимо прочего, проверяет
служебные
пакеты
запрошенных
программ
и
направляет
соответствующие инструкции по управлению и обработке на демультиплексор. Для хранения выбранных видео- и звуковых пакетов и последующей выдачи их в пачке используется быстрое СОЗУ (время доступа 20—25 мкс). Для этой цели используются специальные шины адреса и данных ОЗУ. Транспортный демультиплексор взаимодействует с основным микропроцессором через 8битовую шину данных, 13- битовую шину адреса и несколько линий управления ( чтение/запись - R/W, подтверждение – АСК, и выбор кристалла CS), а также через одну и более линию запроса прерывания (IRQ). Транспортный демультиплексор использует свои запросы прерывания для
48
того, чтобы информировать микропроцессор
о некоторых событиях, в
частности о переполнении буфера СОЗУ. При приеме запроса прерывания микропроцессор выполняет программу обработки прерывания , связанную с характером
прерывания.
Демультиплексор
работает
по
системной
синхронизации 25 МГц (отличается от программной опорной синхронизации 27 МГц для потока данных). 2.5. Видеодекодер MPEG Видеодекодер MPEG ( рис. 2.5) предназначен для восстановления исходного изображения. Этот процесс включает в себя распаковку данных, обращение дискретного косинусного преобразования, реконструирование изображения по кадрам Э, P и В и воспроизведение исходных составляющих яркости и цветности для каждого кадра. Чтобы реконструировать изображение, надо одновременно хранить передаваемые кадры и провести необходимые сравнения между ними для восстановления полных кадров. Поэтому необходима память большого объема. В качестве памяти, где хранятся различные кадры, используется 64битовое буферное ДОЗУ. В некоторых приемниках кадры В не используются, а изображение восстанавливается только по кадрам Э и Р. Этот процесс требует ДОЗУ с меньшим объемом памяти, т. е. меньших затрат. После восстановления изображения данные пикселов, связанные с яркостью и цветностью , передаются на кодирующее устройство ПАЛ по 8-битовой мультиплексированной шине данных YC. Кодер ПАЛ формирует стандартный телевизионный сигнал - 625
строк на кадр и 25 кадров в секунду. Начало
каждой строки развертки указывается управляющим сигналом HSYNC, поступающим от кодера ПАЛ на видеодекодер. Нечетные и четные поля указываются сигналами ODDE и EVEN соответственно. Полный видеосигнал (CVBS) поступает в УВЧ-модулятор ( рис.2.5). Для синхронизации процесса сбора данных и видеодекодер, и кодер ПАЛ тактируются опорными программными синхроимпульсами с частотой 27 МГц. 49
Рис. 2.5. ДекодированиевидеосигналаMPEG-2 Декодер программируется и управляется микропроцессором по 8-битовой шине данных и 6- битовой адресной шине с использованием нескольких управляющих сигналов, включая R/W и CS. Для запроса программ обработки типа «старт поля» видеодекодеру предоставляется один сигнал IRQ. Кодер ПАЛ управляется микроконтроллером по шине I2С, по которой микроконтроллер устанавливает рабочие параметры кодера. 2.6. Звуковой декодер Звуковой декодер (рис. 2.6) — это кристалл цифровой обработки сиг-налов, который получает последовательные кодированные звуковые сигналы от транспортного демультиплексора
и выполняет необходимую обработку ,
формируя два ( левый и правый ) последовательных 50
звуковых канала с
импульсно -кодовой модуляцией . Звуковой декодер может выдавать звуковые данные при трех различных частотах выборки: 32, 44,1 и 48 кГц. Информацию на фактической частоте выборки,
используемой
демультиплексор ,
передатчиком ,
который
извлекает
предоставляет
информацию
из
транспортный поступающего
транспортного потока. Звук буферируется с помощью ДОЗУ, которое обеспечивает также задержку в 1
с. Декодер полностью программируется и
управляется микропроцессором по 7- битовой адресной шине, 8- битовой шине
данных
предоставляемого микропроцессор
и
управляющим запроса
линиям R/W
прерывания
о некоторых
и CS.
декодер
возникающих
С
помощью
может
информировать
событиях
и запрашивать
обслуживание.
Рис. 2.6. Звуковой декодер MPEG-2 (связи с различными устройствами )
51
2.7. УВЧ-модулятор Схема состоит из двух узлов: УВЧ-модулятора с синтезатором частот и усилителя петли. Модулятор (рис. 2.7) состоит из следующих компонентов: • синтезатор частот ФАПЧ, управляемый по шине 12С; • амплитудный модулятор; • звуковой генератор для звуковой поднесущей; • схема восстановления постоянной составляющей видеосигнала для обеспечения правильного индекса модуляции.
Рис. 2.7. УВЧ-модулятор: А — схема восстановленияпостояннойсоставляющей Настройка модулятора осуществляется постоянным напряжением (0-24В), полученным от синтезатора частот ФАПЧ. Звуковой сигнал используется для
52
частотной модуляции звуковой поднесущей. Затем модулированная звуковая несущая добавляется к видеосигналу после восстановления постоянной составляющей и используется для амплитудной модуляции выбранной УВЧ-несущей. Модулированная УВЧ-несущая поступает в усилитель петли, который смешивает этот сигнал с сигналом, поступающим от второй антенны. Когда цифровой декодер находится в резервном режиме, генератор УВЧ с синтезом отключается по команде от микроконтроллера, поступающей по шине 12С. Усилитель петли продолжает работать нормально, поэтому сигнал от второй антенны может пройти по петле на гнездо высокочастотного выхода. 2.8. Приёмник спутникового цифрового телевизионного вещания На рис. 2.8 представлена полная блок-схема декодера спутникового цифрового телевизионного приемника РАСЕ. Приемник имеет последовательный порт RS-232
для прямого соединения с персональным компьютером и
высокоскоростной порт данных для связи с внешними устройствами . Для аутентификации в стандартный соединитель PCMCIA вставляется кредитная карта с микро-ЭВМ. В приемнике используются два типа синхросигналов . Собственными синхросигналами являются сигналы в 16 МГц для микропроцессора, 55
МГц -
для
видеодекодера MPEG
и
транспортного
демультиплексора , 25 МГц - для звукового декодера MPEG и 4,9 МГц - для микроконтроллера .
Тактовыми
сигналами
являются сигналы синхронизации в 25
для
синхронизации
МГц для обеспечения битовой
скорости и различных скоростей выборки видео- и звуковых сигналов.
53
данных
54
Рис. 2.8. Полная блок-схема интегрированного декодера приемника: А — генератор синхроимпульсов; Б— программируемый генератор опорных синхроимпульсов; В — высокоскоростной порт данных
Вопросы 1. Кратко опишите следующие средства: а) программный идентификатор (PID); б) интегрированный декодер приемника (ИДП); в) прямую коррекцию ошибок (ПКО). 2. Назовите три основных компонента канального декодера. 3. Объясните назначение следующих блоков в цифровом телевизионном приемнике: а) транспортный демультиплексор ; б) видеодекодер; в) декодер ПАЛ. 4. Какую функцию выполняет порт RS-232 в цифровом ИДП? 5. Объясните назначение блока условного доступа в цифровом телевизионном приемнике . 6. Какую роль играет рассредоточение энергии в цифровом телевизионном вещании?
55
3. СТАНДАРТ КОДИРОВАНИЯ ВИДЕО- И ЗВУКОВОЙ ИНФОРМАЦИИ MPEG-4 Следующим проектом группы MPEG Стандарт MPEG-4
охватывает
является стандарт MPEG-4.
видеосвязь,
цифровое
телевидение,
интерактивную графику, синтез изображений и позволяет передавать видео- и звуковую информацию с очень большими коэффициентами сжатия по узкополосным каналам связи. Этот стандарт необходим как в системах видеосвязи при использовании обычных телефонных сетей и относительно низкоскоростных каналов, так и для передачи движущихся изображений и звукового сопровождения через Интернет. Кроме того стандарт MPEG-4 обеспечивает
интерактивность,
возможность
пользователя
управлять
процессом передачи ему информации путем запросов, выбора вариантов и других действий. Основной особенностью MPEG-4 является объектно-ориентированный подход, сущность которого заключается в том, что передаваемое изображение со звуковым сопровождением представляется как совокупность видео- и аудиообъектов. Видеообъектами (V О) могут быть изображения людей и предметов, перемещающихся перед неподвижным фоном и сам неподвижный фон, а аудиообъектами ( АО) – голоса людей, музыка другие звуки. Связанные видео и аудиообъекты образуют аудио–визуальный объект (AVO), например передача изображения человека и его голоса. Совокупность видео и аудиообъектов составляют сцену. Для передачи сцен в MPEG-4 используется специальный язык для описания сцен BIFS (двоичный формат для сцен). Описание сцены представляет собой иерархическую структуру. Пример структуры описания сцены приведен на рис. 3.1. В этой сцене на лесной полянке присутствуют два персонажа: серый волк и красная шапочка, каждый из которых является аудио–визуальным объектом, состоящим из видеообъекта – движущееся изображение персонажа, и аудиообъекта – голоса этого персонажа.
56
Сцена
Красная шапочка
Серый волк
Поющая птичка
Изображение
Изображение
Изображение
Голос
ФОН
Звук
Голос
Рис. 3.1. Пример структуры описания сцены Верхний уровень структуры определяется сценой в целом. Сцена содержит неподвижный ФОН, состоящий из голубого неба, стволов и крон деревьев, зеленой травы, цветов и т.д. Кроме того в сцене присутствует поющая птичка, которая также является аудио–визуальным
объектом, включающим
видеообъект – изображение перелетающее с ветки на ветку, и аудиообъект – звуки исходящие от птички. Описание каждой сцены включает данные о координатах объектов в пространстве и их привязки ко времени. Видеообъекты могут размещаться в разных плоскостях видеообъектов (VOP), так что видеообъекты, находящиеся в более близких к зрителю плоскостях сцены перекрывают при движении видеообъекты, находящиеся в более дальних плоскостях. Сцена, представляемая пользователю может содержать все аудио-, видеообъекты или только часть этих объектов. Состав сцены может определяться поставщиком мультимедийной продукции. В интерактивном режиме пользователь может влиять на развитие сцены, подавая отсутствующие команды. Для
реализации
интерактивных
возможностей
стандарта MPEG-4
необходим не обычный телевизор, а персональный компьютер, подключенный к сети.
57
Стандарт MPEG-4
использует целый набор методов кодирования,
включая алгоритмы сходные с MPEG-2,
так и принципиально новые
основанные на понятии на понятии видеообъекта. Выбор метода кодирования в конкретном случае определяется характером изображения и требуемым коэффициентом сжатия информации. MPEG-4
эффективно сжимает как
натуральные, так и синтетические изображения и объединяет их при воспроизведении. Упрощенная
структурная
схема
видеодекодера
К
Кодер текстур
для
натуральных
изображений приведена на рис. 3.2.
Вход
+
ПДКП
-
MUX
ДК Выбор ПОДКП
БП1 БП2
ЗУ
+
БОД
Кодер формы
Рис. 3.2. Структурная схема видеодекодера MPEG-4 Структурная схема видеодекодера состоит: ПДКП – процессор прямого дискретнокосинусного преобразования; ПОДКП – процессор обратного дискретнокосинусного преобразования; К – квантователь;
58
ДК – деквантователь; ЗУ – запоминающее устройство; БП1, БП2 –
блоки формирующие предсказанные изображения в разных
режимах кодирования; БОД – блок оценки движения и формирования векторов движения; MUX – мультиплексор. В состав кодера также входят: кодер текстуры, кодер формы, вычитающее и суммирующее устройства и переключатель «Выбор» методов кодирования. На вход кодера поступают исходные видеоданные в цифровой форме, а на выходе формируется элементарный поток видеоданных. Рассмотрим основные методы кодирования натуральных изображений в стандарте MPEG-4. 1.
Видеообъекты, представляющие собой прямоугольные изображения
(обычные ТВ кадры), кодируются методом аналогичным применяемому в MPEG-2, т.е. с использованием гибридного кодирования. Метод включает предсказания с оценкой и компенсацией движения для макроблоков 16x16 пикселов и ДКП ошибки предсказания в блоках 8x8 пикселов. Предсказания в этом случае выполняется в блоке БП1. Этот вид кодирования имеет два уровня скорости передачи двоичных символов в потоке данных. Уровень очень низкой скорости передачи (VLBV) предназначен для передачи изображений с низким пространственным разрешением ( форматы QCIF и SQCIF), частотой кадров 10÷15 Гц и со скоростями передачи двоичных символов 5 ÷64 кбит/с. Этот уровень можно использовать в видеотелефонной связи. Уровень высокой скорости передачи (HBV) предназначен для передачи изображений с высоким пространственным разрешением со скоростями передачи двоичных символов 64 кбит/с ÷ 10 Мбит/с. Этот уровень может использоваться для передачи телевизионных программ. 2.
Кодирование основанное на содержании сцены, позволяет получить
существенно большее сжатие изображений за счет учета свойств видео-
59
объектов, присутствующих в сцене. Одной из возможностей, создаваемых этими методами, является кодирование
видеообъектов
сложной
формы.
Например,
в
качестве
видеообъекта может быть взята область изображения, отличающаяся от окружения яркостью или цветом. Эта область может перемещаться и деформироваться. компенсацией
При
движения
формировании смещаются
не
предсказанного прямоугольные
изображения
с
макроблоки,
а
выделенные области, которые к тому же могут изменять свою форму. При этом ошибка предсказания оказывается значительно меньше, и объем информации, содержащийся
в
разности
предсказанного
очередного кадра, существенно уменьшается.
и
настоящего
изображений
В кодере такой вариант
выполняется в блоке БП2. В то же время, вместо векторов движения, показывающих перемещение прямоугольного макроблока как целого, необходимо передавать параметры, характеризующие изменение координат и формы объекта. Эти параметры определяются и кодируются в кодере формы и после чего они через мультиплексор поступают в выходной поток данных. Данные о форме видеообъекта занимают значительно больше бит, чем простой вектор движения. Например, если граница области, выделенной как видеообъект представляется многоугольником, то для описания смещения и деформации этой области необходимо передать изменение координат всех углов многоугольника. Тем не менее, общий выигрыш в уменьшении передаваемой
информации
по
сравнению
с MPEG-2
оказывается
существенным. 3.
Для сжатия изображения неподвижного фона и текстур протяженных
объектов используется
метод кодирования, основанный
на « вэйвлет»-
преобразовании. Этот метод обеспечивает высокие степени сжатия и многоступенчатую масштабируемость по пространственному разрешению. Синтетические видеообъекты, создаваемые с помощью компьютерной
60
графики могут кодироваться рассмотренными ранее методами для натуральных изображений. Однако эффективнее использовать их параметрическое описание. В стандарте MPEG-4
используются
модель
человеческого
лица,
построенная на основе сетки из треугольных ячеек, которые заполняются текстурой, и трехмерная модель человеческого тела в виде трехмерной сетки. Двумерные изображения человека получаются с помощью построения проекции трехмерной модели на нужную плоскость. Форма,
текстура и
выражение
лица
параметрами FDP (Facial Definition Parameters)
в статистике
описываются
и в динамике – параметрами
FAP (Facial Animation Parameters). Для тела в статике задаются параметры BDP (Body Definition Parameters), а в динамике BAP (Body Animation Parameters). Статические параметры FDP и BDP обычно передаются в начале сеанса связи. Для воспроизведения мимики лица и движения тела в процессе разговора передаются параметры FAP и BAP. Синтетические изображения могут использоваться в системах видеосвязи в место настоящих изображений, при этом скорость передачи становится меньше, чем скорость передачи реального изображения. В некоторых случаях можно в приемной части системы получить информацию
об
изменениях
изображения
объекта
на
основе
другой
информации. Например, передача изображения лица говорящего человека. Движения рта и мимика во многом определяется произносимыми словами и могут
быть
синтезированы
на
основе
принятого
звукового
сигнала,
содержащего голос собеседника. В этом случае требуемая скорость цифровой передачи для осуществления видеосвязи еще уменьшается. Помимо лица и тела могут синтезироваться произвольные двумерные изображения в виде сеток с треугольными ячейками, заполняемыми текстурой. Для кодирования звуковой информации в MPEG-4 предусмотрено три уровня кодирования. 1.
Кодирование музыки с обеспечением высокого и среднего качества
61
выполняется также методами, что и в стандарте MPEG-2.
При этом
обеспечивается передача восьми каналов звука при скорости 16 ÷64 кбит/с на канал. Для передачи речи с высоким и средним качеством применяется метод
2.
– кодирование возбуждений с линейным предсказанием, который обеспечивает скорости передачи 6÷24 кбит/с при частотах дискретизации 8 кГц или 16 кГц. Параметрическое кодирование речи, которое обеспечивает сжатие при
3.
сохранении разборчивости до скоростей 2÷4 кбит/с при частоте дискретизации 8 кГц. Самые низкие скорости передачи 0,2 ÷1,2 кбит/с используются для искусственно синтезированной речи и синтезированной в соответствии со стандартом MIDI музыки. Кодирование аудиообъектов также обладает свойством масштабируемости. Например, на основном уровне потока данных может использоваться метод кодирования CELP, а дополнительный уровень обеспечивает качество звука, соответствующее кодированию по MPEG-4. Передачу данных в стандарте MPEG-4
рассмотрим с помощью
структурной схемы приведенной на рис. 3.3. Элементарные потоки ES
с видео- и аудиодекодеров поступают на
уровень синхронизации (SL – Syns Layer)
и блоках SL
преобразуются в
пакетизированные SL- потоки, в которые введены метки времени и данные о тактовых частотах для привязке к единой шкале времени различных видео- и аудиообъектов. Далее пакетизированные SL- потоки поступают на уровень DMIF. DMIF (Delivery Multimedia Integration Framework –
интегрированная
система доставки мультимедиа) – это протокол, обеспечивающий управление потоками данных для мультимедиа. Протокол DMIF обеспечивает посылку запросов от пользователя к источнику информации и пересылку запрошенных данных пользователю. Кроме того, DMIF
дает пользователю средства
управления в виде интерфейса пользователя DMIF – Application Interface (DAI),
62
позволяя подавать команды для выбора информации ( например фильма) и формируя сообщения о получении доступа к этой информации или о возникших при этом трудностях.
Элементарные потоки ES
SL
SL
SL
SL
SL
Sync уровень
SL потоки FlexMUX
DMIF уровень
MPEG TS
TransMUX уровень
FlexMUX FlexMUX потоки Файл
TransMUX потоки
Рис. 3.3. Формирование передаваемых потоков данных MPEG-4
DMIF
охватывает три основные сферы применения MPEG-4: передачу по
интерактивным сетям (Интернет), передачу по обычным вещательным каналам и видеозапись программ на компакт диски. На
уровне DMIF
возможно
объединение
в
блоках FlexMUX
пакетизированных SL- потоков во FlexMUX- потоки. Эта операция является не обязательной, так как под управлением DMIF
могут передаваться и
пакетизированные SL-потоки. Далее данные переходят на уровень TransMUX, где SL- или FlexMUXпотоки объединяются и преобразуются в транспортный поток (TransMUXпоток). В стандарте MPEG-4 этот поток не определен. В качестве его можно использовать, например, транспортный поток (TS) MPEG-2. Еще один вариант
63
образования TransMUX- потока это запись его в файл. Возможны и другие транспортные протоколы. Для реализации интерактивного телевидения и различных видов мультимедийного сервиса необходима передача информации от зрителя на головную станцию системы. Для этой цели используется обратный канал, скорость передачи для которого обычно значительно меньше, чем в прямом канале связи. Декодирование информации по стандарту MPEG-4 можно пояснить с помощью структурной схемы декодирующей части приведенной на рис. 3.4. На схеме показаны демультиплексор DMUX, буферные запоминающие устройства БЗУ1, БЗУ2, декодеры ДК и блок объединения БО. Вход Trans MUX потока
DMUX
ES
БЗУ1
ES
БЗУ1
ES
БЗУ1
ES
БЗУ1
ДК
БЗУ2
ДК
БЗУ2
ДК
БЗУ2
БО Выход
Рис. 3.4. Структурная схема декодирующей части устройства по стандарту MPEG-4 На вход устройства поступает транспортный поток, из которого в демультиплексоре выделяются элементарные потоки (ES), данные каждого ES записываются в соответствующие БЗУ1. Назначение БЗУ1 –
накапливать
неравномерно поступающие по каналам связи данные и по мере необходимости передавать их на декодер. Декодирование
элементарных
потоков
происходит
в
декодерах,
получаемые при этом данные видео- и аудиообъектов записываются в БЗУ2. Элементарные потоки относящиеся к одному объекту могут декодироваться
64
совместно. При демультиплексировании из общего потока данных выделяются также описание сцены и метки времени, поступающие на блок объединения. Данные от отдельных объектов считываются из соответствующих БЗУ2 и из них в блоке объединения формируются цифровые сигналы изображения и звука программы, поступающие далее на воспроизводящие устройства. При этом обеспечивается синхронизация всех видео- и аудиообъектов.
Вопросы 1. Что такое видео- и аудиообъекты в стандарте MPEG-4? 2. Какие методы используются в MPEG-4 при кодировании натуральных изображений? 3. Какие
методы
применяются
при
кодировании
синтетических
видеообразов? 4. Расскажите о назначении основных блоков структурной схемы видеодекодера. 5. Опишите процесс декодирования потока данных MPEG-4.
65
ПРИЛОЖЕНИЕ Словарь терминов и сокращений используемых в цифровом и аналоговом телевидении. Адаптивное распределение битов ( англ. adaptive bit allocation) – распределение битов при квантовании, например, по частотным поддиапазонам, выполняемое в зависимости от параметров кодируемого фрагмента сигнала. АДИКМ – адаптивная дифференциальная импульсно-кодовая модуляция (англ. ADPCM). Разновидность ДИКМ, в которой шаг квантования и параметры предсказания изменяются в зависимости от текущих свойств кодируемого сигнала. Амплитудная манипуляция (АМн) – один из видов модуляции, применяемый при передачи цифровых сигналов. Заключается в дискретном изменении амплитуды несущей. Арифметическое кодирование – один из видов кодирования с переменной длиной кодовых слов. Теоретически обеспечивает достижение наибольшей эффективности кодирования без потерь. АЦП – аналого-цифровой преобразователь. БИХ-фильтр – фильтр с бесконечной импульсной характеристикой. То же, что рекурсивный цифровой фильтр. БПФ – быстрое преобразование Фурье. Так называются алгоритмы ускоренного выполнения ДПФ. Вектор движения ( Вектор смещения) – пара чисел, выражающих найденные в результате оценки движения смещения блока изображения по двум пространственным координатам. Векторное квантование – замена группы отсчетов сигнала или группы элементов изображения на наиболее близкую по заданному критерию группу
66
отсчетов ( элементов), называемую эталонным вектором. Все эталонные векторы предварительно занесены в кодовую книгу. Видеоконференцсвязь – система видеосвязи, обеспечивающая обмен в реальном времени видеоинформацией и звуком между несколькими абонентами. Видео по заказу (англ. Video-on-Demand) – один из новых видов систем ТВ-вещания, в которых абонент может заказать передаваемую программу. Видеопоследовательность (video sequence) – самая крупная структурная единица потока видеоданных MPEG-1, MPEG-2. Встречается также название "видеоряд". Видеосервер – устройство на базе компьютера для хранения и воспроизведения аудиовизуальной информации. С видеосервера производится передача ТВ-программ. Видеостык – название интерфейсов для передачи цифровых ТВ-сигналов в соответствии о Рекомендацией ITU-R
ВТ 601,
в которой определены
параллельный видеостык и последовательный видеостык. Видеотелефон – один из видов видеосвязи, обеспечивающий обмен в реальном времени видеоинформацией и звуком между двумя абонентами. Внутрикадровое кодирование ( англ. intraframe) – сжатие видеоинформации
в
одном
отдельно
взятом
кадре,
основанное
на
уменьшение
внутрикадровой избыточности. Вэйвлет-преобразование – ортогональное одномерное или двумерное преобразование, в результате которого исходный сигнал разделяется на составляющую с низкой разрешающей способностью и составляющую с высокой разрешающей способностью. Гамма-коррекция – нелинейное преобразование телевизионных сигналов, выполняемое с целью коррекции нелинейностей передаточных характеристик различных узлов телевизионной системы, например, кинескопа. Одновременно
гамма-коррекция
способствует
67
уменьшению
влияния
квантования на качество изображения. Гибридное кодирование – метод кодирования движущихся изображений, используемый в MPEG-1, MPEG-2, MPEG-4
и сочетающий внутри-
кадровое и межкадровое кодирование. Головная станция – станция, с которой ведется вещание в системах кабельного ТВ, интерактивного ТВ и т. д. Деквантование –
операция, обратная квантованию. В результате
деквантования увеличивается число уровней квантования, которыми представляются значения отсчетов цифрового сигнала или другой информации. Декодер – устройство, в котором выполняется декодирование. Декодирование – операция, обратная кодированию. В результате декодирования
информация
преобразуется
к
виду,
который
она
имела
до
соответствующего кодирования. Декомпрессия – операция, обратная компрессии. Дематрицирование – операция, обратная матрицированию. Исходные сигналы вычисляются как суммы взятых с определенными коэффициентами сигналов, полученных при матрицировании. Демодуляция – операция, обратная модуляции. В результате демодуляции ( часто называемой детектированием) восстанавливается модулирующий сигнал. Дескремблирование – операция, обратная скремблированию. Восстановление исходного порядка следования информации. Децимация – см. Прореживание. ДИКМ –
дифференциальная импульсно-кодовая модуляция ( англ.
DPCM). Также называют « Кодирование с предсказанием». Вид ИКМ, в котором на основе значений одного или нескольких предшествующих отсчетов сигнала формируется предсказанное значение текущего отсчета, а по каналу связи передается ошибка предсказания - разность истинного и предсказанного значений текущего отсчета сигнала.
68
Дискретизация – представление непрерывного сигнала последовательностью его значений ( отсчетов или выборок), следующих через определенные интервалы
времени.
В
случае
дискретизации
изображения,
последнее
представляется матрицей отсчетов, заданным образом расположенных в плоскости изображения. Дискретная частота – частота дискретного сигнала, измеряемая в долях частоты дискретизации. ДКП – дискретное косинусное преобразование. ДПФ – дискретное преобразование Фурье. Заголовок (англ. header) – начальная часть структурной единицы потока данных. Как правило содержит синхрогруппу - один или более символов, по которым начало заголовка можно распознать в потоке данных. Иерархическая модуляция – способ модуляции, применяемый в DVB-T. Более важная для получения устойчивого изображения информация передастся с более высокой помехозащищенностью. Избыточность изображения – наличие в изображении составляющих, которые могут быть отброшены без существенного ухудшения визуально воспринимаемого качества воспроизводимого изображения. ИКМ – импульсно-кодовая модуляция ( англ. РСМ), Способ передачи информации в цифровой форме. Цифровой код каждого отсчета сигнала передается по каналу связи в виде последовательности импульсов. Интерактивное телевидение – ТВ-системы, в которых зритель может воздействовать на получаемую им программу, передавая сигналы по обратному каналу на головную станцию. Интерполяция – 1) преобразование дискретного сигнала в непрерывный, путем заполнения по определенному правилу промежутков времени ( или в случае изображений – пространства) между отсчетами дискретного сигнала; 2) увеличение количества отсчетов дискретного сигнала путем введения между отсчетами исходного дискретного сигнала дополнительных отсчетов, значения
69
которых определяются по заданным правилам. Кабельный модем – модем, с помощью которого компьютер подключается к сети кабельного ТВ, что обеспечивает высокую скорость передачи данных. Кадр – 1) в телевидении кадрами называются передаваемые и воспроизводимые одно за другим неподвижные изображения. Если частота передачи кадров достаточно велика, зритель воспринимает наблюдаемое изображение как непрерывно движущееся. При передаче кадры раскладываются на строки; 2) во многих случаях кадрами называют структурные единицы потока данных, например, звуковые кадры. Кадровое кодирование – один из режимов кодирования видеоинформации с чересстрочной разверткой в стандартах MPEG-1, MPEG-2. В этом режиме в каждый макроблок входят элементы изображения из обоих полей кадра. Канальное кодирование – кодирование, выполняемое непосредственно перед передачей информации по каналу связи, часто совмещаемое с модуляцией. Обычно имеет целью повышение помехоустойчивости, исключение идущих слишком много раз подряд символов "1" или "0" и т. д. Квадратурная амплитудная манипуляция ( КАМн) – один из видов модуляции, применяемый при передачи цифровых сигналов. Дискретно изменяются амплитуды двух квадратурных составляющих (cos и sin) несущей. Квантование – 1) преобразование непрерывного или дискретного сигнала путем округления каждого его значения до ближайшего уровня квантования; 2) при квантовании сигнала, уже представленного в цифровой форме, может уменьшаться количество битов на каждый отсчет сигнала. КЗФ – квадратурные зеркальные фильтры (англ. - QMF). Пара цифровых фильтров, имеющих взаимно-зеркальные АЧХ. Пара КЗФ позволяет разделить исходный цифровой сигнал на два сигнала частотных поддиапазонов, соответствующих нижней и верхней половинам его полосы частот, а пара обратных фильтров позволяет восстановить исходный сигнал по двум сигналам
70
частотных поддиапазонов. КИХ-фильтр – фильтр с конечной импульсной характеристикой. То же, что нерекурсивный цифровой фильтр. Кодек – устройство, которое может выполнять как функции кодера, так и функции декодера. Кодер – устройство, в котором выполняется кодирование. Кодирование – 1) представление результата квантования каждого отсчета дискретизированного сигнала двоичным числом по определенному правилу; 2) преобразование информации с какой-либо целью путем замены групп символов на другие группы символов по определенным правилам. Целями кодирования могут быть сокращение избыточности или сжатие информации, повышение
помехоустойчивости,
защита
информации
от
доступа
нежелательных лиц и т. д. Кодирование па Хаффмену – вариант кодирования с переменной длиной кодовых слов. Основан на алгоритме построения кодовой таблицы для кодирования данных с известными вероятностями появления всех символов. Обеспечивает
высокую
эффективность
кодирования
передаваемой
информации. Кодирование с переменной длиной кодовых слов ( Кодирование словами переменной длины, англ. VLC) – энтропийное кодирование. Уменьшение объема передаваемой информации достигается за счет того, что более вероятные символы представляются более короткими кодовыми словами. Кодирование с предсказанием – см. ДИКМ. Кодовая книга – перечень всех эталонных векторов, используемых при векторном квантовании. Коды Рида-Соломона – корректирующие коды, применяемые, в частности, в системах цифрового ТВ. Компенсация движения – формирование изображения из блоков ( фрагментов, макроблоков) другого ( опорного) изображения, путем их смещений.
71
Указанные смещения определяются векторами движения, найденными в результате оценки движения. Компенсация Движения используется при формировании предсказанных изображений в стандартах MPEG-1, MPEG-2, MPEG-4. Композитное кодирование – преобразование ПЦТС в цифровую форму. Компонентное кодирование – раздельное преобразование яркостного и цветоразностных сигналов в цифровую форму. Компрессия – 1) сжатие Информации путем эффективного кодирования, отбрасывания несущественных частей информации и т. д.; 2)
сжатие
динамического диапазона сигнала с помощью нелинейного преобразования. Корректирующие коды –
коды, позволяющие обнаруживать и или
исправлять ошибки, возникающие при передаче информации. ЛВС – локальная вычислительная сеть. Линейное предсказание ( англ. Linear Prediction) – формирование предсказанного значения сигнала ( см. ДИКМ) в виде линейной комбинации нескольких предыдущих значений. Макроблок – прямоугольная область изображения размером 16x16 пикселов, являющаяся основной структурной единицей кодирования изображений в стандартах MPEG-1, MPEG-2 и др. Для макроблоков выполняются оценка и компенсация движения. Маскирование звука – свойство слуха, используемое в MPEG-1, MPEG2 Audio и Долби АС-3. При наличии громкого звука с какой-либо частотой, более тихие звуки на близких частотах оказываются неслышимыми, то есть маскируются. Маскирование ошибки – замена группы символов, в которой обнаружена ошибка, на ранее принятую без ошибки группу символов. Масштабируемость (англ. Scalability) – свойство методов кодирования и синтаксиса потока данных MPEG-2, позволяющее получать изображение с неполным качеством, например, с уменьшенной разрешающей способностью,
72
из части потока видеоданных. В MPEG-4
свойство масштабируемости
распространено и на звуковое сопровождение. Матрицирование – формирование нескольких выходных сигналов в виде сумм нескольких входных сигналов, взятых с заданными коэффициентами. МДКП –
модифицированное дискретное косинусное преобразование.
Разновидность ДКП. Используется в Долби АС-3 и MPEG-1, MPEG-2 Audio, Layer III. Медианная фильтрация – отсчет выходного сигнала определяется как медиана распределения значений нескольких отсчетов входного сигнала. Медианная фильтрация может быть как одномерная, так и двумерная, то есть пространственная. Межкадровое кодирование ( англ. interframe) – сжатие видеоинформации, основанное на использование межкадровой корреляции. МККР – Международный консультативный комитет по радиосвязи. Ныне называется ITU-R. МККТТ – Международный консультативный комитет по телеграфии и телефонии. Ныне называется ITU-T. Модем – устройство, в котором выполняются модуляции и демодуляция. Модуляция – изменение одного или нескольких параметров электрического сигнала, называемого несущим колебанием или просто несущей, в соответствии со значениями модулирующего сигнала. Нелинейный монтаж – метод монтажа видеоматериалов, при котором монтируемые материалы находятся в ЗУ компьютера, и оператор имеет произвольный доступ к любому кадру. Нерекурсивный цифровой фильтр – цифровой фильтр, в котором значение формируемого отсчета выходного сигнала зависит только от значений отсчетов входного сигнала. Объект –
Основное понятие объектно-ориентированного подхода. В
MPEG-4 и MPEG-7 используются понятия видеообъекта, которым может быть
73
выделенный по какому-либо признаку фрагмент изображения или целое изображение, аудиообъекта, которым могут быть звуки, создаваемые одним источником, аудиовизуального объекта, в котором объединяются видеообъект и аудиообъект. Одночастотная сеть (Single Frequency Network - SFN) – один из вариантов вещания в DVB-T. Синхронная работа на одной частоте нескольких ТВпередатчиков, области приема сигналов которых перекрываются Опорное изображение (Reference Picture) – кадр или поле, по которому выполняется предсказание с компенсацией движения макроблоков кодируемого изображения. Оценка движения – определение смещений отдельных блоков, элементов, фрагментов изображения относительно их положений в другом (опорном) изображении. Найденное смещение выражается вектором движения. По результатам оценки движения может выполняться компенсация движения. Ошибка предсказания – разность предсказанного и действительного значений сигнала. При кодировании изображений ошибкой предсказания фрагмента ( макроблока) изображения может быть матрица чисел, каждый элемент
которой
равен
разности
значений
сигналов
соответствующих
элементов предсказанного и действительного фрагментов. Пакет – структурная единица потока данных, представляющая собой группу информационных символов ( битов, байтов и т. д.), передаваемых совместно по каналам связи. Как правило, пакет имеет заголовок, содержащий сведения о нем. Пакетные ошибки – ошибки, поражающие несколько соседних символов (битов) передаваемой информации. Пиксел ( или пиксель) ( от англ. pixel) – элемент дискретного изображения, яркость и цветность в пределах которого постоянны. ПК – персональный компьютер. Поле – полукадр при чересстрочной развертке, содержащий нечетные
74
строки кадра ( первое поле) или четные строки кадра ( второе поле). Поле передается и воспроизводится за один период вертикальной развертки телевизора. Полевое кодирование – один из режимов кодирования видеоинформации с чересстрочной разверткой в стандартах MPEG-1, MPEG-2. В этом режиме макроблок состоит из элементов изображения только первого или только второго поля. Поток данных ( англ. bitstream) – последовательность двоичных символов, передаваемых по каналу связи или записываемых на носитель информации. Состоит из структурных единиц ( пакетов, кадров и т. д.), снабженных заголовками. Преобразование Хаара – один из видов вэйвлет-пpeoбpазования. Программный
поток (Program Stream) –
один
из
видов
мультиплексированного (объединенного) потока данных MPEG-2, аналогичный системному уровню MPEG-1. В отличие от Транспортного потока, переносит данные только одной ТВ-программы. Прогрессивная развертка – вариант развертки, при котором все строки кадра передаются последовательно одна за другой. Пропущенный макроблок ( англ. skipped) –
макроблок, который не
передается, так как совпадает с соответствующим макроблоком опорного изображения. Прореживание – уменьшение количества отсчетов цифрового сигнала. В результате прореживания оставляют, например, каждый 2- й, или каждый 3- й, каждый 4-й и т. д. отсчет, а остальные отбрасывают. Пространственная фильтрация – преобразование изображения,
при
котором яркость и цвет каждого элемента формируемого изображения и определяются как заданная функция от яркостей и цветов элементов исходного изображения. Пространственная частота (для непрерывных изображений) – величина,
75
обратная
пространственному
периоду.
Показывает,
сколько
периодов
изменения какого-либо параметра, например, яркости, укладывается на единицу длины. Размерность м-1. Пространственный ( двумерный) фильтр –
устройство, с помощью
которого выполняется пространственная фильтрация. Профиль –
в MPEG2
понятие профиль характеризует сложность
используемых методов кодирования и наличие масштабируемости. Психоакустическая модель (ПАМ) – алгоритм, учитывающий свойства слуха, по которому в MPEG-1, MPEG-2 Audio
для каждого частотною
поддиапазона оценивается маскирование звуками из других поддиапазонов и рассчитывается распределение битов для квантования. ПЦТС – Полный Цветной Телевизионный Сигнал. Так называется сигнал аналогового
цветного
телевидения,
содержащий
сигнал
яркости,
цветоразностные сигналы на цветовой поднесущей, синхроимпульсы, гасящие импульсы и др. необходимые компоненты. Распределение битов ( англ. bit allocation) –
операция, применяемая во
многих методах сжатия изображений и звукового сопровождения. Заданное количество двоичных разрядов ( битов) при квантовании распределяется по нескольким составляющим общего потока данных, например, по частотным поддиапазонам. Расширение ( англ. extension) –
в MPEG-2 –
части потоков видео и
аудиоданных, содержащие данные, которые дополняют обязательные (базовые) части потоков. Рекомендация 601 – полное название Рекомендация ITU-R ВТ 601. Старое название Рекомендация 601 МККР или CCIR-601. Определяет параметры цифрового представления ТВ-сигналов телевидения обычной четкости. Рекомендация ITU-R BT-709-3 – документ, определяющий параметры цифрового представления сигналов ТВЧ, общие для Европы, США и Японии. Рекурсивный цифровой фильтр – цифровой фильтр, в котором значе-
76
ние формируемого отсчета выходного сигнала зависит как от значений отсчетов входного сигнала, так и от значений ранее сформированных отсчетов выходного сигнала. Решетчатые коды (trellis code) – корректирующие коды, используемые при канальном кодировании ( внутреннее кодирование) в системах цифрового ТВ. Синхроимпульсы – импульсы, входящие в состав полного телевизионного сигнала с целью синхронизации разверток в ТВ-приемнике с соответствующими развертками в передающей телевизионной камере. Кадровые синхроимпульсы предназначены для синхронизации вертикальной ( кадровой) развертки, а строчные синхроимпульсы - для синхронизации горизонтальной (строчной) развертки в телевизионном приемнике. Скорость передачи двоичных символов ( англ. bitrate) – число битов информации, передаваемых за секунду. Единицы измерения бит/с, кбит/с, Мбит/с и т. д. Скремблирование – перестановка битов, байтов или более крупных блоков передаваемой
информации
для
защиты
от пакетных ошибок.
Используется также для защиты информации от несанкционированного доступа. Слайс ( англ. slice) –
группа следующих один за другим в процессе
кодирования макроблоков. Для всех макроблоков слайса задается одинаковый параметр сжатия, который записывается в заголовок слайса. Соответствие блоков ( англ. block matching) – один из методов оценки движения, в соответствии с которым для каждого блока ( макроблока) кодируемого
изображения
находят
в
опорном
изображении
наиболее
соответствующую по выбранному критерию этому блоку область таких же размеров. Сотовое ТВ – системы ТВ-вещания СВЧ-диапазона, например MMDS, в которых используется сеть маломощных передатчиков.
77
Строка – часть кадра, обычно представляющая собой горизонтальную или слегка наклонную узкую полосу передаваемого изображения. В процессе передачи кадра строки передаются одна за другой. Сцена – одно из понятий MPEG-4.
Совокупность аудиовизуальных
объектов, наблюдаемых и слышимых зрителем. ТВЧ – телевидение высокой четкости. Текстура –
мелкая структура изображения. Заполнение контуров
объектов, предметов и т. д. Транспортный поток (англ. Transport Stream - TS) – мультиплексированный ( объединенный) поток данных MPEG-2,
состоящий из транспортных
пакетов и объединяющий данные нескольких телевизионных программ и служебную информацию. Уровень (англ. - Layer) – в MPEG-1, MPEG2 Audio определены три уровня кодирования звукового сопровождения: Layer I, Layer II, Layer III. Уровень ( англ. level) – в MPEG-2 определены уровни по разрешающей способности изображения. Фазовая манипуляция ( ФМн) – один из видов модуляции, применяемый при передаче цифровых сигналов. Заключается в дискретном и изменении фазы несущей. ЦАП – цифроаналоговый преобразователь. Цветовая поднесущая – частота, на которую с помощью модуляции переносятся цветоразностные сигналы при формировании ПЦТС в системах аналогового цветного телевидения. Цветоразностные сигналы – сигналы в цветном телевидении, несущие информацию о цвете и не влияющие на яркость изображения. Определяются формулами: ''' EEE RYRY − =−
''' (красный); EEE GYGY − =− ''' EEE BYBY − =−
(синий);
78
(зеленый);
где Е'R , E 'G, Е'B - сигналы красного, зеленого и синего цветов, соответственно, Е'Y -
яркостный сигнал. В системах цветного телевидения, как правило,
передаются только сигналы Е'R-Y и E 'B-Y, или их линейные комбинации, так как третий цветоразностный сигнал Е'G-Y может быть найден из соотношения ''' 0,30E0,59E0,11E0 RYGYBY −−− ++=
.
Цифровой фильтр – устройство, преобразующее последовательность отсчетов
входного
цифрового
сигнала
в последовательность
отсчетом
выходного цифрового сигнала. ЦПОС – цифровой процессор обработки сигналов (англ. - DSP). Частота дискретизации –
величина, обратная периоду следования
отсчетов дискретного сигнала. В соответствии с теоремой Котельникова частота дискретизации должна по меньшей мере в два раза превышать верхнюю граничную частоту дискретизируемого сигнала. Чересстрочная развертка – вариант развертки, при котором сначала передаются все нечетные строки кадра, составляющие первое поле, а потом все четные строки кадра, составляющие второе поле. Чересстрочная развертка применяется во всех широко используемых системах ТВ-вещания, так как позволяет увеличить в два раза частоту вертикальной развертки в ТВприемнике при заданной частоте передачи кадров. Шум квантования – ошибка, возникающая в результате квантования сигнала или вообще всякой информации. Элемент изображения - см. Пиксел. Элементарный поток (англ. Elementary Stream - ES) – поток данных на выходе кодера изображения или кодера звука. Элементарные потоки объединяются ( мультиплексируются) в мультиплексированные потоки, например, в транспортный поток MPEG-2.
79
Энтропийное кодирование – кодирование информации, позволяющее уменьшить ее объем без необратимых потерь. Основано на использовании статистических свойств источника сообщения, например, распределения вероятностей появления различных символов, слов и т. п. ( См. также Кодирование с переменной длиной кодовых слов.) Яркостный сигнал (сигнал яркости) – сигнал, несущий информацию о яркости всех элементов изображения и соответствующий видеосигналу чернобелого телевидения. В цветном телевидении яркостный сигнал формируется из прошедших гамма-коррекцию сигналов основных цветов Е'R ( красный), Е'G (зеленый), Е'B (синий) в соответствий с формулой '''' E0,30E0,59E0,11E =++ YRGB
.
АС-3 (Dolby АС-3) – стандарт сжатия многоканального звука. Используется, в частности, в системе цифрового ТВ ATSC. Adaptive bit allocation – см. Адаптивное распределение битов. ADPCM – Adaptive Differential Pulce Code Modulation. См. АДИКМ. ATM (Asynchronous Transfer Mode -
Асинхронный режим передачи) –
метод передачи в широкополосных цифровых сетях. Обеспечивает высокую пропускную способность. ATSC (Advanced Television Systems Committee -
Комитет по усовершен-
ствованным системам телевидения) – система цифрового ТВ-вещания, принятая в США. BER (Bit Error Rate) – частота ошибок на 1 бит передаваемой информации. Bit allocation – см. Распределение битов. B-frame (В-кадр) – от Bidirectional - двунаправленный. Кадр, макроблоки которого могут кодироваться с предсказанием по двум опорным изображениям, одно из которых следует до кодируемого В-кадра, а другое - после.
80
Block matching – см. Соответствие блоков. CCIR – Comite Consultativ International de Radio. – см. MKKP, ITU-R. CCIR-601 – см. Рекомендация 601. CCITT – Comite Consultatif International de Telegraphique et Telephoniqu. – См. МККТТ, ITU-T. CELP (Code Excited Linear Predictive -
кодирование возбуждений с
линейным предсказанием) – метод сжатия речи, обеспечивающий скорости передачи 6...24 кбит/с при частотах дискретизации 8 кГц или 16 кГц. CIF (Common Intermediate Format) -
формат кадра, содержащий
288 строк по 352 элемента в строке для сигнала яркости и 176 строк по 144 элемента в строке для каждого из цветоразностных сигналов. COFDM (Coded Orthogonal Frequency Division Multiplex) – OFDM,
сов-
мещенная с канальным кодированием. Content-based coding – кодирование, основанное на содержании. Один из вариантов кодирования изображений в MPEG-4, в котором могут кодироваться объекты сложной формы. D-box – см. Set-Top-Box. DCT – см. ДКП. интегрированная
DMIF (Delivery Multimedia Integration Framework -
система доставки мультимедиа) – протокол, обеспечивающий управление потоками данных в MPEG-4. DPCM (Differencial Pulce Code Modulation) – см. ДИКМ. Цифровое видеовещание) – система
DVB (Digital Video Broadcasting -
цифрового телевидения, развиваемая в Европе. Включает кабельное (DVB-C), спутниковое (DVB-S), наземное (DVB-T), а в перспективе и другие виды ТВвещания. Цифровой
DVD (Digital Versatile Disk -
Встречается также расшифровка Digital Video Disk) –
многосторонний
диск.
новый вид оптических
дисков, предназначенных, в частности, для записи видеопрограмм обычной
81
четкости (704x576), сжатых по MPEG-2. DVT (Digital Video Team) – (США), объявленный
в 1997
проект фирм Microsoft, Intel г.
и направленный
и Compaq
на использование
компьютера в качестве ТВ-приемников. Elementary Stream (ES) – см. Элементарный поток. Extension – см. Расширение. Field – см. Поле. Frame – см. Кадр. G.711, G.721, G.722, G.726, G.728, G.729
–
Рекомендации ITU-T,
описывающие методы сжатия речи для систем связи, в том числе и видеосвязи. GOP (Group of Pictures) –
группа изображений. В MPEG-1, MPEG-2 -
группа следующих друг за другом изображений ( кадров или полей), начинающаяся с I-кадра. Н.261, Н.262, Н.263 –
рекомендации ITU-T,
описывающие методы
кодирования видеоинформации для систем видеосвязи. Н.320, Н.321, Н322, Н.323, Н.324 – рекомендации ITU-T, описывающие построение систем видеосвязи. HDTV (High-Definition Television) –
телевидение высокого разрешения.
См. ТВЧ. I-frame (I- кадр) ( от Intraframe начинается GOP
внутрикадровый) – кадр, с которого
в стандартах MPEG-1, MPEG-2.
Все макроблоки 1- кадра
кодируются внутрикадровым методом. ISDN (Integrated Services Digital Network – цифровые сети интегрированного сервиса) - вид цифровых сетей связи с коммутацией каналов. Международная
ISO (International Organization for Standartization) –
организация по стандартизации. Основана в 1947 г., включает в качестве членов более 100 национальных организаций по стандартизации. ITU (International Telecommunication Union) –
Международный союз
электросвязи ( МСЭ). Одна из функций этой организации -
82
подготовка
Рекомендаций, которые фактически являются международными стандартами. ITU-R – организация –
часть ITU,
отвечающая за подготовку
Рекомендаций в областях радиосвязи и телевидения. ITU-T – организация – часть ITU, отвечающая за подготовку Рекомендаций в областях телефонии и цифровой передачи данных. JPEG (Joint Photographic Experts Group) – объединенная группа экспертов по фотографии. Рабочая группа ISO, созданная в 1986 г. и занимающаяся разработкой носящих такое же название стандартов кодирования и сжатия неподвижных изображений. JPEG-2000 – Новый проект группы JPEG, Направлен на увеличение степени сжатия и обеспечение сжатия анимированных изображений. Layer – см. Уровень. Level – см. Уровень. Linear Prediction – См. Линейное предсказание. Loseless JPEG (JPEG
без потерь) –
метод сжатия изображений,
разработанный группой JPEG и основанный на кодировании с предсказанием. Позволяет получить существенно меньшее сжатие, чем "обычный" JPEG. кодирование методом линейного пред-
LPC (Linear Predictive Coding) –
сказания (см. ДИКМ, Линейное предсказание). MDCT – см. МДКП. MMDS (Multichannel Microvave Distribution System -
Многоканальная
система распределения на СВЧ) – см. Сотовое ТВ. Motion JPEG – метод сжатия движущихся изображений, в котором каждый кадр
сжимается методом JPEG
независимо
от других
кадров
Используется, в частности, в системах видеомонтажа. MPEG (Moving Picture Expert Group) – группа экспертов по движущимся изображениям. Рабочая группа ISO, занимающаяся разработкой стандартов кодирования и сжатия видео- и аудиоданных. Название группы присутствует в названиях подготовленных ей стандартов.
83
MPEG-1 – стандарт сжатия движущихся изображений и звукового со провождения, утвержденный в 1993 году. В основном используется при записи видеопрограмм формата SIF на лазерные диски, обеспечивая сжатие до 1,5 Мбит/с. MPEG-2 – стандарт сжатия движущихся изображений и звукового со провождения, утвержденный в 1994 г. Является основой современных систем цифрового телевидения. MPEG-3 – проект группы MPEG по сжатию изображений ТВЧ. Вошел в MPEG-2 и ныне отдельно не существует. MPEG-4 – стандарт сжатия движущихся изображений и звука. Принят в 1998-1999 годах. В первую очередь направлен на передачу аудиовизуальной информации по узкополосным каналам связи и на создание интерактивных ТВсистем. MPEG-7 – проект группы MPEG, основная цель которого – стандартизация средств описания содержания видео- и аудиоинформации. Предположительный срок утверждения стандартов - 2001 год. MUSICAM (Masking Pattern Universal Subband Integrated Coding And Multiplexing) – метод кодирования звуковых сигналов, в значительной степени ставший основой стандарта MPEG-1 в части сжатия звука. NBC (Nonbackward compatible) –
один из вариантов кодирования
многоканального ( более двух каналов) звука в MPEG-2,
не совместимый
"назад" с MPEG-1. NTSC (National Television System Committee) –
система цветного
телевидения, используемая в США, Канаде, Японии и ряде других стран Азии и Америки. Формат кадра 4:3; число строк 525, из них видимых на экране - 480, частота кадров 30 Гц, частота полей - 60
Гц, развертка чересстрочная. Два
цветоразностных сигнала передаются одновременно с помощью квадратурной модуляции цветовой поднесущей, частота которой 3,58МГц. ОFDM (Orthogonal Frequency Division Multiplex) – ортогональное частот-
84
ное мультиплексирование. Один из видов модуляции, применяемых в системах цифрового ТВ. PAL (Phase Alternating Line) –
система цветного телевидения исполь-
зуемая во многих странах Европы, Китае и других странах. Формат кадра 4:3, число строк 625, из них видимых на экране - 576, частота кадров 25 Гц, частота полей, 50
Гц, развертка чересстрочная. Два цветоразностных сигнала
передаются одновременно с применением квадратурной модуляции цветовой поднесущей, частота которой 4,43 МГц. PCM (Pulce Code Modulation) – см. ИКМ. P-frame ( Р-кадр) ( от Predictive -
предсказанный) – кадр, макроблоки
которого могут кодироваться с предсказанием по опорному изображению, в качестве которого может использоваться предшествующий I-кадр или Р-кадр. Pixel (Picture element) – элемент изображения. См. Пиксел. Profile – см. Профиль. QAM – см. Квадратурная амплитудная манипуляция. QGIF (Quarter Common Intermediate Format) –
формат кадра, составляю-
щий 1/4 от формата CIF, т. е. 176x144 элементов сигнала яркости. QMF (Quadrature Mirror Filter) – см. КЗФ. QPSK (Quadrature Phase Shift Key - квадратурная фазовая манипуляция) – метод модуляции несущей, используемый в системах цифрового ТВ. Основан на дискретном изменении фаз двух квадратурных составляющих ( см. также ФМн). QSIF (Quarter SIF) – формат кадра, составляющий 1/4 от формата SIF. RLC (Runlength Coding) –
метод кодирования, при котором идущие
подряд одинаковые символы сообщения представляются парой чисел, одно из которых показывает количество идущих подряд одинаковых символов, а другое - сам символ. Scalability – см. Масштабируемость. Skipped macroblock – см. Пропущенный макроблок.
85
система цветного телевидения,
SECAM (Sequentiel Coleur A Memoir) –
используемая во Франции, странах бывшего СССР, странах восточной Европы и некоторых странах Азии и Африки. Формат кадра 4:3, число строк 625, из них видимых на экране - 576, частота кадров 25 Гц, частота полей 50 Гц, развертка чересстрочная. Два цветоразностных сигнала передаются поочередно, через строку. Применяется частотная модуляция цветовой поднесущей, начальная частота которой 4,406 МГц для красного цветоразностного сигнала и 4,250 МГц - для синего. Set-Top-Box – приставка для приема программ цифрового ТВ. Single Frequency Network (SFN) – см. Одночастотная сеть. SIF – 1) Standard Interchange Format.
Формат кадра, содержащий 288
строк по 352 элемента изображения в строке или 240 строк по 352 элемента изображения в строке; 2) Source Input Format. Формат кадра, со держащий 240 строк по 320 элементов изображения в строке. SQCIF (Sub-Quarter Common Interchange Format) –
формат кадра,
содержащий 128x96 элементов сигнала яркости. S-Video – стандарт интерфейса телевизионной и видеоаппаратуры, в соответствии с которым по отдельным проводам передаются сигнал яркости с синхроимпульсами (Y)
и сигнал цветности, т. е. цветовая поднесущая,
промодулированная цветоразностными сигналами ( С). Обозначается также Y/C. Т.120 – Рекомендация ITU-T, определяющая взаимодействие программмно-аппаратных средств при обмене данными в системах видеосвязи. Transport Stream (TS) – см. Транспортный поток. Video-on-Demand – см. Видео по заказу. VLBV (Very Low Bitrate Video) – уровень очень низкой скорости передачи данных в MPEG-4. VLC (Variable Length Coding) –
см. Кодирование с переменной длиной
кодовых слов.
86
VSB (Vestigial side band) – амплитудная модуляция с частично подавленной боковой полосой. Wavelet-Transform – см. Вэйвлет-преобразование. 4:2:2, 4:2:0 и т.д. – варианты форматов дискретизации яркостного и цветоразностных сигналов. 5.1 ( или 5,1) –
условная запись в методах кодирования многоканального
звукового сопровождения, показывающая, что пять основных каналов звука, и один узкополосный низкочастотный.
87
Библиографический список 1. Смирнов, А.В. Основы цифрового телевидения: учеб. пособие / А.В. Смирнов. - М.: Горячая линия-Телеком, 2001. 2. Ибрагим, К.Ф. Телевизионные приемники: пер. с англ. / К.Ф. Ибрагим. – М.: Мир, 2000. 3. Птачек, М. Цифровое телевидение. Теория и техника: пер. с чеш. под ред. Л.С.Виленчика / М. Птачек. – М.: Радио и связь, 1998.
88
Содержание 1. ЦИФРОВОЕ ТЕЛЕВИЗИОННОЕ ВЕЩАНИЕ ..........................................3 1.1. Преобразование телевизионного изображения в цифровую форму ...........3 1.2. Требования к полосе .......................................................................................5 1.3. Качество изображения ....................................................................................7 1.4. Общая характеристика системы .....................................................................8 1.5. Кодирование программ ...................................................................................9 1.6. Кодирование видеоинформации...................................................................10 1.7. Устройство кодирования звука ....................................................................22 1.8. Пакет служебных данных .............................................................................24 1.9. Структура элементарного программного потока ........................................24 1.10. Мультиплексирование программ ...............................................................25 1.11. Структура пакетов транспортного потока .................................................27 1.12. Прямая коррекция ошибок .........................................................................29 1.13. Модуляция ...................................................................................................32 1.14. Управление цифровым мультиплексором .................................................40 Вопросы ................................................................................................................41 2. ЦИФРОВЫЕ ТЕЛЕВИЗИОННЫЕ ПРИЕМНИКИ ..................................42 2.1. Общая характеристика системы ...................................................................42 2.2. Управление системой....................................................................................44 2.3. Канальный декодер ......................................................................................45 2.4. Транспортный демультиплексор .................................................................47 2.5. Видеодекодер MPEG.....................................................................................49 2.6. Звуковой декодер ..........................................................................................50 2.7. УВЧ-модулятор ............................................................................................52 2.8. Приёмник спутникового цифрового телевизионного вещания .................53 Вопросы ................................................................................................................55 3. СТАНДАРТ КОДИРОВАНИЯ ВИДЕО- И ЗВУКОВОЙ ИНФОР-МАЦИИ MPEG-4.................................................................................................................56 89
ПРИЛОЖЕНИЕ ..............................................................................................66 Словарь терминов и сокращений используемых в цифровом и аналоговом телевидении..........................................................................................................66 Библиографический список ...........................................................................88
90
Цифровое телевидение Часть I
Редактор Л.Ф. Юринова Техн. редактор Н.М. Белохонова
Подписано в печать. Формат 60x84/16. Усл. печ. л. 3,3. Уч.-изд. л. 1,95. Тираж 100 экз. Заказ. ___________________________________________________________________ Издательство ДВГТУ, 690950, Владивосток, Пушкинская,10 Типография издательства ДВГТУ, 690950, Владивосток, Пушкинская, 10
91