МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Южно-Российский государственный университет экономики и сервиса
ВИДЕОТЕХН...
373 downloads
265 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Южно-Российский государственный университет экономики и сервиса
ВИДЕОТЕХНИКА Пособие для студентов дневной и заочной форм обучения направлений 654200, 552500 “Радиотехника” специальностей 200700 “Радиотехника”, 230200 “Сервис бытовой радиоэлектронной аппаратуры”, 201500 "Бытовая радиоэлектронная аппаратура"
ШАХТЫ 2003
УДК 621.397 (075.8) ББК 32.94я73 П 625 Составители: к.т.н., ст. преподаватель кафедры РЭС В.В. Семенов ст. преподаватель кафедры РЭС И.В. Кокарев Рецензенты: к.т.н., доцент кафедры РЭС Ю.Б. Ханжонков к.т.н., доцент кафедры «Информационные системы и радиотехника» А.Н. Береза П 652 Семенов В.В. Видеотехника: Пособие / В.В. Семенов, И.В. Кокарев. – Шахты: Изд-во ЮРГУЭС, 2003. – 92с. Данное пособие предназначено для студентов очной и заочной форм обучения направлений 654200, 552500 “Радиотехника”, специальностей 200700 “Радиотехника”, 230200 “Сервис бытовой радиоэлектронной аппаратуры”, 201500 "Бытовая радиоэлектронная аппаратура" при изучении дисциплины "Видеотехника". В пособии изложен основной материал по дисциплине "Видеотехника" с использованием иллюстраций, а в конце приведен библиографический список.
УДК 621.397 (075.8) ББК 32.94я73
© Южно-Российский государственный университет экономики и сервиса, 2003 © В.В.Семенов, И.В.Кокарев, 2003
2
ОГЛАВЛЕНИЕ Введение...........................................................................................................................4 1 ТРЕБОВАНИЯ, ПРЕДЪЯВЛЯЕМЫЕ К ВИДЕОМАГНИТОФОНАМ..................................................................................5 2 СПОСОБЫ МАГНИТНОЙ ВИДЕОЗАПИСИ...........................................................9 3 СИСТЕМЫ ВИДЕОЗАПИСИ...................................................................................14 4 АНАЛОГОВЫЕ ФОРМАТЫ ВИДЕОЗАПИСИ .....................................................16 4.1 Формат Q (Ampex, H3TM) и В ..........................................................................16 4.2 Формат C ("Кадр-103СЦ", Amex - серия VPR, Sony – серия BVH, H3TM) ....................................................................................17 4.3 Видеомагнитофоны формата BETACAM ........................................................20 4.3.1 Betacam .........................................................................................................20 4.3.2 Betacam SP, SP 2000Pro, SP1000 ................................................................24 4.4 Видеомагнитофоны семейства U-matic ............................................................27 4.5 Видеомагнитофоны формата VHS ....................................................................33 4.6 Форматы Video-8 и Нi8 ......................................................................................39 4.7 Формат MII ..........................................................................................................42 5 ОСОБЕННОСТИ ЦИФРОВОЙ ВИДЕОЗАПИСИ.................................................43 5.1 Цифровое представление компонентного сигнала..........................................43 5.2 Цифровое представление композитного сигнала (полного телевизионного сигнала) .....................................................................44 5.3 Цифровое представление звукового сигнала ...................................................44 5.4. Технология компрессии MPEG ........................................................................45 6 ЦИФРОВЫЕ ФОРМАТЫ ВИДЕОЗАПИСИ...........................................................57 6.1 Цифровой формат D1 .........................................................................................57 6.2 Цифровой формат D2 .........................................................................................58 6.3 Цифровой формат D3 .........................................................................................60 6.4 Цифровой формат DCT ......................................................................................61 6.5 Цифровой формат D5 ........................................................................................61 6.6 Цифровой формат Digital Betacam ...................................................................62 6.7 Цифровой формат D6 .........................................................................................64 6.8 Цифровой формат D9 (Digital S) .......................................................................64 6.9 Цифровой формат Betacam SX ..........................................................................67 6.10 Цифровой формат DV ......................................................................................71 6.11 Цифровой формат DVCAM .............................................................................72 6.12 Формат цифровой записи D7 (DVC PRO) ......................................................74 6.13 Формат DVCPRO 50 .........................................................................................74 6.14 Формат DVCPRO 100 .......................................................................................75 6.15 Цифровой формат видеозаписи MPEG IMX (D10) .......................................75 7 ВИДЕОЗАПИСЬ НА ДИСКИ ...................................................................................78 7.1 Фотографическая видеопластинка ....................................................................78 7.2 Магнитная видеопластинка ..............................................................................78 7.3 Механическая видеозапись ................................................................................78 7.4 DVD-Video...........................................................................................................79 Заключение ................................................................................................................... 88 Библиографический список..........................................................................................92
3
ВВЕДЕНИЕ Пособие состоит из семи разделов, охватывающих полный курс лекций по дисциплине "Видеотехника". Первый раздел содержит требования, предъявляемые к видеомагнитофонам. Во втором и третьем разделах приводятся описания основных способов магнитной записи и характеристика систем видеозаписи. В остальных разделах приводится подробное описание принципа работы аналоговых и цифровых видеомагнитофонов и видеопроигрывателей, а также дается их сравнительная характеристика. В пособии содержатся рисунки, схемы и таблицы, необходимые для освоения материала. В конце пособия приводится библиографический список.
4
1 ТРЕБОВАНИЯ, ПРЕДЪЯВЛЯЕМЫЕ К ВИДЕОМАГНИТОФОНАМ
Видеомагнитофон - сложное устройство, в котором одновременно и синхронно работают несколько различных по назначению и принципу действия следящих систем, блоки преобразования и обработки широкополосного видеосигнала, устройства шумоподавления и устранения влияния помех на выходной сигнал, механизмы транспортирования ленты и вращения головок. Своеобразие конструкции видеомагнитофонов определяется спецификой структуры и параметров телевизионного сигнала и особенностями восприятия изображения на экране телевизора. Основным отличием видеосигнала от звукового является его широкополосность. При принятом в России и СНГ стандарте телевизионный сигнал занимает полосу частот 50 Гц 6,5 МГц. Отношение максимальной частоты в спектре к минимальной равно 1,З·105, что составляет 18 октав (для акустического сигнала соответственно 20 Гц - 20 кГц, 103, 10 октав). Таким образом, для записи телевизионного сигнала необходимо иметь тракт, в 130 раз более широкополосный, чем для звукозаписи. Условия записи таких широкополосных сигналов существенно различны, поэтому осуществлять эффективную запись сигналов в частотном диапазоне, равном 18 октавам, практически невозможно [25]. При воспроизведении широкополосных сигналов также возникают принципиальные трудности, связанные с тем, что воспроизведен с достаточным уровнем может быть только тот сигнал, длина волны которого не превышает длины рабочей поверхности головки (эта величина примерно в 100 раз больше). Таким образом, прямая запись видеосигнала невозможна, и для обеспечения записи необходимо переместить его в область более высоких частот, осуществив тем самым относительное сжатие по частоте. В то же время значительное смещение спектра в высокочастотную область также нежелательно, поскольку появление в спектре сигнала высокочастотных составляющих приводит, в свою очередь, к новым техническим трудностям: во-первых, в сердечниках головок возрастают потери на вихревые токи; во-вторых, запись высоких частот требует применения больших скоростей записи-воспроизведения (требуется большой расход пленки). Например, при транспонировании в ВЧ область видеосигнала до 7,5МГц, при плотности записи 250 периодов/мм скорость ленты для продольной записи: vз=7,5·106/250=30м/с. Для записи часа видеоматериала понадобится рулон ленты длиной L= 3600vз ≈ 108км, так что запись продолжи 5
тельной программы обычными методами также оказывается неосуществимой. Возникающие трудности тем более велики, чем выше верхняя записываемая частота. Поэтому для преобразования сигнала целесообразно выбрать такой метод, при котором минимально расширяется спектр. Известно, что в наибольшей степени этому требованию удовлетворяет однополосная амплитудная модуляция. Однако АМ обладает малой помехозащищенностью. После демодуляции АМ модуляционный шум приводит к зашумленности изображения, появлению на нем темных и светлых точек и полос, что недопустимо. Избежать влияния модуляционного шума можно, если применить в качестве метода преобразования сигнала частотную модуляцию. В этом случае воспроизводимый сигнал перед демодуляцией можно ограничить по амплитуде, устранив тем самым действие паразитной АМ. Ширина спектра ЧМ сигнала зависит от индекса модуляции β и равна ∆ Fчм= 2Fмакс ( β +1), где β = ∆f Fмакс ; ∆ f - девиация частоты; Fмакс. - максимальная частота модулирующего сигнала [25]. Помехоустойчивость частотной модуляции по отношению к аддитивному шуму определяется индексом модуляции. В магнитной видеозаписи принята система ЧМ, в которой β =0,1. Ширина спектра записываемого ЧМ сигнала в этом случае не отличается от спектра АМ сигнала и равна удвоенной полосе видеосигнала. Кроме того, чтобы снизить максимальную записываемую частоту, несущая частота ЧМ сигнала выбирается всего на 40 50% выше Fмакс.. При столь малом индексе модуляции система ЧМ ухудшает отношение сигнал-шум по аддитивным шумам, в основном создаваемыми усилителем и головками воспроизведения. Однако преимущество ЧМ перед АМ в данном случае состоит в том, что в случае ЧМ при любом индексе модуляции с помощью амплитудного ограничения удается полностью избавиться от паразитной АМ и тем самым устранить влияние преобладающих в тракте записи-воспроизведения мультипликативных помех. Оценим, каким требованиям по допустимому уровню собственных шумов должен удовлетворять усилитель воспроизведения. Влияние шумов на видеосигналы определяется визуальным характером их восприятия. Низкочастотные составляющие шума вызывают мерцание изображения, высокочастотные ухудшают разрешающую способность, приводят к появлению белых и черных точек на гладких полях изображений. При оценке помехозащищенности видеотракта необходимо учитывать с помощью специальной весовой функции неодинаковую чувствительность глаза к различным по частоте составляющим шума. Помехи малозаметны, если с учетом весовой 6
функции отношение сигнал-помеха на выходе видеотракта составляет не менее 40 дБ. Учет весовой функции эквивалентен улучшению этого отношения на 10 дБ. Следовательно, минимальное отношение сигнал-помеха на выходе ЧМ канала видеомагнитофона должно составлять 30 дБ. При ЭДС воспроизводящей головки около 1 ... 2 мВ собственный шум усилителя воспроизведения, приведенный к входу, не должен превышать 5 ...10 мкВ. Создание такого усилителя с учетом его широкополосности является сложной технической задачей. Особенности визуального восприятия изображений определяют также высокие требования к стабильности скоростей записи-воспроизведения. Несовпадение скоростей записи и воспроизведения приводит к появлению "зубчатости" вертикальных линий и их искривления, к искажению цветопередачи, неустойчивости синхронизации и снижению четкости. Допустимое значение временной ошибки зависит от режима синхронизации. Значение коэффициента колебания скорости для черно-белого изображения должно быть в 100 раз меньше коэффициента детонации лучших магнитофонов - 10-6. При записи цветных сигналов требования оказываются еще более высокими. Различные системы цветного телевидения имеют разную чувствительность к нестабильности временных соотношений в сигнале. В системе PAL допуск на цветовую поднесущую в студийной аппаратуре составляет ± 5 Гц (fц.п==4433 618,75 Гц), в системе NTSC ± 10 Гц (fц.п=3579545 Гц) [29]. Это соответствует относительной нестабильности ± 10-6и 3·10-6. Система SECAM оказывается наименее чувствительной к временной нестабильности, т.к. передача цветовой информации осуществляется с помощью частотной модуляции поднесущих и допуск на нестабильность поднесущих в этом случае составляет ± 2000Гц (fц.п.кр.=4406250 Гц и fц.п.син.=4250000 Гц). Практически система SECAM не предъявляет дополнительных требований к временной стабильности по сравнению с черно-белым сигналом. Наиболее высокие требования по стабильности временных соотношений предъявляются к профессиональным видеомагнитофонам, используемым в студиях в качестве источников телевизионного сигнала. В этом случае видеомагнитофон (ВМ) должен обеспечить: синфазность импульсов кадровой и строчной синхронизации и соответствующих импульсов студийного синхрогенератора; идентичность фазы воспроизводимой цветовой поднесущей и формируемой в студийном оборудовании. Выполнить эти требования при обычной продольной записи практически невозможно. Не говоря об исключительно высоких требованиях, предъявляемых к точности изготовления деталей и узлов лентопротяжного механизма, точности транспортирования ленты, параметрам двигателя. 7
Итак, сформулируем требования, которым должен удовлетворять аппарат, пригодный для записи телевизионных изображений [25]: 1. Для обеспечения записи высокочастотных компонентов видеосигнала скорость записи-воспроизведения должна быть не менее 30 м/с. В то же время обеспечить запись на один километровый рулон ленты программы продолжительностью 30... 40 мин можно только в том случае, если скорость ленты не будет превышать 38 см/с. 2. Коэффициент колебаний скорости не должен превышать 10-6, что в 100 раз меньше коэффициента детонации у лучших студийных магнитофонов. Даже растяжение ленты более чем на порядок превышает эту допустимую величину, хотя растяжение и не является основным источником расхождения скоростей записи и воспроизведения. 3. Система преобразования сигнала, с одной стороны, не должна значительно расширять его спектр, а с другой стороны, должна быть достаточно помехоустойчивой, чтобы не предъявлять чрезмерных требований к допустимому уровню шумов канала воспроизведения.
8
2 СПОСОБЫ МАГНИТНОЙ ВИДЕОЗАПИСИ Наиболее очевидное компромиссное решение поставленной задачи заключается в делении полного телевизионного сигнала на субсигналы, имеющие более узкий спектр, раздельной записи этих субсигналов на ленту и последующем суммировании их после воспроизведения. Известны два способа разделения сигнала на субсигналы - частотное и временное. Запись по первому из них была реализована в 1953 г. в аппарате фирмы RCA (Radio Corporation of America). Сложный цветной телевизионный сигнал был разделен на красный, синий и зеленый компоненты. У каждого из них выделялась часть спектра в полосе до 1,5 МГц и записывалась на отдельную дорожку. На четвертой дорожке записывались высокочастотные составляющие спектра видеосигнала в полосе 1.5...3,5 МГц. Отдельные дорожки отводились для сигналов звукового сопровождения и синхронизации. Запись осуществлялась продольно на ленту шириной 12,7 мм по шести дорожкам. Скорость движения ленты была выбрана 9,15 м/с, время записи составляло 4 мин при длине ленты более 2 км. Требовалось применять сложные системы управления средней и мгновенной скоростями движения и натяжения ленты. Многие требования, предъявляемые к ВМ, остались не выполненными, а качество записи - невысоким [25]. Временное деление телевизионного сигнала было реализовано при видеозаписи по способу Бинга Кросби в 1952 г. По этому способу непрерывный видеосигнал вначале подвергался дискретизации с частотой, кратной частоте строчной синхронизации. Отсчеты видеосигнала распределялись по десяти каналам и записывались на ленту по отдельный дорожкам. При частоте дискретизации в каждом канале, равной 339 кГц, суммарная полоса частот записываемого видеосигнала составила 1,695 МГц. Для записи сигналов строчной и кадровой синхронизации использовалась отдельная, одиннадцатая, дорожка, а для записи звука – двенадцатая дорожка. Скорость ленты составляла 2,5 м/с, длительность записи – 16 мин. Основным недостатком способа записи с временным делением явились искажения изображения из-за фазовых рассогласований между сигналами, воспроизводимыми с разных дорожек. Эти искажения проявились в виде мерцания изображений, нерезкости, скачков строк, раздваивания изображений, муара и др. Качество записи оказалось крайне низким, и этот способ также никакого распространения не получил, причем в обоих случаях основным источником искажений явилась практическая невозможность создания идентичных каналов для записи отдельных субсигналов, а также неизбежные рассогласования сигналов, воспроизводимых с параллельных дорожек. Решающим шагом в развитии техники видеозаписи явился отказ от продольной записи на ленту и переход к строчной записи. В этом случае 9
видеосигнал не делится на субсигналы, а записывается целиком, но отдельными строчками, расположенными поперек ленты. Есть две разновидности строчной записи, применяемые в видеозаписи: поперечно-строчная и наклонно-строчная. На рисунке 2.1 показано расположение дорожек при поперечно-строчной (а) и наклонно-строчной (б) записями.
а б Рис. 2.1. Расположение дорожек при поперечно-строчной (а) и наклонно-строчной записями (б) Рассмотрим способ поперечно строчной записи, разработанный в 1956 г. фирмой Ampex (США) (формат записи Q). Поперечно-строчная запись осуществляется четырьмя магнитными головками, записывающими строки относительно небольшой протяженности (меньше ширины применяемой ленты). Этот принцип позволил достичь высокой скорости движения магнитной ленты относительно головки за счет быстрого вращения барабана с головками (15000 мин-1) в поперечном направлении при относительно медленном продольном продвижении ленты (39,7 см/с) в ВМ. Поскольку магнитные головки записывают дорожки поперек ленты, то использовалась относительно широкая двухдюймовая (50,8 мм) лента. Головки записывают сигнал поочередно, при чем во избежание перерывов запись в начале и конце строчек производится с перекрытием одновременно двумя смежными головками. Требования к стабильности скорости ленты оказываются сравнительно низки, поскольку они определяются только необходимостью обеспечить при воспроизведении попадание головок на строчки записи. Для устранения влияния низкочастотных колебаний и дрейфа скорости в видеомагнитофонах используется система автоматического регулирования скорости ленты (САРСЛ) [25]. Несмотря на высокую (40 м/с) скорость записи и воспроизведения, скорость ленты сравнительно невелика, и в рулоне, содержащем 1,5 км ленты, может быть размещена 1,5-часовая программа. В видеомагнитофоне использована система ЧМ преобразования видеосигнала с низкой несущей частотой и малой девиацией частоты. Выбор таких параметров модуляции 10
не позволил применить в качестве устройств преобразования классические частотные модуляторы и демодуляторы. Выбор низкого, меньше двух, отношения несущей частоты ЧМ сигнала f 0 к высшей модулирующей частоте Fmax определяет перекрытие спектров видео - и ЧМ сигналов. Это наглядно видно из приведенных на рисунке 2.2 спектров исходного сигнала (рис. 2.2а) и сигнала на выходе ЧМ модулятора (рис. 2.2б). В области частот от f 0 − Fmax до Fmax спектры накладываются один на другой, и поэтому в ЧМ модуляторах видеомагнитофонов приняты меры, не допускающие попадания модулирующего сигнала на выход модулятора, а демодулятор построен таким образом, что в нем также обеспечено разделение спектров видеосигнала и ЧМ колебания. Выбор низкого индекса модуляции при видеозаписи явился вынужденной мерой, позволившей минимально расширить спектр записываемого сигнала по сравнению с видеосигналом. Но в то же время это повлекло за собой ужесточение требований к усилителям воспроизведения по допустимому уровню собственных шумов. Для их снижения во входных каскадах усилителей применяют малошумящие полевые транзисторы.
Рис. 2.2. Спектры видеосигнала (а) и ЧМ сигнала на выходе модулятора (б) В 1962 г. была реализована магнитная запись цветных изображений, которая кроме усложнения электронных схем не внесла ничего принципиально нового в ВМ. Длительное время в телевизионной аппаратуре применялись почти исключительно полные цветовые видеосигналы, кодированные по одной из трех систем - NTSC, PAL, SECAM. Затем все более широко стали применяться компонентные видеосигналы - сигналы яркости и цветности. Сигналы цветности без ущерба для качества изображения можно передавать в сокращенной (примерно в 4 раза, т.е. до 1,5-2 мГц) полосе частот. Вследствие этого становится возможной передача суженого спектра сигнала цветности в той же полосе, которая отведена для передачи яркостного сигнала, путем частотного уплотнения. Для этого цветовую поднесу 11
щую переносят в область частот, лежащую ниже спектра ЧМ-сигнала. Сигнал цветности суммируется с ЧМ-сигналом и вместе записывается на магнитную ленту. Частотно-модулированный сигнал действует в качестве ВЧподмагничивания (как в звукозаписи), поэтому искажения сигнала цветности невелики. В 1975 г. уменьшить большую ширину применявшейся магнитной ленты позволила наклонно-строчная запись, сократилось также количество магнитных головок. Суть способа такого вида записи состоит в том, что в зоне контакта ленты с вращающимися видеоголовками ей придается изгиб в форме отрезка винтовой спирали, внутри которой вращается диск с одной или двумя видеоголовками. На рисунке 2.3 показано расположение барабана с видеоголовкой и лентой, расположение ленты в механизме, а также траектория ленты в кассетном видеомагнитофоне.
1 – кассета; 2 – барабан; 3 – видеоголовки; 4 – ведущий вал; 5 – прижимной ролик; 6 – направляющие ролики; 7 – стирающая головка; 8 – головки звука и систем слежения; 9 – лента
Рис. 2.3. Расположение барабана с видеоголовкой и ленты при наклонно-строчной записи (а), расположение ленты в механизме типа Ω - петли (б), α - петли (в) и схема М-траектории ленты в кассетном видеомагнитофоне (г) Строка записи при этом расположена под небольшим углом к краю магнитной ленты. При угле охвата лентой барабана 360о достаточно одной головки. Для двухголовочного ВМ угол обхвата составляет 180о. Различному углу охвата соответствуют и различные типы ЛПМ: для 180о схема 12
хода напоминает латинскую букву U-ВМ с таким ЛМП имеет название "U-matic". Для угла охвата 360о - двух типов Ω - и α - петли (рис. 2.3б, 2.3в). Одно из достоинств этого вида записи - возможность изменения темпа движения (в кадре) воспроизводимого изображения вплоть до его остановки, которое достигается изменением скорости движения ленты в ВМ при сохранении скорости вращения головок. При этом изменяется угол наклона головок относительно строчек записи, в результате чего возникает шумовая полоса [25]. Для осуществления таких режимов нужно, чтобы длина строки записи была бы достаточна для записи целого поля, однако в этом случае необходима коррекция временных искажений. Для уменьшения временных ошибок, свойственных длинной строке, на нее записывается часть поля. В таких случаях количество головок увеличивается для обеспечения непрерывной записи, т.е. изображение сегментируется. Из-за различия видеоголовок между собой эти полосы могут быть неодинаковыми, что будет заметно на экране. Замедление и остановка изображения в этом случае требуют дополнительной обработки.
13
3 СИСТЕМЫ ВИДЕОЗАПИСИ Важным этапом в развитии магнитной видеозаписи можно считать применение в 1965 г. в видеомагнитофоне вместо открытого рулона видеоленты закрытых кассет с лентой, по типу кассет для звукозаписи. Вопервых, это позволило защитить магнитную ленту от прикосновений рук, от непосредственного загрязнения и прямых механических воздействий, что положительно повлияло на качество видеозаписи. Во-вторых, именно кассеты, благодаря простоте обращения с ними в эксплуатации, способствовали широкому распространению видеомагнитофонов в быту и вообще для непрофессионального применения, что, в свою очередь, явилось стимулом для совершенствования видеотехники. Однако, в отличие от звукозаписи, где почти сразу после появления кассет установился единый международный стандарт на их параметры, в видеозаписи нет такого же единого стандарта на видеокассеты. В первую очередь различное назначение видеомагнитофонов привело к многообразию видеокассет: кассеты для стационарных (студийных) видеомагнитофонов профессионального и полупрофессионального применения; кассеты для бытовых видеомагнитофонов; специальные кассеты уменьшенной емкости (вместимости) ленты и, следовательно, меньших размеров, используемые в блоках видеозаписи, встроенных в видеокамеры (так называемые камкордеры). Кроме того, видеокассеты содержат в себе некоторые элементы лентопротяжного механизма (ролики и др.) видеомагнитофона и составляют в этом смысле одно целое с ним, вследствие чего их размеры и конструкция зависят также от типа ЛПМ. Определенную роль в многообразии систем видеозаписи и, соответственно, типов видеокассет сыграла конкурентная борьба между различными фирмами, выпускающими аппаратуру видеозаписи, а также то, что телевизионное вещание в мире в настоящее время характеризуется множественностью используемых стандартов. Во-первых, это два стандарта разложения (кодирования яркостного сигнала) при чересстрочной развертке: 525 строк в кадре и 30 передаваемых кадров в секунду - в странах с частотой сети электропитания 60 Гц; 625 строк и 25 кадров в секунду там, где частота сети электропитания 50 Гц. Во-вторых, применяются три системы кодирования цвета: NTSC, PAL, SЕСАМ, и у каждой есть еще несколько модификации. В результате в мире используется 18 вариантов систем телевизионного вещания. Все это осложняет ситуацию с аппаратурой видеозаписи, так как видеомагнитофоны обычно рассчитаны на конкретные типы видеосигналов. Таким образом, в мире в настоящее время имеется относительно большое количество систем видеозаписи, что затрудняет обмен видеокассетами из-за отсутствия полной совместимости между разными системами. 14
Для совместимости необходимо совпадение слишком большого числа параметров: скорости движения ленты, числа головок записи, скорости записи, ширины ленты и дорожек записи, расположения дорожек записи, вида видеосигнала, способа записи видеосигнала, звукового сигнала и др. Для учета главных специфических особенностей того или иного видеомагнитофона или, более широко, той или иной системы видеозаписи необходимо определить формат видеозаписи, то есть стандартизованные способ записи, параметры записываемого сигнала, размеры и расположение дорожек записи на ленте данной ширины. Каждый из форматов имеет определенные достоинства и недостатки. Для правильного выбора конкретного формата или системы видеозаписи нужно учитывать не только присущие им качественные показатели по записи изображения и звука и функциональные возможности, но и эксплуатационные и экономические показатели [4].
15
4 АНАЛОГОВЫЕ ФОРМАТЫ ВИДЕОЗАПИСИ
4.1 Формат Q (Ampex, H3TM) и В Отечественное телевидение впервые перешло на видеозапись, используя магнитофоны "Кадр-3ПМ" формата Q. Технические характеристики формата следующие: − высокое качество изображения (полоса 6 МГц); − отношение сигнал/шум 40 дБ; − на ленту записывается полный композитный сигнал Secam; − длительность записи на видеорулон до 90 минут; − вес видеорулона 10 кг; − ширина ленты 50,8 мм (2"); − относительная скорость головка-лента 40 м/с; − продольная скорость ленты 39,8 см/с; − длина магнитной строчки 46 мм; − ширина магнитной строчки 260 мкм; − запись под углом 90о к базовому краю ленты; − четыре вращающиеся головки. По верхнему краю ленты располагается продольная дорожка записи звукового сопровождения, а по нижнему краю две продольные дорожки для записи контрольного сигнала системы авторегулирования и временного кода. Эти видеомагнитофоны имели ряд недостатков: высокая цена, низкая надежность, специальная пятиминутная подготовка к воспроизведению, включающая настройку параметров САР и режимов каждой из 4 головок; отсутствовал также поиск изображения с просмотром и др. [1]. Однако в телевизионных архивах хранится достаточное количество материалов, записанных в этом формате. Так как способ оказался дорогостоящим, эти видеомагнитофоны заменили ВМ форматов сигналограммы B и C, работающими на ленте с шириной 25,4 мм (1"). Технические характеристики ВМ формата В [2]: − полоса частот 5,5 МГц; − отношение сигнал/шум 43 дБ; − на ленту записывается полный композитный сигнал Secam; − длительность записи на видеорулон до 90 минут; 16
− − − − − − − − − − −
вес видеорулона 2 кг; диаметр катушки 20 см; ширина ленты 25,4 мм (1"); относительная скорость головка-лента 24 м/с; продольная скорость ленты 24 см/с; длина магнитной строчки с изображением 80 мм; ширина магнитной строчки 160 мкм; промежуток между строчками 50 мкм; запись под углом 14,4о к базовому краю ленты; две вращающиеся головки; масса ВМ 100-300 кг. Поле телевизионного изображения разбивается на 6 сегментов по 52 телевизионные строчки (Н) в каждой магнитной строчке. По верхнему краю ленты располагаются 2 продольные дорожки записи звука шириной 0,8мм и продольная дорожка для записи канала управления шириной 0,4мм, а по нижнему краю ленты - продольная дорожка для записи временного кода шириной 0,8мм (рис. 4.1).
МЛ - магнитная лента, ВГ - видеоголовка, СГ - синхроголовка, БКВ - базовый край видеоленты, ЗД - звуковая дорожка, УД - управляющая дорожка, ВД - видеодорожка.
Рис. 4.1. Сигналограмма формата В 4.2 Формат C ("Кадр-103СЦ", Amex - серия VPR, Sony – серия BVH, H3TM) Технические характеристики ВМ формата C [1,2,3]: − полоса частот 5,8-6 МГц; − отношение сигнал/шум 42-45 дБ; − на ленту записывается полный композитный сигнал Secam; 17
− − − − − − − − − − − −
длительность записи на видеорулон до 90 минут; вес видеорулона 2 кг; диаметр катушки 20 см; ширина ленты 25,4 мм (1"); относительная скорость головка-лента 21 м/с; продольная скорость ленты 24 см/с; длина магнитной строчки с изображением 411,5 мм; ширина магнитной строчки 160 мкм; промежуток между строчками 21 мкм; запись под углом 2,34 о к базовому краю ленты; одна вращающаяся головка; масса ВМ 100 кг. На магнитной строчке размещаются 302 Н, а остальная часть поля (10,5 Н) записывается на коротких строчках (синхрострочках), либо не записывается и вместо нее вводится от датчика в опорный сигнал, а на свободное место записывается на продольной дорожке четвертый звуковой канал или этот участок ленты остается без записи. По верхнему краю ленты располагаются две продольные дорожки шириной 0,8мм, а по нижнему краю ленты - продольные дорожки шириной 0,7 мм для записи временного кода и шириной 0,6 мм для записи контрольного сигнала (рис. 4.2).
Рис. 4.2. Сигналограмма формата С
18
К достоинствам формата С можно отнести следующее: для воспроизведения не требует никаких настроек, есть перемотка с просмотром, стопкадр, замедленное и ускоренное (в 2 раза) воспроизведение, наличие встроенного цифрового корректора временных искажений (ЦКВИ), наличие двух независимых звуковых каналов, с помощью компьютера IBM PC ХТ (нач. 90-х годов 20 века) можно обеспечить гибкий видеомонтаж [1]. К недостаткам относятся сложная заправка ленты, высокая цена и низкая надежность. Упрощенная структурная схема блока записи-воспроизведения студийного ВМ Кадр-103СЦ приведена на рисунке 4.3. Этот ВМ и сейчас эксплуатируется на некоторых телевизионных студиях страны [1]. Его масса 240 кг, размер 1700х850х700мм, потребляемая мощность 1кВт. Кстати, аналогичные ВМ, выпускаемые в то время (80-е годы 20 века) за рубежом (VPR-6, США, HR-210, Япония), имели еще большие массо-габаритные характеристики [3].
5,6 - УНЧ, 9,10 – звуковые головки; З, 4,7,20 – головки стирания, 13,24 – генераторы стирания; 2,3 – эластичные развязки; 26 - высокочастотный модулятор; 22 - усилитель записи; 16,17 – видеоголовки; 18, 42 – управляемые корректоры; 29 - ограничитель; 43 - детектор огибающей системы автотрекинга; 30 – демодулятор; 31 - компенсатор выпадений; 23 - цифро-аналоговая система управления частоты вращения (ЦАСУЧВ) двигателя; 32 - ЦАСУЧВ барабана БВГ; 33 - ЦАСУЧВ скорости ленты; 8 - ведущий вал; 14 – прижимной ролик; 25 - устройства натяжения и управления; 1,12 - боковые ведущие двигатели; 11 - датчик скорости (обрыва) ленты; 27 - система синхронизации; 43 - система автотрекинга; 37 – система электронного монтажа; 39 – система дистанционного управления; 44 - система контроля индикации и диагностики; 40 - панель управления; 38 – источники питания; 36 – система управления
Рис. 4.3. Упрощенная структурная схема блока записи-воспроизведения студийного ВМ Кадр-103СЦ, Россия (формат С) 19
Следует отметить, что вся последующая техника, использующаяся в нашей стране, производится за рубежом [1]. В начале 90-х годов в нашей стране для информационного вещания и видеожурналистики стали применяться аналоговые кассетные ВМ форматов Betacam, S-VHS, Betacam SP. 4.3 Видеомагнитофоны формата BETACAM 4.3.1 Betacam Betacam - формат видеозаписи, разработанный для студийного и внестудийного видеопроизводства, а так же для видеожурналистики. Особенностью системы Betacam является то, что в ней удачно сочетаются высокое качество передачи изображения, технико-экономические показатели и гибкие технологические возможности. Высокое качество записи/воспроизведения телевизионного сигнала достигается использованием записи и обработки компонентных сигналов яркости и цветности, а также за счет высокой скорости записи, обеспечивающей широкую полосу частот и хорошее отношение сигнал/шум. Технико-экономические показатели включают в себя низкое энергопотребление, относительно небольшие размеры и массу видеокамер, видеомагнитофонов и видеокассет. Технологические особенности заключаются в наличии многих вспомогательных функций, возможности совместной работы с оборудованием других форматов видеозаписи, высокой степени автоматизации, что облегчает работу по обслуживанию регулированию оборудования. В видеосистеме Betacam применен формат записи сигнала, при котором запись сигналов яркости (Y) и цветности (СR, CB) производится на отдельные видеодорожки разными видеоголовками. Расположение дорожек записи показано на рисунке 4.4. Ширина видеоленты равна 12,65 мм, ширина наклонных видеодорожек - 80 мкм. В верхней части видеоленты расположены две продольные дорожки, каждая шириной 0,6 мм, для записи звуковых сигналов (канал звука I и канал звука II). В нижней части ленты размещаются дорожка синхросигнала (сигнала управления) шириной 0,4 мм и дорожка адресновременного кода шириной 0,5 мм. Конфигурация магнитной видеоленты в режиме рабочего хода в зоне вращающегося барабана видеоголовок (БВГ) представлена на рисунке 4.5. 20
1 – звуковая магнитная головка воспроизведения; 2 – звуковые головки универсальные; 3 – дорожки записи звуковых сигналов; 4 – магнитная головка стирания; 5 – магнитная головка записи/воспроизведения адресно-временного кода; 6 – дорожа записи сигнала управления; 7 – дорожка записи адресно-временного кода; 8 – универсальная магнитная головка канала управления; 9 – магнитная головка контрольного воспроизведения; 10 – видеодорожка записи сигнала яркости; 11 – видеодорожки сигнала цветности; В: 0,4 мм; Е: 0,7 мм; F: 1,1 мм; Y: 1,28 мм; W: 9,384 мм; J: 10,85 мм; К: 11,45мм; L: 11.85 мм; М: 12,45 мм; U: 12,7 мм; Q: 0,166 мм; D: 0,0805 мм; N: 0,073 мм; С: 0.073 мм, θ: 0.46811°
Рис. 4.4. Сигналограмма формата Betacam
1 – универсальная магнитная головка адресно-временного кода; 2 – магнитная головка стирания; 3 – прижимной ролик; 4 – гладкий ведущий вал; 5 – магнитная головка контрольного воспроизведения; 6 – универсальные магнитные головки - звуковые и канала управления; 7 – БВГ; 8 – видеолента; 9, 12 – головки стирания; 10, 13 – видеоголовки канала цветности II; 14 – видеоголовки канала яркости
Рис. 4.5. Расположение основных элементов ЛПМ и видеоголовок на барабане видеомагнитофона Betacam 21
Универсальные видеоголовки сигналов яркости и сигналов цветности разнесены на угол 6,767° и смещены по высоте относительно друг друга на 0,07-0,08 мм, а вдоль видеоленты - на 4,4 мм. Каждой паре видеоголовок предшествует вращающаяся головка стирания, которая обеспечивает дополнительные возможности при видеозаписи. Наличие этой головки позволяет осуществлять «чистое» (без срыва изображения и помех) продолжение видеозаписи в месте, где уже имеется сигналограмма. На рисунках 4.4 и 4.5 показаны также общая головка стирания с длиной зазора во всю ширину ленты, головка записи/воспроизведения управляющего синхросигнала, универсальная звуковая двухканальная головка и в этом же корпусе расположенная головка записи/воспроизведения адресновременного кода. Воспроизводящая звуковая головка служит для контроля сигнала во время записи (сквозной канал) и считывает одновременно сигналограмму I и II звуковых каналов. Если сигнал яркости Y занимает всю строку развертки, то сигналы цветности CR, СB записываются методом временного уплотнения, причем каждый занимает поочередно половину видеодорожки. На рисунке 4.6 показано временное положение сигналов яркости Y и сигналов цветности СR, СВ в процессе формирования сигнала для записи и при воспроизведении.
Рис. 4.6. Диаграмма временного положения сигнала яркости и цветоразностных сигналов в процессе записи (а) и в процессе воспроизведения (б) в формате Betacam: n - номер строки 22
Из рисунка 4.6 видно, что при записи цветоразностные сигналы задерживаются на время, равное длительности одной строки телевизионной развертки (Н), и при воспроизведении еще раз на то же время. Оба промежутка времени задержки цветоразностных сигналов относительно сигнала яркости составляют 2Н. Эта задержка компенсируется действием линий задержки при воспроизведении сигналограммы. Всего на одной видеодорожке располагается 312,5 телевизионной строки для стандарта видеосигнала 625 строк/50 полей. Раздельная запись сигналов яркости и цветности и временное уплотнение цветоразностных сигналов полностью устраняют перекрестные искажения между этими сигналами и позволяют обеспечить полосу частот каждого из цветоразностных сигналов 1,5 МГц - значительно шире, чем при обычной частотной модуляции. На рисунке 4.7 приведена структурная схема видеоканала записи видеомагнитофона Betacam.
Рис. 4.7. Структурная схема видеоканала записи видеомагнитофона Betacam На вход должны поступать компонентные видеосигналы. Как видно из схемы, сигнал яркости с введенными в смесителе 1 синхроимпульсами проходит фиксирующую цепь 2 и поступает на ЧМ-модулятор 3. Затем частотно-модулированный сигнал яркости через усилители записи и вращающийся трансформатор 5 подается на две записывающие видеоголовки сигнала яркости 6. Цветоразностные сигналы R - Y и В - Y поступают после ограничивающих фильтров 7 на схемы временного уплотнения сигналов 23
цветности 8, где осуществляется временное уплотнение в два раза. Мультиплексор 9 осуществляет выборку сигналов цветности в зависимости от воздействия сигналов управления генератора тактовых импульсов 12 и формирователя 13. После ввода синхроимпульсов комбинированный сигнал цветности проходит фиксирующую цепь 10 и поступает на частотный модулятор II. Затем через усилители записи 4 и вращающийся трансформатор этот сигнал подается на две записывающие головки сигналов цветности [4]. Генератор 12, а также формирователь 15, блокирующий усилители записи 4, синхронизируются от электронного блока управления приводом видеомагнитофона. Усилитель воспроизведения ВЧ-сигнала 14 обеспечивает для схемы привода выделение сигнала расположения сточек записи. Основные характеристики ВМ формата Betacam приведены в таблице 4.1. Т а б л и ц а 4.1 Основные характеристики ВМ формата Betacam Параметр
Назначение Верхняя граничная частота МГц сигнала яркости
BVV-IAP/S Портативный, записывающий 4,0
Сигнала цветности 1,5 Отношение сигнал/шум: 46 канала яркости канала цветности 49 звукового канала 50 К-фактор, % <3 Задержка сигналов цвет20 ность/ яркость, нс Частотная характеристика 50—15000 звукового канала, Гц Габаритные размеры, мм 245х221х112 Масса, кг 4,2
BVW-IOP BVW-1OS Воспроизводящий
BVW-4UP BVW-40S Монтажный
BVW-2UP BVW-20S Портативный, воспроизводящий
4,1
4,1
4,1
1,5
1,5
1,5
48
46
46
50 50 <3
49 50 <3
49 50 <3
20
20
20
50—15000
50-15000
50-15000
452х239х 580 30
452х283х580 333х128х х378 35 8,9
4.3.2 Betacam SP, SP 2000Pro, SP1000 Дальнейшим развитием формата Betacam явилось создание линейки оборудования, получившего название Betacam SP. Аббревиатуру SP (superior performance) дословно можно перевести как «превосходная харак 24
теристика». Полученное в устройствах Betacam SP высокое качество передачи видео- и звукового сигнала, а также широкое применение формата Betacam в видеожурналистике и во внестудийном производстве в мире заставило даже такие ведущие фирмы-производители, как Аmрех (США) и BTS (ФРГ), начать лицензионный выпуск оборудования формата Betacam SP по разработке фирмы Sony. В таблице 4.2 представлены основные показатели видеомагнитофонов форматов Betacam и Betacam SP. Существенное расширение полосы записываемых видеосигналов в формате Betacam SP достигнуто изменением параметров обработки видеосигнала, применением металлопорошковой магнитной ленты использованием новых схемотехнических решений и высококачественной элементной базы. В частности, выбраны новые граничные частоты с сохранением диапазона девиации частоты ЧМ-сигнала. На рисунке 4.8 приведены частотные характеристики видеосигнала яркости в формате Betacam (а) и Betacam SP (б). Т а б л и ц а 4.2 Основные технические характеристики модификаций формата Betacam (PAL) Параметр Скорость движения ленты, см/с Тип магнитной ленты
Betacam
Betacam SP
10, 15
10, 15
Оксидная
Верхняя граничная частота, МГц: 4,1 сигнала яркости сигнала цветности 1,5 Отношение сигнал/шум, 46 дБ: канала яркости канала цветности 49 Частотная характеристика звукового канала, Гц: 50—15000 прямая запись ЧМ-запись Отношение сигнал/шум звукового канала, дБ: 50 прямая запись ЧМ-запись — Примечание:* запись с шумопонижением
Металлопорошковая
Оксидная
5,5
4,0
1,5
1,5
48
46
48
45
50—15000
50—15000
20—20000
68*
68*
72
В видеомагнитофонах Betacam SP к двум стандартным продольным дорожкам записи звукового сигнала добавлены два канала с более высоким 25
качеством звукопередачи. Запись осуществляется методом частотной модуляции с несущей 1,5 МГц (рис. 4.8) двумя отдельными вращающимися головками в той же зоне на ленте, где записывается видеосигнал. При таком техническом решении обеспечивается частотный диапазон звукового сигнала от 20 до 20000 Гц и динамический диапазон свыше 70 дБ [26].
Рис. 4.8. Частотные характеристики видеосигнала яркости в формате Betacam (а) и Betacam SP (б) Характеристики металлопорошковой ленты (более мелкая; структура частиц; повышенная коэрцитивная сила и др.) позволяют повысить отношения сигнал яркости/шум (48 дБ) и сигнал цветности/шум (50 дБ), снизить Кфактор. Улучшенная передача верхней части спектра записываемого видеосигнала приводит к лучшему воспроизведению мелких деталей изображения. Оборудование форматов Betacam и Betacam SP полностью совместимы по видеосигналу между собой. В них могут быть использованы одинаковые типы магнитных лент. 26
Однако улучшенные характеристики, достигнутые в Betacam SP, не реализуются в Betacam, и, наоборот, записи, выполненные на Betacam, не приобретают улучшения при воспроизведении на видеомагнитофонах Betacam SP. Кроме того, для Betacam SP предусмотрено использование видеокассет двух типоразмеров, и соответственно большинство моделей видеомагнитофонов оборудованы универсальными лентопротяжными механизмами [4]. Формат Betacam SP оказался для большинства потенциальных пользователей избыточным, как по функциям и качеству, так и по цене. Поэтому была разработана более дешевая серия оборудования Betacam SP- 2000Pro. Уровень этого оборудования очень высок, несмотря на то, что его удешевление произошло в ущерб качеству воспроизводимого изображения и надежности механизмов. Характеристики формата следующие: качество изображения ниже, чем в SP; отношение сигнал/шум 48 дБ, полоса 5,5 МГц, метод записи компонентный, как и у SP; удовлетворительная компенсация выпадений. Возможности практически те же, что и в Betacam SP, но имеются только два звуковых канала. Поскольку в середине 90-х годов стало появляться довольно много малобюджетных региональных и кабельных телевизионных центров, производственных и тиражных компаний, возник большой спрос на недорогое видеооборудование с пониженными требованиями к качеству и возможностями. Для удовлетворения растущего спроса была создана новая дешевая серия Betacam SP UVW, или серия 1000. Удешевление оборудования произошло в ущерб качеству воспроизводимого изображения функциональным возможностям. Характеристики формата следующие: качество изображения ниже, чем в SP 2000Pro; отношение сигнал/шум 46 дБ; полоса 5 МГц; метод записи компонентный, как и в SP; неглубокая компенсация выпадений. 4.4 Видеомагнитофоны семейства U-matic U-matic - один из первых форматов видеозаписи, предназначенный для полупрофессиональной работы. Это поставило перед разработчиками задачу реализовать внутри формата значительные эксплуатационные возможности. В первую очередь к ним стоит отнести возможности, обеспечивающие монтажные функции видеомагнитофонов, и способность исправлять или заменять имеющиеся на МЛ записи. Высокое качество видеозаписи достигнуто за счет высокой скорости записи (относительная скорость головка-лента 10,26 м/с; продольная скорость ленты 9,53 см/с), широкой ви 27
деодорожки (105 мкм) и значительного промежутка между видеодорожками (52 мкм). На рисунке 4.9 показано расположение стационарных магнитных головок и дорожек записи в формате U-matic. Ширина видеоленты равна 19 мм, ширина наклонных видеодорожек - 105 мкм. В верхней части ленты расположена продольная дорожка 3 шириной 0,6 мм для записи управляющего сигнала. В нижней части ленты находятся две дорожки 7 для записи звуковых сигналов (канал звука I и канал звука II), каждая шириной 0,8 мм. Стирающая магнитная головка 1 имеет длину зазора на всю ширину видеоленты. Канал записи/воспроизведения управляющего синхросигнала содержит две МГ: одну только для воспроизведения (2), другую - универсальную (4). В звуковых каналах имеются универсальные МГ 5 и МГ стирания 6, отдельные для каждого канала; есть головка и дорожка временного кода 8. Запись телевизионного сигнала осуществляется двумя универсальными видеоголовками, закрепленными на вращающемся с частотой 25 Гц барабане диаметром 110мм.
A: 19мм; W: 15,5 мм, D: 0,8 мм; E: 0,8 мм; h: 0,7 мм; h’: 0,2 мм; C: 0,6 мм; T: 0,105 мм; Θ : 4058’
Рис. 4.9. Расположение магнитных головок и дорожек записи в видеомагнитофоне формата U-matic На рисунке 4.10 показано расположение видеоголовок на барабане и конфигурация ленты в узле записи (видеомагнитофон VO–5850). Видеоголовкам предшествуют вращающиеся головки стирания. 28
1 – стирающая головка; З – БВГ; 3 – универсальная видеоголовка; 4 – стирающие головки канала звука; 5 – универсальная головка синхросигнала; 6 – универсальные звуковые головки; 7 – катушка датчика положения БВГ; 8 – вал двигателя постоянного тока; 9 – магнит датчика положения БВГ; 10 – магниты датчика скорости; 11 – катушка датчика скорости; 12 – воспроизводящая головка синхросигнала; 13 – стационарная стирающая головка
Рис. 4.10. Расположение видеоголовок на барабане и конфигурация ленты в узле записи формата U-matic На БВГ закреплены восемь магнитов для работы датчиков скорости вращения барабана и один магнит для датчика фазы вращения барабана. Импульс в последнем датчике означает, что одна из видеоголовок (записывающе-воспроизводящая нечетные поля) находится на краю зоны, где располагаются видеодорожки. Во время записи телевизионного сигнала это положение барабана, т.е. начало записи видеодорожки, запоминается записью на дорожку импульса синхросигнала при помощи МГ. В движение магнитная лента проводится гладким валом двигателя постоянного тока. На рисунке 4.11 изображена структурная схема видеоканала. Так как формат U-matic получил широкое применение, его не могли не затронуть общие тенденции развития кассетной видеозаписи. В первую очередь это относится к расширению полосы записи/воспроизведения сиг 29
нала яркости. После проведенных модернизаций появился формат U-matic High Band, а затем U-matic SP.
30
31
1,4 – усилители и детекторы соответственно системы АРУ; 2 – корректор АЧХ; 3 – схема привязки уровня видеосигнала; 5 – модулятор канала яркости; 6 – преобразователь несущей (4,43 МГц →685 кГц) сигнала цветности; 7 – измерительный усилитель; 8 – линейный видеоусилитель; 9 – фильтр высоких частот; 10 – усилитель воспроизведения; 11 – усилитель записи; 12 – детектор схемы выпадений; 13 – фильтр низких частот; 14 – демодулятор канала яркости; 15 – схема шумопонижения; 16, 17, 18, 19 – генератор, модулятор, линия задержки на строку, демодулятор соответственно схем компенсации выпадений; 20 – линия задержки; 21 – преобразователь несущей (685 кГц→4,43 МГц) сигнала цветности; 22 – селектор синхроимпульсов; 23 – синхронизируемый генератор; 24 – выключатель цветности в выходном видеосигнале
Рис. 4.11. Структурная схема блока записи видеосигнала (а) и блока воспроизведения видеосигнала (б) видеомагнитофонов формата U-matic Распределение частот в этих форматах показано на рисунке 4.12. Девиация ЧМ-сигнала яркости во всех модификациях одинакова 1,6 МГц. Частота поднесущей сигнала цветности 1 увеличена приблизительно с 685 до 924 кГц. Самая широкая полоса сигнала яркости 2 обеспечивается в формате U-matic SP. "Узким" местом в форматах U-matic Н и Umatic SP остался канал записи/воспроизведения звуковых сигналов. В отличие от других высококачественных форматов (например, Betacam SP) в нем отсутствует канал, образованный вращающимися звуковыми головкам. В большинстве видеомагнитофонов формата U-matic SP улучшение параметров имеющихся двух звуковых каналов достигнуто за счет применения схем шумопонижения DolbyC [4].
32
а – U-matic; б – U-matic Н; в – U-matic SP; 1 – сигнал цветности; 2 – сигнал яркости
Рис. 4.12. Частотные характеристики видеосигналов записи в форматах U-matic
4.5 Видеомагнитофоны формата VHS Запись сигнала изображения в видеомагнитофонах формата VHS производится с помощью двух вращающихся видеоголовок, расположенных под углом 180° на барабане диаметром 62 мм. Частота вращения барабана - 25 Гц, скорость движения ленты - 23,39 мм/с. Скорость движения видеоголовки относительно ленты - 4,84 м/с. Расположение дорожек записи в формате VHS для стандартов 625 строк/50 полей в секунду показано на рисунке 4.13. Значения параметров приведены в таблице 4.3. Таблица 4.3
33
Параметры сигналограммы формата VHS Параметр
Обозначение
Значение
Ширина ленты, мм Ширина зоны, занимаемой строчками видеозаписи, мм Ширина зоны, занимаемой активной частью строчек видеозаписи, мм Шаг строчек видеозаписи, мм Ширина строчек видеозаписи, мм Ширина дорожки канала управления, мм Ширина дорожки звуковго канала (моно), мм Ширина дорожки звукового канала 1 и 11 (при стереофонии), мм Защитный промежуток между звуковыми дорожками Расстояние от края ленты до дорожки звукового канала 1, мм Расстояние от края ленты до центра строчек видеозаписи, мм Угол наклона строчек видеозаписи, град Угол траектории движения видеоголовки по неподвижной ленте, град Угол наклона рабочих зазоров видеоголовок, град Расстояние от рабочего зазора головки управления до конца активной части строчки видеозаписи, мм
А В
12,65
W
10,07
Р Т С
0,049 0,049 0,75
E
1,0
D
0,35
h
0,3
F
11,65
L
6,2
α
5°57’50,3``
—
5°56’07,4``
—
6°±10`
х
79,244
10,60
Как видно из рисунка 4.13, наклонные видеодорожки примыкают друг к другу без защитного промежутка. Для защиты от взаимного проникновения сигналов с соседних дорожек запись производится видеоголовками, рабочие зазоры которых ориентированы на угол, составляющий приблизительно 6° от перпендикуляра к направлению движения видеоголовок. Каждый кадр телевизионного изображения записывается за один оборот барабана с видеоголовками на двух соседних дорожках: видеозаписи. Угол обхвата барабана превышает 180°, что позволяет производить запись с некоторым перекрытием. Начало синхронизирующего импульса полей располагается на расстоянии 6,5 строки от момента коммутации головок [27]. Общий вид лентопротяжного механизма (ЛПМ) показан на рисунке 4.14. В формате VHS запись сигнала производится с предварительным преобразованием спектра. В канале записи из полного цветового сигнала выделяются сигналы яркости и цветности [4].
34
1 – строчки видеозаписи каналов I и II; 2 – дорожки звукозаписи каналов 1 и II; 3 – опорный край ленты
Рис. 4.13. Расположение строчек и дорожек записи в формате VHS (625 строк/50 полей)
1 – подкатушечник подающего узла 2 – штифт рычага натяжения; 3, 8, 11 – направляющие стойки; 4 – головка общего стирания; 5 – инерционный ролик; 6, 9 – направляющие ролики (заправочные штифты); 7 – барабан с видеоголовками; 10 – звуковая головка и головка синхросигнала; 12 – ведущий узел; 13 – прижимной ролик; 14 – подкатушечник приемного узла
Рис. 4.14. Лентопротяжный механизм ВМ формата VHS Сигнал яркости после частотной модуляции оказывается в верхней части полосы частот, записываемых на магнитную ленту. Для стандарта NTSC уровень синхронизирующих импульсов передается частотой 3,4МГц, 35
а наиболее яркие участки изображения (номинальный уровень белого) — частотой 4,4 МГц. Для сигналов PAL и SECAM девиация частоты находится в пределах 1 МГц со значениями 3,8 и 4,8 МГц соответственно. Спектр сигнала цветности путем гетеродинирования переносится в область нижних частот от 0 до 1 МГц. При сложении его с ЧМ-сигналом яркости получается записываемый сигнал, показанный на рисунке 4.15.
а – спектр входного цветового видеосигнала (1 – АМ-сигнал яркости; 2 – ЧМ-сигнал цветности); б – спектры видеосигналов яркости (1) и цветности (2) после разделения и ограничения; в – спектр сигнала, поступающего на видеоголовки после преобразования сигнала цветности (1) и сигнала яркости (2)
Рис. 4.15. Спектральные диаграммы преобразования видеосигнала для записи на магнитную ленту в формате VHS Для ослабления взаимных помех, возникающих при воспроизведении сигналов цветности с соседних видеодорожек, во время записи ТВ-сигнала изменяют на 90° фазу сигнала цветности так, чтобы в сигналах цветности, соответствующих соседним видеодорожкам, фазы были взаимно противоположны. Соответственно, при воспроизведении производится обработка сигналов с целью восстановления сигнала цветности, в результате чего практически полностью подавляются составляющие перекрестных помех. Построчная коммутация фазы сигнала поднесущей цветности при записи применяется только для ТВ-сигнала по стандартам PAL и NTSC. Запись сигналов звукового сопровождения в формате VHS производится двумя способами: прямой записью на продольные дорожки стационарными магнитными головками и записью вращающимися магнитными головками, дополнительно установленными на БВГ. Во втором случае звуковой сигнал подвергается преобразованию для получения ЧМ-сигнала. На базе формата VHS был разработан формат VHS-C. В нем применена кассета, имеющая объем в четыре раза меньше объема кассеты VHS и более чем в четыре раза легче. Кассеты формата VHS-C получили название 36
компакт- видеокассет или видеокассет С. Применение таких кассет позволило значительно уменьшить размеры и массу видеомагнитофонов. Ширина магнитной ленты в кассете С – 12,65 мм. Рacположение строчек видеозаписи и дорожек записи такое же, как в формате VHS, только формируются они в ЛПМ, отличном от базового формата. Количество записывающих видеоголовок увеличено до четырех, увеличен также угол охвата БВГ (до 270°), а диаметр барабана с вращающимися видеоголовками уменьшен [4]. На рисунке 4.16 показана конфигурация ленты в ЛПМ видеомагнитофонов VHS и VHS-C. При этом получена полная совместимость по видеофонограмме между форматами VHS и VHS-C.
1 - барабан вращающихся головок; 2 – кронштейны для крепления штифтов; 3, 8 – демпфирующие ролики; 4 – видеокассета; 5, 6 – подающая и приемная катушки соответственно; 7 – головка общего стирания; 9 – стирающая головка звукового канала; 10 – головка звукового канала и головка синхросигнала; 11 – прижимной ролик; 1, 2, 3 – для сигналов цветности, звука и яркости соответственно
Рис. 4.16. Конфигурация ленты в ЛПМ видеомагнитофонов формата VHS (а) и VHS-C (б) Однако воспроизводить кассеты VHS на аппаратах VHS-C невозможно, т.к. кассеты VHS-C воспроизводятся на ВМ VHS с универсальным лентопротяжным механизмом или на обычных ВМ при помощи специального переходника-адаптера. Продолжительность записи для кассет VHS-C, укомплектованных тонкой видеолентой, достигает 45 мин. Видеомагнитофоны VHS имеют еще одну особенность. Модели, оборудованные дополнительно к двум основным одной или двумя видеоголовками, могут обеспечивать режимы работы SP, LP и EP. Режим SP (Standard Play) – основной режим, характеризующийся номинальной скоростью движения ленты и максимально возможным качеством записи (PAL, SECAM - 23,39 мм/с; NTSC-33,5 мм/с). В режиме LP (Long Play) продольная скорость ленты уменьшается (PAL, MESECAM – 11,7 мм/с; NTSC – 16,67 мм/с), соответственно изменяется скорость записи и ухудшаются качественные показатели (самая низкая скорость обеспечи 37
вается в режиме ЕР – Elong Play (NTSC – 11,12 мм/с). Скоростями определяется и время записи /воспроизведения (SP, LP) кассет с лентой одинаковой длины. Дальнейшим развитием формата VHS явился формат Super VHS, который характеризуется более высокой разрешающей способностью по горизонтали (400 твл), меньшими перекрестными помехами и более высоким значением отношения сигнал/шум. Это достигается в основном за счет существенного расширения полосы частот сигнала яркости [4]. На рисунке 4.17 приведены частотные характеристики видеосигналов в форматах VHS и S-VHS.
Рис. 4.17. Частотные характеристики видеосигналов в форматах VHS (а) и S-VHS (б) В ВМ формата S-VHS при изменении яркости передаваемого изображения от уровня вершин синхроимпульсов до номинального уровня белого принято изменение частоты ЧМ-сигнала от 5,4 до 7МГц (поднесущая сигнала яркости 6,2 МГц). Это позволило повысить отношение сигнал/шум и улучшить контраст изображения (девиация частоты повышена до 1,6 МГц по сравнению с 1 МГц в формате VHS). В формате S-VHS ширина нижней боковой полосы ЧМ-сигнала яркости достигает 5 МГц. Сигнал цветности в обоих форматах выделяется полосовыми фильтром с центральной частотой 4,43 и полосой пропускания 1 МГц и преобразуется в сигнал с низкочастотной поднесущей 626,95 кГц (для видеосигнала PAL) [29]. При этом сигнал цветности в формате S-VHS имеет несколько более широкую полосу. В видеомагнитофонах формата S-VHS установлены уровни привязки для белого 210%, а для черного – 70%. Кроме основной предкоррекции (та 38
кой же, как в стандарте VHS), вводится дополнительная нелинейная предкоррекция. Скорость движения ленты в ВМ формата S-VHS такая же, как в ВМ формата VHS. Запись сигналов звукового сопровождения аналогична записи в формате VHS. ВМ формата S-VHS, как и аппараты формата VHS, могут работать в стандартных режимах записи/воспроизведения (SP), в режимах со сниженной в два раза (LP) или в три раза (EP) скоростью движения ленты. Запись в формате S-VHS производится на кассеты, укомплектованные металлопорошковой лентой. Для автоматического определения формата кассеты в последней на донышке выполнено специальное идентификационное отверстие (JD). Между форматами S-VHS и VHS существует односторонняя совместимость, т.е. видеофонограммы формата S-VHS могут быть воспроизведены только на ВМ формата S-VHS. Видеофонограммы формата S-VHS. На видеокассетах формата VHS могут быть записаны видеофонограммы только формата VHS. 4.6 Форматы Video-8 и Нi8 В 1983 г. фирма Sоnу предложила новый формат видеозаписи Video-8 на ленте шириной 8 мм, а на его основе портативные видеомагнитофоны и автономные моноблочные камеры - Handycam. Благодаря малым размерам, массе аппаратуры при достаточно хорошем качестве изображения и звука и удобству ее эксплуатации, этот формат получил широкое распространение и дальнейшую заинтересованность фирм в его развитии. Этот формат ориентирован только на бытовую технику, т.к. его разрешающая способность по горизонтали составляет 250 твл. Формат был одобрен 10 фирмами, заинтересованными в разработке и производстве соответствующего оборудования. Тогда же фирма Sonу начала работы по его усовершенствованию, и в итоге при содействии ряда заинтересованных сторон был создан широкополосный формат Нi8. По разрешающей способности и другим параметрам он вполне отвечает требованиям полупрофессионального применения, а по ряду оценок с позиций аппаратуры бытового назначения Нi8 — наилучший формат. К достоинствам данного формата относятся: небольшая и очень легкая кассета; металлопорошковая или металлизированная лента, а значит, более высокая плотность и увеличенная длительность записи; конструктивная простота прецизионной лентопротяжной системы из-за отсутствия неподвижных головок; высокочастотная несущая и широкая полоса девиации обеспечивают вполне приемлемую разрешающую способность при хорошем отношении сигнал/шум, эти данные сопоставимы и даже превосходят аналогичные характеристики формата S-VHS; звуковой канал отвечает требованиям Hi-Fi. 39
На рисунке 4.18 представлено распределение частот в видео- и звуковом каналах форматов Video-8 и Нi8.
1 - сигнал управления; 2 - сигнал цветности; 3 - сигнал яркости
Рис. 4.18. Частотные характеристики видеосигналов записи для формата Video-8 (a) и формата Hi8 (б) В результате примененных новых схемотехнических решений в формате Hi8 разрешающая способность повышена до 400 твл, снижены перекрестные помехи между каналами сигналов яркости и цветности, уменьшены контурные шумы и шумы по полю изображения. Сигналограмма формата Hi8 показана на рисунке 4.19. Скорость движения видеоленты составляет 2,0051 см/с. Для формата предусматривается режим LP с пониженной скоростью записи-воспроизведения. Узел записи схематично показан на рисунке 4.20. Формат Hi8 предусматривает два способа записи звука: первый - с амплитудно-частотной модуляцией (ЧМ), обычно используемой в аппаратуре HI-Fi, второй - с импульсно-кодовой модуляцией (ИКМ), которая применяется для особо высококачественной записи/воспроизведения звука. При таком способе обеспечивается динамический диапазон не менее 80 дБ. Запись звука с помощью ИКМ используется в отдельных аппаратах. Частота дискретизации - 31,25 кГц. За счет возможности работы с раздельными сигналами повышена совместимость с другими форматами [4].
40
1 - продольная дорожка; 2 - поле записи видеосигналов; 3 - ширина ленты; 4 - поле записи сигналов временного кода; 5 - поле записи звуковых ИКМ-сигналов; 6 - направление движения ленты; 7- направление движения головки
Рис. 4.19. Формат видеофонограммы на 8 мм видеоленте (а); расположение сигналов на наклонной строчке записи (б)
1 - временной код; 2 - направление движения ленты; 3 - видеоголовка; 4- БВГ
Рис. 4.20. Схема узла записи видеомагнитофона формата 8 мм
41
4.7 Формат MII В конце 1990 года фирма Panasoniс выпустила на рынок семейство новых моделей профессиональных видеомагнитофонов, объединенных названием MII Pro. Это событие открыло новую страницу в развитии и широком распространении аналоговой компонентной видеозаписи во всех сферах человеческой деятельности. Разработанный еще в 1986 году формат MII предназначен для профессиональной видеожурналистики и студийного производства. Для записи компонентного сигнала используется S-VHSкассета с высококачественной полудюймовой металлопорошковой лентой. Сигналограмма формата MII приведена на рисунке 4.21.
Рис. 4.21. Сигналограмма формата MII В формате MII сигнал яркости поочередно записывается на одной дорожке, а на другой - два скомпрессированных по времени цветоразностных сигнала. Скорость лента-головка составляет 5.9 м/с.
42
5 ОСОБЕННОСТИ ЦИФРОВОЙ ВИДЕОЗАПИСИ 5.1 Цифровое представление компонентного сигнала Компонентный телевизионный видеосигнал может быть представлен в цифровой форме в соответствии с Рекомендацией ITU-R 601. Эта рекомендация устанавливает правила раздельной дискретизации, квантования и кодирования сигнала яркости Y и двух цветоразностных сигналов R-Y (Cr) и B-Y (Cb). Частота дискретизации для яркостного сигнала Y установлена равной 13,5 МГц, для цветоразностных сигналов - 6,75 МГц, т.е. частота дискретизации яркостного сигнала в 2 раза больше частоты дискретизации цветоразностных сигналов. Если взять, как принято, в качестве условной (базовой для иерархии цифровых стандартов) единицы частоту 3,375 МГц, то частоты дискретизации яркостного и двух цветоразностных сигналов будут находиться в соотношении 4:2:2, которое и дает часто используемое название стандарта. Выбор в качестве базовой именно частоты 3,375 МГц во многом связан с соображениями кратности с частотами строчной развертки двух мировых стандартов разложения. При таких значениях частот дискретизации можно практически преобразовать без искажений в цифровую форму сигнал яркости в полосе до 5,75 МГц, а цветоразностные сигналы - в полосе до 2,75 МГц. Стандарт 4:2:2 используется в качестве "базового" при оценке других вариантов дискретизации, и на значение 5,75 МГц часто ссылаются как на границу полной полосы ТВ сигнала. Для квантования яркостного сигнала выделяется 877 уровней (значение черного в видеосигнале соответствует уровню квантования 64, а номинальное значение белого - уровню 940). Для квантования цветоразностных сигналов выделяется 897 уровней, причем нулевому значению аналогового сигнала соответствует уровень квантования 512. Существуют и другие форматы представления компонентного сигнала в цифровом виде. Кодирование по стандарту 4:4:4 предполагает использование частоты 13,5 МГц для всех трех компонентов: R, G, B. Это означает, что все компоненты передаются в полной полосе. Для каждого компонента в активной части кадра оцифровывается 576 строк по 720 элементов. Скорость цифрового потока при 10-битовом слове составляет 405 Мбит/с. Частота дискретизации всех сигналов - 13,5 МГц, т.е. все сигналы передаются в полной полосе. Формат 4:1:1 предлагает двукратное уменьшение частоты дискретизации цветоразностных сигналов (в сравнении со стандартом 4:2:2). Яркостной сигнал Y дискретизируется с частотой 13,5 Мгц, а цветоразностные 43
3,375 Мгц. Это означает и двукратное уменьшение горизонтального разрешения в цвете. Формат 4:2:0 предлагает изображение, в котором яркостная компонента Y содержит в активной части кадра 576 строк по 720 отсчетов, а цветоразностные компоненты - 288 строк по 360 отсчетов. Варианты кодирования 4:1:1 и 4:2:0 характеризуются одинаковой скоростью передачи данных - 202,5 Мбит/с для длины кодового слова в 10 бит и 162 Мбит/с - для 8 бит на слово. Находит применение формат 3:1:1, в котором уменьшено (в сравнении с 4:2:2) горизонтальное разрешение и для яркостной компоненты (с 720 до 540), и для цветоразностных (с 360 до 180). Активная часть кадра содержит 576 строк с 540 отсчетами яркостной компоненты и 180 отсчетами для цветоразностных. Скорость передачи данных формата 3:1:1 составляет 135 Мбит/с при 8 битах на один отсчет. Для значительного сокращения скорости потока (например, в CDROM приложениях) разрешение яркостной компоненты снижается примерно в 2 раза по вертикали и по горизонтали, а цветоразностных - в 4 раза по вертикали и в 2 раза по горизонтали (в сравнении со стандартом 4:2:2). Такой вид представления описывается форматом CIF (Common Interchange Format). Один кадр этого формата содержит в активной части 288 строк по 352 отсчета для яркостной компоненты и 144 строки по 176 отсчетов для цветоразностных компонент. При передаче только активной части изображения скорость потока составляет около 30 Мбит/с при 8 битах на отсчет. 5.2 Цифровое представление композитного сигнала (полного телевизионного сигнала) Композитный сигнал по системам PAL и NTSC дискретизируется с частотой, равной четвертой гармонике цветовой поднесущей. Скорость передачи данных для цифрового сигнала в системе NTSC составляет 143 Мбит/с, а в системе PAL - 177 Мбит/с. 5.3 Цифровое представление звукового сигнала Для передачи звукового сопровождения в телевидении применяются цифровые сигналы стандарта AES/EBU. В соответствии с этим стандартом при аналого-цифровом преобразовании звука используется импульснокодовая модуляция с линейной шкалой квантования, причем на один отсчет для собственно звуковых данных отводится до 24 бит. Форма представления кодовых слов - последовательная. К каждому слову звуковых данных добавляются биты корректности отсчета, состояния канала, данных пользо 44
вателя. Эта группа из 27 бит, дополненная битом четного паритета и синхрословом из 4 бит, образует субкадр из 32 бит. Стандарт поддерживает два звуковых сигнала (например, 2 моно или 1 стерео канал), из отсчетов которых формируется кадр. 192 последовательных кадра объединяются в блок данных. Стандарт AES/EBU допускает ряд частот дискретизации, из которых наиболее удобной для телевидения является частота 48 кГц, при которой длительность блока составляет 4 мс. При этом устанавливается простое соотношение между частотой дискретизации звука и частотой видеокадров, что упрощает синхронизацию и передачу цифровых сигналов видео и звука по одной линии связи. Скорость передачи звуковых данных при частоте 48 кГц составляет 3,072 Мбит/с. Принципы компрессии и кодирования цифровых видео и аудио потоков для их записи на видеоленту подробно рассмотрены в [14, 11]. 5.4. Технология компрессии MPEG В январе 1988 года в рамках объединенного технического комитета по информационным технологиям JTC1 Международной организации по стандартизации ISO и Международной электротехнической комиссии IEC была образована рабочая группа экспертов по кодированию движущихся изображений, перед которой была поставлена задача разработки стандартов кодирования изображения и звука с целью устранения избыточности [6]. Группа получила официальное наименование ISO/IEC JTC1/SC29/WG11 (11-ая рабочая группа 29 подкомитетов), но мировую известность она приобрела под названием MPEG - Moving Picture Expert Group. Основные проекты группы – это: MPEG-1 (стандарт ISO/IEC 11172 1992 г.) - будучи ограниченным всего четвертью кадра (352х288) и низким потоком (до 1,5 Мб/с), он обеспечивает невысокое результирующее качество кодирования видео и звука (чуть ниже уровня VHS); MPEG-2 (ISO/IEC 13818) – обобщенное кодирование изображения и звука при скоростях передачи до 50 Мб/с, MPEG-4 (ISO/IEC 14496) – кодирование аудиовизуальных объектов для очень низких потоков данных. MPEG-4 в основном предназначен для цифровой передачи видеоданных по телефонным линиям (Интернет, видеоконференции) в условиях жестко ограниченной пропускной способности (типично – 28.8 Kbps), а потому уменьшает разрешение изображения в 4 раза – до 176x144, но использует самую продвинутую схему кодирования с разделением изображения на такие независимые объекты, как фон, текст, 2D/3D графика, “разговаривающие” человеческие лица, двигающиеся тела и т.д. 45
Сегодня этот алгоритм уже оптимизирован для трех диапазонов: до 64 Кб/с, 64-384 Кб/с, 384 Кб/с – 4 Мб/с. Продолжаются работы над другими профилями и уровнями MPEG-4, в частности, для потоков до 38.4 Мб/с и даже до 1.2 Гб/с [7]. MPEG-7 (ISO/IEC 15938) – описание содержания объектов мультимедиа. Из этого списка лишь стандарт MPEG-7 пока не утвержден ISO, но работа над всеми проектами (кроме MPEG-1) продолжается. Наиболее известный из проектов группы MPEG - стандарт MPEG-2 к настоящему времени насчитывает уже 10 частей, первая из которых была представлена к стандартизации в 1994 году, а последняя - в 1999 году. Среди 10 составных частей стандарта MPEG-2 можно выделить 3 основных: 13818-1 – Systems, 13818-2 – Video, 13818-3 – Audio. Спецификация 13818-1 регламентирует кодовое представление и процесс декодирования, обеспечивающий воспроизведение компрессированных телевизионных изображений. 13818-2 предполагает сжатие потока видеоданных за счет устранения пространственной и временной избыточности, присущей телевизионному изображению. Устранение пространственной избыточности основывается на использовании дискретного косинусного преобразования (DCT - Discrete Cosine Transform), временной – на дифференциальном кодировании с компенсацией движения [14]. Но процедура кодирования не регламентируется стандартом, что оставляет возможности для совершенствования кодеров и улучшения качества воспроизводимого изображения. Спецификация 13818-3 определяет кодовое представление сигнала звукового сопровождения. Системная спецификация 13818-1 устанавливает правила объединения данных видео и звука в единый поток. Важнейшая особенность стандарта MPEG-2 – представление сигналов телевизионного изображения и звука в форме, задаваемой спецификациями 13818-1 - 138183, позволяет обращаться с видео и звуковыми потоками как с потоками компьютерных данных [6]. Рассмотрим более подробно этот формат [7]. Эффективное сжатие видеоинформации основывается на двух основных идеях: подавление несущественных для визуального восприятия мелких деталей пространственного распределения отдельных кадров и устранение временной избыточности в последовательности этих кадров. Соответственно говорят о пространственной и временной компрессии. В первой из них используется экспериментально установленная малая чувствительность человеческого восприятия к искажениям мелких деталей изображения. Глаз быстрее замечает неоднородность равномерного фона, чем искривление тонкой границы или изменение яркости и цвета малого участка. Из математики известно два эквивалентных представления изображения: привычное нам пространственное распределение яркости и цвета 46
и так называемое частотное распределение, связанное с пространственным Дискретным Косинусным Преобразованием (ДКП). В теории они равнозначны и обратимы, но сохраняют информацию о структуре изображения совершенно по-разному: передачу плавных изменений фона обеспечивают низкочастотные (центральные) значения частотного распределения, а за мелкие детали пространственного распределения отвечают высокочастотные коэффициенты. Это позволяет использовать следующий алгоритм сжатия. Кадр разбивается на блоки размером 16х16 (размеру 720х576 соответствует 45х36 блоков), каждый из которых ДКП переводится в частотную область. Затем соответствующие частотные коэффициенты подвергаются квантованию (округлению значений с задаваемым интервалом). Если само по себе ДКП не приводит к потере данных, то квантование коэффициентов, очевидно, вызывает огрубление изображения. Операция квантования выполняется с переменным интервалом – наиболее точно передается низкочастотная информация, в то время как многие высокочастотные коэффициенты принимают нулевые значения. Это обеспечивает значительное сжатие потока данных, но приводит к снижению эффективного разрешения и возможному появлению незначительных ложных деталей (в частности, на границе блоков). Очевидно, что чем более грубое квантование используется, тем больше степень сжатия, но и тем ниже качество результирующего сигнала. Этот алгоритм пришел из цифровой фотографии, где под именем JPEG был разработан для эффективного сжатия отдельных кадров (JPEG – это аббревиатура от названия утвердившего его международного объединения Joint Photographic Experts Group). Затем он был успешно применен для видеопоследовательностей кадров (при этом каждый из них обрабатывается совершенно независимо) и получил новое наименование MJPEG (MotionJPEG). Необходимо также отметить, что DV-кодировка цифровых стандартов DV/DVCAM/DVCPRO принципиально основана на том же алгоритме, но использует более гибкую схему с адаптивным подбором таблиц квантования. Коэффициент компрессии для различных блоков, в отличие от MJPEG, меняется по изображению: для малоинформативных блоков (например, на краях изображения) он увеличивается, а для блоков с большим количеством мелких деталей уменьшается относительно среднего по изображению уровня. В результате при том же качестве достигается сокращение объема данных примерно на 15% (или наоборот – при том же потоке выше качество выходного сигнала). Временная MPEG-компрессия использует высокую избыточность информации в изображениях, разделенных малым интервалом. Действительно, между смежными изображениями обычно меняется только малая часть 47
сцены – например, происходит плавное смещение небольшого объекта на фоне фиксированного заднего плана. В этом случае полную информацию о сцене нужно сохранять только выборочно - для опорных изображений. Для остальных достаточно передавать только разностную информацию: о положении объекта, направлении и величине его смещения, о новых элементах фона (открывающихся за объектом по мере его движения). Причем эти разности можно формировать не только по сравнению с предыдущими изображениями, но и с последующими (поскольку именно в них по мере движения объекта открывается часть фона, ранее скрытая за объектом). Таким образом, в MPEG кодировке принципиально формируются три типа изображения (кадров): I (Intra), выполняющие роль опорных и сохраняющие полный объем информации о структуре изображения; P (Predictive), несущие информацию об изменениях в структуре изображения по сравнению с предыдущим кадром (типов I или P); B (Bi-directional), сохраняющие только самую существенную часть информации об отличиях от предыдущего и последующего изображений (только I или P). Соответственно MPEG-2, как определено в документе ISO/IEC 138182, объединяет семейство взаимосогласованных и совместимых сверху вниз цифровых стандартов сжатия телевизионных сигналов, необходимых для наиболее эффективного применения на практике и обеспечения высокой степени эксплуатационной совместимости устройств, работающих в рамках стандарта MPEG-2, но разработанных и изготовленных различными производителями. Точнее, он допускает 4 уровня (Levels) разрешения кадра и 5 базовых профилей (Profiles) кодирования сигналов яркости и цветности Таблица 5.1 [6]. Уровни: низкий LL (Low Level) с разрешением кадра 352х288 (соответствует MPEG1), основной ML (Main Level) 720х576, высокий HL-1440 (High Level) 1440х1152 и высокий HL-1920 1920х1152. Отметим, что если в соответствии с рекомендацией ITU-R BT.601 (International Telecommunications Union – Recommendation) основной уровень определяет разрешение стандартного телевизионного кадра, то высокие уровни ориентированы на телевидение высокой четкости [7]. Профили: простой SP (Simple Profile), основной MP (Main Profile), 2 масштабируемых – по отношению сигнал-шум SNR Scalable Profile и по разрешению Spatially Scalable Profile и, наконец, высокий HP (High Profile). Важное место также занимает не определенный стандартом, но активно используемый в практике так называемый основной профессиональный или, по-другому, MPEG 422 профиль. Его обозначают как 422Р [7]. Студийный профиль 422 обеспечивает полное разрешение, соответствующее рекомендации ITU-R 601, монтаж с точностью до кадра, допускает многократные перезаписи. 48
Т а б л и ц а 5.1 Профили и уровни стандарта MPEG-2 Уровень Профили
Simple
Изображения I и P Формат 4:2:0 Отсчетов в строке Строк в кадре Кадров в секунду Макс. скор. потока High-1440 Отсчетов в строке Строк в кадре Кадров в секунду Макс. скор. потока Отсчетов в Main строке Строк в кадре Кадров в секунду Макс. скор. потока Отсчетов в Low строке Строк в кадре Кадров в секунду Макс. скор. потока High
Main
SNR
Spatial
High
422Р
I,P и B 4:2:0
I,P и B 4:2:0
I,P и B 4:2:0
I,P и B 4:2:2
1920
I,P и B 4:2:0, 4:2:2 1920
1152 60
1152 60
80 Мбит/с
100 Мбит/с
1440
1440
1440
1152 60
1152 60
1152 60
60 Мбит/с
60 Мбит/с 80 Мбит/с
720
720
720
720
720
576 30
576 30
576 30
576 30
608 30
15 Мбит/с 15 Мбит/с 15 Мбит/с 352
352
288 30
288 30
20 Мбит/с 50 Мбит/с
4 Мбит/с 4 Мбит/с
Большинство выпускаемых в настоящее время кодеров и декодеров в интегральном исполнении относятся к основному профилю и основному уровню (MP@ML). Поток видеоданных, определяемый спецификацией 13818-2, представляет собой иерархическую структуру, элементы которой строятся и объединяются друг с другом в соответствии с определенными синтаксическими и семантическими правилами. Существует 6 типов элементов этой иерархической структуры: − видеопоследовательность; − группа изображений; − изображение; − срез; 49
− макроблок; − блок. Видеопоследовательность – элемент потока видеоданных высшего уровня. Она представляет собой серию последовательных кадров телевизионного изображения. MPEG-2 допускает как построчные, так и чересстрочные последовательности. Как уже указывалось выше, в соответствии с используемыми методами дифференциального кодирования различают три типа изображений (кадров): I, P и B. Последовательности I-, P-, B-кадров объединяются в фиксированные по длине и структуре группы кадров - GOP (Group of Pictures). Каждая GOP обязательно начинается с I и с определенной периодичностью содержит P кадры. Ее структуру описывают как M/N, где M – общее число кадров в группе, а N – интервал между P-кадрами. Так, типичная для Video-CD и DVD IPB группа 15/3 имеет следующий вид: IBBPBBPBBPBBPBB. Здесь каждый B кадр восстанавливается по окружающим его P кадрам (в начале и конце группы - по I и Р), а в свою очередь каждый Р кадр – по предыдущему Р (или I) кадру. В то же время I кадры самодостаточны и могут быть восстановлены независимо от других, но являются опорными для всех P и тем более B кадров группы. Соответственно у I и P наименьшая степень компрессии, у В – наибольшая. Установлено, что по размеру типичный Р кадр составляет 1/3 от I, а B – 1/8 часть. В результате MPEG последовательность IPPP (GOP 4/1) обеспечивает 2-кратное уменьшение требуемого потока данных (при том же качестве) по сравнению с последовательностью только из I кадров, а использование GOP 15/3 позволяет достичь 4-кратного сжатия. Пример видеопоследовательности кадров (изображений) представлен на рисунке 5.1, где стрелками показаны направления предсказания.
Рис. 5.1. Видеопоследовательность группы изображений
50
Каждое изображение делится на срезы, которые состоят из макроблоков (рис. 5.2). Макроблок складывается из блоков размером 8х8 элементов изображения (пикселов). Каждый макроблок содержит группу из 4 блоков с отсчетами яркости (из области изображения с размерами 16х16 пикселов) и группу блоков с отсчетами цветности, взятых из той же области изображения, что и отсчеты блоков яркости.
Рис. 5.2. Изображение со срезами и макроблоками Число блоков с отсчетами цветности зависит от формата дискретизации: по одному блоку Cb и Cb в формате 4:2:0, по два – в формате 4:2:2, по 4 – в формате 4:4:4 (рис. 5.3).
Рис. 5.3. Структура макроблоков С информационной точки зрения каждое изображение представляет собой три прямоугольных матрицы отсчетов изображения: яркостную Y и две матрицы цветности Cb и Cb. Стандарт MPEG-2 допускает различные структуры матриц. Соотношение между количеством отсчетов яркости и цветности определяется форматом дискретизации. В случае формата 4:2:0 размеры матриц Cb и Cb в 2 раза меньше, чем Y, и в горизонтальном, и в вертикальном направлениях (рис. 5.4). Формат 4:2:2 отличается тем, что все три матрицы имеют одинаковые размеры по вертикали, но в горизонтальном направлении матрицы цветности имеют в два раза меньшее количество элементов (рис. 5.5). В формате 4:4:4 все матрицы одинаковы (рис. 5.5) [6].
51
Рис. 5.4. Структура отчетов яркости и цветности формата 4:2:0
Рис. 5.5. Структура отчетов яркости и цветности формата 4:2:2 и 4:4:4 Возможны два основных режима работы кодера компрессии – с постоянной скоростью потока данных и с постоянным уровнем качества декодированного изображения. Возможность для управления степенью компрессии и скоростью потока данных предоставляет изменение параметров матрицы квантования: чем грубее квантование, тем больше нулевых значений в матрице коэффициентов и тем меньше объем данных, необходимых для передачи информации об изображении. Однако с увеличением степени компрессии растут и необратимые искажения изображения из-за шумов квантования. В режиме с постоянным качеством используется фиксированная матрица квантования. При этом чем больше детальность изображения, чем быстрее перемещается объект в поле изображения, тем больше объем данных и скорость потока. В режиме с постоянной скоростью потока данных в кодере осуществляется непрерывное изменение коэффициентов матрицы 52
квантования. Чем мельче детали, чем динамичнее изображение, тем грубее квантование и будет больше искажений и артефактов из-за шумов квантования. Такой режим используется в системах передачи компрессированных изображений по каналам связи с фиксированной пропускной способностью, в системах цифрового спутникового, кабельного и наземного телевизионного вещания. Рассмотрим принципы компрессии звука в MPEG2. Считается, что звук CD качества требует оцифровки с частотой 44,1 Кгц при глубине 16 bit на канал, что соответствует потоку в 706 Kbps на канал (1,4 Mbps для стерео). DAT качество сигнала определяет частоту оцифровки в 48 Кгц (полоса частот 4-24000 Гц) и увеличивает поток до 768 Kbps на канал. Подход к сжатию информации тот же – отбрасывание части, не очень существенной для восприятия человеческим ухом. MPEG стандарт разрешает 3 уровня (Layer) компрессии аудио. Layer 1 использует наиболее простой алгоритм с минимальной компрессией, что предполагает 192 Kbps на канал. Алгоритм Layer 2 более сложный, зато и степень компрессии больше, всего 128 Kbps на канал. Мощный алгоритм сжатия цифрового звука CD-качества (в 11 раз без различаемых человеческим ухом потерь) Layer 3 обеспечивает максимально возможное качество звука при жестких ограничениях потока – не более 64 Kbps на канал. В основном он предназначен для Интернет. Теперь рассмотрим принцип смешивания "сжатых" аудио и видео данных в единый поток информации. MPEG-2 регламентирует две возможных формы единого потока данных – это программный поток и транспортный поток. Первый шаг на пути получения единого потока - формирование пакетного элементарного потока PES (Packetised Elementary Stream), представляющего собой последовательность PES-пакетов (рис. 5.7, 5.8) [6]. Каждый пакет состоит из заголовка (рис. 5.6) и данных пользователя, или полезной нагрузки, которая представляет собой фрагменты исходного элементарного потока (рис. 5.7, 5.8). В начале заголовка PES-пакета идет 32битный код старта, состоящий из стартового префикса и идентификатора потока. Идентификатор потока позволяет выделить PES-пакеты, принадлежащие одному элементарному потоку телевизионной программы. Спецификация определяет разрешенные значения чисел в поле идентификатора для 32 элементарных потоков звука и 16 элементарных потоков видеоданных. Флаги 1 и 2 – биты, указывающие на наличие или отсутствие в заголовке дополнительных полей, которые не являются обязательными. Эти поля служат для переноса дополнительной информации, такой, например, как авторские права, скремблирование, приоритет. Особую значимость имеют биты P и D флага 2, указывающие на наличие полей с метками времени представления PST (Presentation Time Stamps) и декодирования DTS (Decoding Time Stamps). Метки времени – это механизм, обеспечивающий синхронизацию потоков данных в декодере. На рисунке 5.7 показана структура формирования из элементарного потока данных программный поток данных. Длина блока программного потока может быть произвольной, единственное ограничение – заголовки 53
блока должны появляться не реже, чем через 0,7 секунды. Это связано с тем, что в заголовке содержится важная информация – опорное системное время.
Рис. 5.6. Заголовок RES пакета
Рис. 5.7. Структура формирования программного потока из элементарного потока данных 54
Искажения из-за ошибок одного блока могут означать потерю, например, целого кадра телевизионного изображения. Поскольку длина блока переменная, то декодер не может предсказывать время конца одного блока и начало другого и вынужден полагаться только на информацию о длине, содержащуюся в заголовке. Если соответствующее поле заголовка окажется пораженным ошибками, то декодер выйдет из синхронизма и потеряет, по крайней мере, один блок. К преимуществам, получаемым при использовании программного потока, можно отнести то, что процедура демультиплексирования программного потока относительно проста. Для возможности передачи нескольких видеопрограмм в один поток существует транспортный поток, структура формирования которого показана на рисунке 5.8. Транспортный поток может объединять пакетные элементарные потоки, переносящие данные нескольких программ с независимыми временными базами. Он состоит из коротких пакетов фиксированной длины (188 байтов). Элементарные потоки видео, звука и дополнительных данных (например, телетекст) разбиваются на фрагменты, равные по длине полезной нагрузке транспортного пакета (184 байта) и мультиплексируются в единый поток. Этот процесс подчиняется ряду ограничений: первый байт каждого PES-пакета элементарного потока должен быть первым байтом полеезной нагрузки транспортного пакета; каждый транспортный пакет может содержать данные лишь одного PES-пакета. Если PES-пакет не имеет длину, кратную 184 байтам, то один из транспортных пакетов не заполняется данными PES-пакета полностью. В этом случае избыточное пространство заполняется полем адаптации. Структура транспортного потока оптимизирована для условий передачи данных в каналах связи с шумами. В системах цифрового телевизионного вещания DVB и ISDB к 188 байтам каждого транспортного пакета добавляются 16 проверочных байтов кода Рида-Соломона, что позволяет исправлять в каждом пакете до 8 пораженных шумами байтов. В ATSC к каждому пакету добавляется 20 проверочных байтов, что позволяет исправлять до 10 байтовых ошибок в одном пакете. Благодаря небольшой длине пакета транспортный поток может легко переносить несколько телевизионных программ с разными временными базами. Проблема синхронизации звука и видео решается за счет использования буфера кодера и декодера компрессии (данные поступаю в буфер с переменной скоростью, а выходят – с постоянной), для чего применяются метки времени, выражающиеся в единицах времени периода колебаний с частотой 90кГц, которые ставятся в соответствие каждому блоку доступа и которые сообщают декодеру точное время, когда блок доступа (кодированное изображение или фрагмент звукового сопровождения) должен быть извлечен из буфера декодера и декодирован. Ограничение, определяемое стандартом MPEG-2, заключается в том, чтобы в элементарных потоках видео и звука, метки должны появляться не реже, чем раз в 0,7 секунды. Метки переносятся в заголовках PES-пакетов (рис. 5.6). 55
Рис. 5.8. Структура формирования транспортного потока из элементарного потока Эти метки бывают двух типов: метки времени представления PTS и метки времени декодирования DTS. Метки PTS определяют момент времени, в который декодированный блок доступа должен быть предъявлен зрителю. Метки времени декодирования DTS определяют моменты времени, в которые блоки доступа извлекаются из буфера и декодируются, но не предъявляются зрителю. MPEG-2 изначально задумывался как система компрессии для телевизионного вещания при сравнительно небольших скоростях потоков данных. Но возможности алгоритмов, заложенных в его основу, оказались столь значительными, что MPEG-2 поглотил сферу телевидения высокой четкости, первоначально отводившуюся проекту MPEG-3 [6]. Однако гибкость стандарта MPEG-2 оборачивается трудностями в обеспечении эксплутационной совместимости систем, изготовленных разными производителями телевизионной аппаратуры. Для решения проблем совместимости и интеграции устройств и систем, разработанных в соответствии со стандартом MPEG, в середине 1998 года был образован международный форум профессионального MPEG – Professional MPEG (Pro-MPEG) Forum. [6]
56
6 ЦИФРОВЫЕ ФОРМАТЫ ВИДЕОЗАПИСИ 6.1 Цифровой формат D1 В 1986 г. Sony совместно c BTS разработали компонентный (обрабатываются отдельно яркостная и цветоразностные составляющие) формат D1, предназначенный для высокого уровня обработки сигнала по стандарту 4:2:2 при записи одного цифрового компонентного сигнала изображения (оцифровка трех основных сигналов) и четырех цифровых сигналов звука (48кГц, 20 бит). Запись сегментная, четырехканальная: поле делится на пары сегментов (каждый сегмент состоит из 50 телевизионных строк), а каждая пара делится на 4 канала, а затем осуществляется запись каждой пары сегментов четырьмя головками четырех секторов, расположенных на разных строчках. В состав каждой строчки записи включены четыре разделенные промежутками пакеты звукоданных (рис. 6.1). Длина всех пакетов звука составляет примерно 8% от общей длины строчки записи. Длительность записи до 94 минут, скорость ленты 28, 69 см/с,; частота вращения БВГ 150 Гц, скорость записи 36 м/с, поток информации 216 Мб/с, выборка составляющих изображения по 8 бит, частоты дискретизации: яркостного сигнала FY=13,5 МГц, цветоразностных составляющих FRY= FB-Y=6,25 МГц, полоса частот канала яркости 5,75 МГц, отношение сигнал/шум 56 Дб. Кассеты содержат магнитную ленту шириной 19,01 мм (3/4’) и могут быть трех размеров (малыми, средними, большими). Видеофонограмма формата D1 (рис. 6.1) имеет следующие дорожки: временного кода, управления, программные (каждая из которых включает нижний видеосектор, четыре звукосектора и верхний видеосектор) и монтажную звуковую (предназначенную для слухового поиска фрагментов программы) [4]. При кодировании видео- и звуковых данных осуществляется их перемешивание для защиты от ошибок при выпадении большой продолжительности. В качестве корректирующего кода используется высокоэффективный код с внешними и внутренними кодами Рида-Соломона, позволяющие исправить пакетные ошибки даже из-за пятимиллиметровой царапины шириной 0,5 мм вдоль ленты [10, 11]. Внутреннее кодирование позволяет обнаруживать и исправлять ошибки случайного характера, имеющие сравнительно небольшую глубину (для устранения пакетных ошибок, вызванных выпадениями). Внешнее кодирование позволяет исправлять одну ошибку в каждом слове внешнего кода из 32 символов (более подробно см. в [11]).
57
А=0,2 и В=0,7; С=1,0; D=1,5; нижний край и ширина программной зоны: E=1,8 и F=16,0; G=18,1; H=18,8; ширина программной зоны: I=0,040; длина видеосектора: K=77,7177,79; длина звукосектора: M=2,55-2,56; полная длина программной дорожки: N=170,0; Θ= 5o24’02”; W=19,010; опорная точка программной дорожки: Y=10,490; начало верхнего и нижнего видеосекторов: X1=0 и X6=92,10-92,20; начало 4-х звуковых секторов: Х2=3,4; X3=6,8; X4=10,2; X5=13,6
Рис. 6.1. Сигналограмма формата цифровой видеозаписи D1 Преимущество формата: запись компонентных сигналов удобна для профессионального ТВ и видеопроизводства; сохраняется полная полоса видеочастот сигналов, так как исключаются процессы промежуточного преобразования и композитные сигналы; обеспечивается высокое качество при копировании и монтаже; совместимость с различной аппаратурой достигается без помощи транскодирования; устранена асинхронность сигналов, включая опознавание цвета и эффект оконтуривания цветных изображений. Принципиальные технические решения, найденные при разработке формата D1, используются во всех выпускаемых сейчас видеомагнитофонах. Видеомагнитофоны D1 не потеряли своего значения, они выпускаются до сих пор. Качественные показатели воспроизводимого ими изображения все еще – эталон [9]. 6.2 Цифровой формат D2 В 1987 г. фирма Ampex совместно с Sony разработали кодированный цифровой композитный формат (обрабатывается полный цветной телевизионный сигнал ПЦТС), предназначенный для использования в смешанной аналого-цифровой среде. Этот формат имеет более слабую пропускную способность и большую плотность записи, чем D1, и полностью несовместим с ним. 58
Скорость 19,01 мм (3/4’) ленты 13,17 см/с обеспечивает до 3,5 ч видеозапись, частота вращения БВГ 90 Гц, скорость записи 27 м/с, выборка ПЦТС по 8 бит, 4 аудиоканала (48кГц, 20 бит), частота дискретизации изображения - четвертая гармоника цветовой поднесущей (для NTSC: 14,31782 МГц), полоса частот канала яркости 5,5-6,0 МГц, отношение сигнал/шум 53 Дб. Сигналограмма формата D2 приведена на рисунке 6.2. Она имеет продольные дорожки временного кода, управления, монтажную звуковую, а также наклонные дорожки для записи цифровых видео - и звуковых сигналов [4].
А=0,2 и В=0,7; С=1,0; D=1,5; нижний край и ширина программной зоны: E=1,797 и F=16,1; G=18,2; H=18,8; шаг записи: I=0,352; длина видеосектора: K=135,39; длина звукосектора: M=3,37; общая длина строчки записи: N=150,71; Θ= 6o13’26”; W=19,010; опорная точка программной области: Y=2,63; начало видеосектора: X1=0; начало 4-х звуковых секторов: Х2=139,63; X3=135,82; X4=3,8; X5=7,61.
Рис. 6.2. Сигналограмма формата D2 Кодирование представляет собой линейно импульсно-кодовую модуляцию при 8 битах на отчет. Для защиты от ошибок используется каскадный код Рида-Соломона с внутренним и внешним кодом видеоданных [11]. За один оборот БВГ записываются две пары наклонных дорожек. Для уменьшения взаимного влияния строчек записи, располагающихся без защитных промежутков, использован угловой разворот рабочих зазоров видеоголовок на ±15о и применен канальный код М2 (Миллера квадрат). Свойства кода М2 (отсутвие постоянной составляющей и малый уровень низкочастотных компонентов) дали возможность производить запись без предварительного стирания и исключить вращающиеся стирающие головки. Внутреннее кодирование является общим для данных видео и звука. Звукоданные объединяются в синхроблоки в соответствии с теми же правилами, что и видеоданные, но внешнее кодирование осуществляется отдельно [12]. Преимущества формата D2: более низкая стоимость и массогабаритные параметры по сравнению с форматом D1, возможность многократной перезаписи с минимальными потерями качества; возможность за 59
медленного воспроизведения. Недостатки: меньшая, чем у формата D1 разрешающая способность; узкая полоса сигналов цветности. В настоящее время этот формат является устаревшим [5]. 6.3 Цифровой формат D3 В 1989 г. фирма Panasonic разработала цифровой композитный (обрабатывается ПЦТС) формат D3, совместимый с форматом D2. Скорость 12,65 мм (1/2’) ленты 8,38 см/с обеспечивает до 185 мин видеозапись, частота вращения БВГ 100 Гц, выборка ПЦТС по 8 бит, 4 аудиоканала (48кГц, 20 бит), частота дискретизации изображения - четвертая гармоника цветовой поднесущей (для PAL: 17,73 МГц), полоса частот канала яркости 6,0 Мгц, отношение сигнал/шум 54 Дб. Видеофонограмма формата D3 и параметры дорожек приведены на рисунке 6.3. За один оборот БВГ записываются две пары наклонных дорожек двумя видеоголовками с азимутальным разворотом около 20 градусов. Обработка данных производится в соответствии с двухканальным принципом (Ch0 и Ch1- рисунок 6.3).
Рис. 6.3. Сигналограмма формата цифровой видеозаписи D3 Ширина наклонных дорожек и шаг строчек записи значительно меньше, чем в предшествующих цифровых форматах D1 и D2. Поверхностная плотность записи данных намного больше, а расход ленты - намного меньше. Увеличение поверхностной плотности записи данных было достигнуто за счет применения усовершенствованных носителей, головок и, что очень важно, более мощной и совершенной системы обработки и кодирования. Кодирование представляет собой линейно импульсно-кодовую модуляцию при 8 битах на отчет. Для защиты от ошибок, возникающих в канале записи-воспроизведения, используется двумерное кодирование, т.е. кодовое 60
слово формируется как произведение двух кодов - внешнего и внутреннего кода Рида-Соломона. В качестве канального кода используется модуляция 8-14 (EFM- eight-to-fourteen modulation) [10,11]. Формат записи звуковых сигналов в D3 имеет существенные отличия от D2. Звукоданные, приходящиеся на интервал поля телевизионного изображения, объединяются в секторы и записываются на дорожках с промежутками для монтажа. На интервал одного поля в каждом канале приходится по 4 сектора. Каждый сектор состоит из двух половин, записываемых двумя головками с противоположным азимутом. Принципиальное отличие заключается в том, что в формате D3 отсутствует дублирование звукосекторов в разных областях сигналограммы. В формате D3 предлагается использование всей отведенной для звука площади ленты в системе исправления ошибок. В канале звука также используется двумерное кодирование Рида-Соломона [10, 11]. Внешнее кодирование звукоданных осуществляется путем добавления восьми проверочных символов (байтов) к каждым восьми информационным. В настоящее время этот формат является устаревшим, но принципиальные технические решения этого формата послужили в определенном смысле стартовой площадкой при создании современных компонентных систем цифровой видеозаписи [12]. 6.4 Цифровой формат DCT В 1992 г. фирмой Ampex на основе принципов композитного формата D2 разработан компонентный формат DCT, предназначенный для использования в студиях постпроизводства. Этот формат основан на норме 601 МККР (CCIR 601) [13]. Скорость 19,01 мм (3/4’) ленты 13,17 см/с обеспечивает до 208 мин видеозапись, частота вращения БВГ 90 Гц, выборка составляющих изображения по 8 бит, 4 аудиоканала (48кГц, 20 бит), частоты дискретизации: яркостной составляющей FY=3,5 МГц, цветоразностных сигналов FR-Y= FB-Y = 6,75 МГц, При такой ширине ленты практически невозможно создать конкурентоспособную видеокамеру. Так как система DCT оказалась лишь совершенной системой компоновки телевизионных программ, то в настоящее время она практически не применяется. 6.5 Цифровой формат D5 В начале 1989-1990 гг. Panasonic разрабатывает компонентный формат DX10, впоследствии получивший наименование стандарта D5, который использует общую техническую платформу формата D3. Формат D5 предлагает более высокое качество, которое достигается благодаря увеличению числа разрядов цифрового представления видеосигнала с 8 до 10, но он 61
также совместим с форматом D3, благодаря чему обеспечивает высококачественную взаимосвязь между автономными композитными и компонентными системами. Этот формат основан на норме 601 МККР (CCIR 601) [13]. Скорость 12,65 мм (1/2’) ленты 16,228 см/с обеспечивает до 123 мин видеозапись, частота вращения БВГ 100 Гц, выборка составляющих изображения по 10 бит, 4 аудиоканала (48кГц, 20 бит), частоты дискретизации: яркостной составляющей FY=13,5 МГц, цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц. Многие параметры формата D5 имеют большую степень общности с параметрами D3 (рис. 6.3). Видеофонограммы форматов D3 и D5 во многом одинаковы: шаг строчек записи, минимальная длина волны записи, канальный код, спаривание звуковых секторов. Одинаковы также диаметр и частота вращения барабана, имеют много общего конструкция и компоновка барабанов видеоголовок. Оба формата предполагают одинаковую поверхностную плотность записи (13 Мбит/см2). Увеличение скорости потока записываемых данных, связанное с компонентной формой представления видеосигнала, достигается в аппаратах формата D5 за счет перехода к четырехканальному принципу построения видеоканала. Запись осуществляется сразу четырьмя вращающимися видеоголовками при удвоенной скорости транспортирования магнитной ленты. Естественно, это приводит к двукратному уменьшению длительности записи на одну кассету. Если в аппаратах формата D3 за один оборот барабана записывается четыре строчки, то формат D5 предполагает запись восьми строчек за оборот. В этом принципиальное отличие форматов. Однако общее подобие параметров форматов делает сравнительно простым обеспечение совместимости D5 с D3 в рамках единой технологии 1/2" цифровой видеозаписи. Рассмотренный формат отличен для обработки сигнала и архивирования, но к настоящему времени не получил коммерческого успеха [5]. 6.6 Цифровой формат Digital Betacam В 1993 г. фирма Sony руководствуясь тем, что в настоящее время в мире используется очень большое количество аппаратов Betacam и Betacam SP и существует огромное количество архивов телевизионных программ этих форматов, разработала совместимый с этими форматами формат компонентной цифровой видеозаписи Digital Betacam. На рисунке 6.4 показана сигналограмма формата Digital Betacam. Каждое телевизионное поле записывается на шести наклонных дорожках. Соседние дорожки записываются с азимутальным разворотом рабочих зазоров видеоголовок приблизительно на ±15о.
62
Рис. 6.4. Сигналограммы цифровых форматов Digital Betacam и Betacam SP На рисунке 6.4 показана также структура дорожек формата Betacam SP. Продольные дорожки сигналов временного кода и управления идентичны в двух форматах, монтажная звуковая дорожка в формате Digital Betacam совпадает с дорожкой второго звукового канала в Betacam SP. В формате Digital Betacam записывается четыре цифровых канала звука, причем звуковые секторы расположены в середине наклонных дорожек, что обеспечивает лучшую защиту звуковых данных от возможных дефектов, связанных с краевыми повреждениями ленты и неполным совмещением траектории головок воспроизведения со строчками записи из-за растяжения ленты. Дорожки содержат также блоки пилот-сигналов: низкочастотный пилот-сигнал Fl =400 кГц и высокочастотный Fh=4 МГц, которые используются для обеспечения точного совмещения траектории головок со строчками записи при воспроизведении и монтаже в режиме вставки. Формат основан на рекомендации 601 МККР (CCIR 601) [13]. Скорость 12,65 мм (1/2’) ленты 9,67 см/с обеспечивает до 124 мин видеозапись, частота вращения БВГ 75 Гц, выборка составляющих изображения по 10 бит, 4 аудиоканала (48кГц, 20 бит), частоты дискретизации: яркостной составляющей FY=13,5 МГц, цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц. Блок вращающихся головок состоит из четырнадцати головок: четырех головок записи, четырех головок опережающего воспроизведения с динамическим трекингом, четырех головок сквозного воспроизведения и двух головок стирания [13]. Кодирование с целью сокращения избыточности телевизионного сигнала и уменьшения скорости цифрового потока построено по схеме с дискретным косинусным преобразованием (DCT - Discrete Cosine Transform). В системе кодирования, обнаруживающего и исправляющего ошибки в канале записи-воспроизведения, используется код Рида-Соломона, и для внешнего и для внутреннего кодов [10, 11, 14]. В качестве канального кода используется скремблированный код без возвращения к нулю (БВНМ) в сочетании с парциальным кодированием класса IV. При воспроизведении ис 63
пользуется процедура декодирования Витерби. При обработке звуковых данных также используется общее внутреннее кодирование и более мощное внешнее кодирование [13]. По результатам опроса, проведенного в апреле 1997 г. журналом TVB, формат Digital Betacam был признан в Европе самым перспективным. В 1999 г. его рейтинг составлял 35%. В настоящее время это идеальный формат для архивирования или использования в эфирных комплексах [5]. 6.7 Цифровой формат D6 В 1993 г. фирмами Toshiba и BTS специально для записи цифровых телевизионных сигналов высокой четкости (ТВЧ или HDTV) с соотношением сторон изображения 16:9 разработан цифровой широкополосный формат D6 [5]. Он рассчитан на исключительно высокую пропускную способность до 1,2 Гбит/с. Запись цифровых сигналов ТВЧ осуществляется на кассету с 19,01мм (3/4') лентой наклонно-строчным способом в виде блоков цифровых данных. В каждом блоке находятся данные о видеосигнале и звуке, вспомогательной и служебной информации, а также содержится запись параметров и местоположения специальных зазоров, облегчающих монтажные операции. Шаг дорожки записи - 21 мкм, угол наклона дорожек ±15o. Продолжительность записи до 64 мин. Отличительной чертой аппаратуры D6 является невероятно эффективная встроенная система коррекции ошибок. При вероятности появления сбоев на ленте (обусловленных системой лентаголовка) не более 4х10-4, выходной сигнал с аппаратуры D6 может содержать битовые ошибки, но их вероятность появления не превышает 10-11. 6.8 Цифровой формат D9 (Digital S) В середине 90-х г. фирмой JVC предложен видеоформат, обеспечивающий запись 8-битных компонентных (раздельно оцифрованы яркостная и две цветоразностные компоненты) сигналов с соотношением частот дискретизации 4:2:2 для сигналов яркости и цветности: для яркостной составляющей FY=13,5 МГц, для цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц. Скорость передачи данных - 50 Мбит/с. Формат основан на рекомендации 601 МККР (CCIR 601). Скорость 12,65 мм (1/2’) ленты 5,78 см/с обеспечивает до 104 мин видеозапись, частота вращения БВГ 75 Гц, скорость лента-головка – 14,5 м/с, выборка составляющих изображения по 8 бит, 2 или 4 аудиоканала (48кГц, 20 бит) [1,15]. Полудюймовая (12.65 мм) лента дала возможность использовать существующие проверенные высоконадежные лентопротяжные механизмы, обеспечивающие совместимость с форматом S-VHS, записывать широкие наклонные дорожки с данными (видео, аудио, субкод), записывать 2 линей 64
ные аудиодорожки (вспомогательные) и дорожку управления. Каждый видеокадр записывается на 12-ти наклонных дорожках шириной 20 мкм и углом наклона 5,96 градусов (рис. 6.5). Для более точного совмещения траектории движения головок воспроизведения с дорожками записи в формате используются также данные, записываемые вращающимися головками на наклонных дорожках в TI секторах (рис. 6.5).
65
Рис. 6.5. Сигналограммы цифрового формата D9 Кодирование с целью сокращения избыточности телевизионного сигнала и уменьшения скорости цифрового потока построено по схеме с дискретным косинусным преобразованием (DCT - Discrete Cosine Transform). В системе кодирования, обнаруживающего и исправляющего ошибки в канале записи-воспроизведения, используется код Рида-Соломона для внешнего и внутреннего кодов. В качестве канального кода используется скремблированный код без возвращения к нулю (БВН) [10, 11, 14]. При обработке звуковых данных используется общее внутреннее кодирование и более мощное внешнее кодирование с использованием кода Рида-Соломона [13]. 66
Формат Digital S предусматривает обмен данными в компрессированном виде в форме DIF-последовательностей. Такой интерфейс может использоваться для обмена видеосигналами между видеомагнитофонами Digital S без выполнения операций декодирования и кодирования (декомпрессии и компрессии). Данный формат предназначен в основном для художественного видеопроизводства. Высокая устойчивость к выпадениям и высокая цветовая четкость – основные его достоинства. Однако из-за слабой маркетинговой политики он не пользуется особой популярностью среди профессионалов [5]. 6.9 Цифровой формат Betacam SX В середине 90-х г. фирмой Sony предложен видеоформат Betacam SX, обеспечивающий запись 8-битных компонентных (раздельно оцифрованы яркостная и две цветоразностные компоненты) сигналов с соотношением частот дискретизации 4:2:2 для сигналов яркости и цветности: для яркостной составляющей FY=13,5 МГц, для цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц. Скорость передачи данных - 18 Мбит/с. Формат основан на рекомендации 601 МККР (CCIR 601). Скорость 12,65 мм (1/2’) ленты 5,9575 см/с обеспечивает до 194 мин видеозапись, частота вращения БВГ 75 Гц, угол наклона строчки 4,62о, выборка составляющих изображения по 8 бит, 4 аудиоканала (48кГц, 16 бит) [17], компрессия 10:1, MPEG-2 422P@ML (см. раздел «Технология компрессии MPEG»). Betacam SX стал первым форматом цифровой видеозаписи, предусматривающим применение системы компрессии MPEG-2. До этого компрессия MPEG-2 уже применялась при выдаче цифровых телевизионных программ в эфир и при передаче программных материалов по сетям и линиям коммуникаций. На рисунке 6.6 показаны параметры сигналограммы формата Betacam SX. При записи телевизионного сигнала группа изображений, состоящая из 2 кадров, записывается на 12 наклонных строчках, ширина и шаг которых соответственно 32 и 64мкм. Пакеты звуковых данных располагаются в середине наклонных строчек, что обеспечивает их дополнительную защиту.
67
Рис. 6.6. Сигналограмма цифрового формата Betacam SX Альтернатива, предлагаемая в аппаратах Betacam SX для надежного воспроизведения записанного сигнала для полевых условий, заключается в увеличении числа головок воспроизведения. Головки объединяются в пары, траектории движения которых смещены друг относительно друга на половину шага наклонных дорожек. Если одна головка полностью сошла с дорожки, то другая следует точно по середине дорожки (рис. 6.7). Хотя головки A1 и A2 воспроизводят сигналограмму одной дорожки в разное время, цифровая техника позволяет объединять сигналы двух видеоголовок и воспроизводить все записанные на дорожке данные независимо от трекинга. Такой способ работает эффективно и в том случае, когда дорожка искривлена, например, из-за растяжения ленты. Таким образом, исчезает необходимость применения сложной механики ЛПМ видеомагнитофонов. Упрощается и удешевляется обслуживание аппаратов. Смена барабана головок становится процедурой, которая может выполняться в полевых условиях и после которой не требуется никаких юстировок. Надежное считывание записанных данных может выполняться при скоростях, в 4 раза превышающих нормальную. Такой режим используется для перевода записанных материалов с ленты на жесткий магнитный диск встроенного в видеомагнитофон дисковода или диск внешнего сервера.
Рис. 6.7. Двухголовочный трекинг формата Betacam SX
68
Значительный объем проверочных данных (общий усредненный их объем превышает 80%), обеспечивающих защиту как от флуктуационных шумов, так и от ошибок, обусловленных выпадениями, царапинами на ленте и загрязнением головок, является отличительной особенностью формата Betacam SX. Кодирование с целью устранения пространственной избыточности основано на дискретном косинусном преобразовании (DCT - Discrete Cosine Transform). Кодирование, сокращающее временную избыточность, предполагает дифференциальную импульсно-кодовую модуляцию. Таблицы квантования и энтропийного кодирования соответствуют спецификации MPEG2 [6,10,11,14]. Кодек компрессии Betacam SX (MPEG-2 422P@ML) строится на 3 больших интегральных схемах (рис. 6.8). В качестве буферной памяти вместе с каждой интегральной схемой обработки сигналов используются микросхемы быстрой оперативной памяти. В виде отдельной интегральной схемы выполнен измеритель вектора движения, выполняющий оценку сначала с точностью до 1 пиксела, а затем – до 1/2 пиксела. В структурных схемах кодера и декодера (рис. 6.9 и 6.10) можно найти все элементы общей системы видеокомпрессии MPEG-2, приложением которой является кодек формата Betacam SX.
Рис. 6.8. Структурная схема кодека копрессии Betacam SX (MPEG@ML)
Рис. 6.9. Структурная схема кодера SX 69
Рис. 6.10. Структурная схема декодера SX Формат Betacam SX обеспечивает вещательное качество изображения от съемки до компоновки программ. Оборудование этого формата позволяет монтировать материал прямо на месте (в полевых условиях) и передавать его по каналам связи с высокой скоростью без потери качества. При переносе видеоматериалов между аппаратами формата Betacam SX используется последовательный цифровой интерфейс SDTI (последовательный цифровой интерфейс передачи данных), обеспечивающий четырехкратную скорость передачи, с аппаратурой цифровых форматов используется интерфейс SDI (последовательный цифровой интерфейс). Оборудование Betacam SX совместимо с аналоговой аппаратурой форматов Betacam, Betacam SP. Сфера формата Betacam SX – производство программ новостей, а также спортивных передач, документальных фильмов и других подобных программ. В 2000 г. были опубликованы результаты ежегодного опроса главных операторов программ новостей, работающих в телекомпаниях США [18]. Цель опроса – определить, кто «Номер 1» среди цифровых форматов для электронной журналистики: 49 процентов телекомпаний, предполагающих перейти к цифровым технологиям в сфере программ новостей, рассматривают Betacam SX в качестве основного варианта, 29% операторов программ новостей уже использовали Betacam SX. В результате победителем 2000 г. в соревновании форматов цифровой видеозаписи был признан формат Betacam SX. Чем это можно объяснить? Это формат видеозаписи, технические решения которого позволяют создавать аппаратуру компактную, надежную и более дешевую, чем ее нецифровые аналоги, для тех сфер телевидения, в которых производительность и экономичность являются приоритетными факторами. Betacam SX представляет собой приложение открытого стандарта MPEG-2, пригодного для всех стадий процесса производства телевизионных программ. Совместимость с 70
Betacam SP превращает его в наиболее краткий и экономически эффективный путь перехода от аналоговых к цифровым сетевым технологиям. Следующие рассматриваемые форматы: DV, DVCAM и DVCPRO, судя по имеющимся многочисленным публикациям, дают абсолютно одинаковое качество изображения. Сравнительно недорогое оборудование этих форматов позволяет их использовать малобюджетными телевизионными компаниями как альтернативу сравнительно дорогому оборудованию Betacam SP [22]. 6.10 Цифровой формат DV Это бытовой формат цифровой компонентной видеозаписи с обработкой по стандарту 4:2:0 (PAL) потоком 25 Мбит/с на 1/4-дюймовую (6,35 мм) ленту длительностью до 4,5 ч при качестве, близком к вещательному. Этот формат разработан консорциумом DV, объединившим в 1993 г. десять основных производителей бытовой аппаратуры: Panasonic, Philips, Sony, Thomson, Hitachi, JVC, Mitsubishi, Sanyo, Sharp, Toshiba. Каждый кадр располагается на 12-ти наклонных дорожках шириной 10 мкм (рис. 6.11). На наклонные дорожки с шагом и шириной 10 мкм записываются видео/аудиоданные, субкод, служебные данные (ITI - Insert and Track Information). Часть области субкода используется для записи вспомогательных данных и сигналов временных кодов: линейного LTC и полевого VITC. Продольных дорожек нет. Применяется алгоритм внутрикадрового сжатия, использующий метод DCT (дискретного косинусного преобразования Discrete Cosine Transform), квантование коэффициентов DCT, энтропийное кодирование последовательности квантованных коэффициентов DCT, с коэффициентом компрессии 5:1 [14,20,21]. В 1998 г. Международная электротехническая комиссия IEC (International Electrotechnical Commission) приняла формат DV в качестве международного стандарта IEC 61834, регламентирующего систему наклонностройчной цифровой видеозаписи бытового назначения с использованием магнитной ленты шириной 6,35 мм (Helical-scan digital video cassette recording system using 6,35 mm. nagnetic tape for consumer use) [20]. Кассеты, записанные в формате DV, могут воспроизводиться на некоторых моделях аппаратов форматов DVCPRO и DVCAM. Для передачи данных в оборудовании этого формата предусмотрен универсальный последовательный интерфейс IEEE-1394, позволяющий переносить цифровые файлы напрямую на жесткий диск компьютера [19]. Так как цена оборудования невысокая, оно довольно надежное, ремонт и обслуживание дешевое, то в настоящее время десятки тысяч телецентров в самых разных странах мира, включая и нашу страну, используют формат 71
DV в экспресс-новостях, съемках путешествий, подводных съемках и т.п. [1]. 6.11 Цифровой формат DVCAM Профессиональный формат видеозаписи фирмы Sony разработан для записи компонентного цифрового сигнала потоком 25 Мбит/с на 1/4" (6,35 мм) ленту с металлическим напылением с обработкой по стандарту 4:2:0 (PAL) длительностью до 180 минут. Скорость ленты 2,8221 см/с, частота вращения БВГ 150 Гц, соотношение частот дискретизации 4:2:0 выборки по 8 бит для яркостной составляющей FY=13,5 МГц и для цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц (красный и синий цветоразностные сигналы записываются через строку), 2 или 4 аудиоканала (соответственно: 48кГц или 32кГц, 16 бит или 12 бит), ширина полосы частот при записи сигнала яркости 5,5-5,75 МГц, отношение сигнал/шум более 55 Дб. Видеофонограмма аналогична формату DV, имеет по существу те же параметры записи на ленту, что и DV, но шаг и ширина дорожек увеличены до 15 микрон (вместо 10 микрон у DV), нет предохранительной полосы между дорожками, а скорость движения ленты в полтора раза выше, чем у DV. Как видно из рисунка 6.11а применена азимутальная сегментная запись двумя головками с немного разными азимутальными углами, каждый кадр записывается на 12 (PAL) наклонных дорожках. На наклонных дорожках записывается видео/аудиосигнал, субкод и временный код, служебные данные (ITI). Рассмотрим структуру наклонной дорожки To (рис. 6.11б). В начале дорожки записывается сектор ITI (Insert and Track Information - информация о вставке и трекинге), содержащий преамбулу, зону SSA (Start Sync.Area зона стартовых синхроблоков), зону TIA (Track Information Area - зона информации о дорожках) и постамбулу. В зоне TIA записывается идентификатор применения APT (Application ID), определяющий структуру данных дорожки для бытового и профессионального применений, указатель шага дорожек (7, 10 или 15 мкм) и данные сервоуправления, которые определяют параметры пилот-сигнала, подаваемого на систему автоматического регулирования (САР). Пилот-сигнал с частотой f1=449,5 кГц идентифицирует дорожку F0, а пилот-сигнал f2=674,5 кГц - дорожку F1; на дорожке F0 пилот- сигналы не генерируются, но она опознается по узким провалам глубиной 9 дБ на частотах f1 и f2 огибающей спектра модулированного сигнала записи (применен канальный код 24-25 [14]). 72
а)
Не (нижний край программной зоны ) -0,56 мм, Но (верхний край программной зоны) 5,80 мм, We (ширина программной зоны) - 5,24 мм, Wt (ширина ленты) - 6,350 мм, М1 (длина сектора ITI) - 0,878 мм, M2 (длина звукосектора) - 2,817 мм, М3 (длина видеосектора) - 27,616 мм, М4 (длина сектора подблока) - 0,878 мм, Hx (длина преамбулы сектора ITI) - 0,341 мм, Х0 (начало зоны SSA) - 0 мм, Х1 (начало синхроблоков звукосектора) - 0,811 мм, X2 (начало синхроблоков видеосектора) - 3,799 мм, X3 (начало синхроблоков сектора подкода)- 31,963 мм, Em (длина запасной зоны записи) 0,305 мм, Lr (длина рабочей зоны) - 32,598 мм, r (угол наклона дорожки) - 9,150о, 0 (азимутальный угол дорожки T0) - 19,97о, 1 (азимутальный угол дорожки T1) - 20,03о, Тр (шаг дорожек) - 0, 015 мм
Рис. 6.11. Сигналограмма формата DVCAM (DV, DVCPRO**) (а) и структура наклонной дорожки To (б) б)
*
Форматы DV, DVCPRO отличаются шагом и шириной дорожек и скоростью магнитной ленты
73
В кадре дорожки расположены в порядке F0, F1, F0, F2 и т.д. Далее идет межсекторный промежуток G1 (аналогично G1, G2), "выбирающий" ошибки лентопротяжного механизма (ЛПМ) при монтаже и защищающий постамбулу ITI и преамбулу звукосектора от неумышелнного стирания. Звукосектор содержит программные и вспомогательные звукоданные [21]. Благодаря ITI и временному коду, который записывается в области субкода, удается достичь высокой точности в процессе монтажа. Так же как и в формате DV, в формате применяется алгоритм внутрикадрового сжатия, использующий метод DCT (дискретного косинусного преобразования - Discrete Cosine Transform), квантование коэффициентов DCT, энтропийное кодирование последовательности квантованных коэффициентов DCT с коэффициентом компрессии 5:1 [14,20,21]. Для передачи данных между аппаратами формата DVCAM используется интерфейс QSDI (четырехкратный последовательный цифровой интерфейс), обеспечивающий четырехкратную скорость передачи данных. В некоторых аппаратах DVCAM используется компьютерный интерфейс IEEE-1394 [19]. 6.12 Формат цифровой записи D7 (DVC PRO) DVCPRO фирмы Panasonic изначально был предназначен для станций телевещания и распространяется именно на этом рынке. Этот формат разработан для записи компонентного цифрового сигнала потоком 25 Мбит/с на 1/4" (6,35 мм) ленту с металлическим напылением длительностью до 126 минут. Скорость ленты 3,3854 см/с, частота вращения БВГ 150 Гц, соотношение частот дискретизации 4:1:1 выборки по 8 бит для яркостной составляющей FY=13,5 МГц и для цветоразностных сигналов FR-Y= FB-Y= 3,375 МГц, 2 аудиоканала (48кГц, 16 бит), ширина полосы частот при записи сигнала яркости 5,5-5,75 МГц, отношение сигнал/шум более 55 Дб. Каждый кадр изображения записывается на 12-ти дорожках (PAL) шириной 18 мкм. Имеются две продольные дорожки - режиссерская (монтажная) и управляющая. Применяется алгоритм внутрикадрового сжатия, использующий метод DCT с коэффициентом компрессии 5:1 [14]. Для передачи материала с увеличенной в 4 раза скоростью используется интерфейс CSDI (последовательный цифровой интерфейс для передачи сжатых данных), интерфейс IEEE 1394 добавлен только в последних моделях. 6.13 Формат DVCPRO 50 Формат DVCPRO 50 - формат видеозаписи фирмы Panasonic характеризуется скоростью передачи видеоданных 50 Мбит/с, обработкой сигнала по стандарту 4:2:2, четырьмя несжатыми каналами звука 16бит/48 кГц. Для 74
записи одного кадра используются 24 наклонные дорожки. Имеются 2 продольные дорожки - режиссерская (монтажная) и управления. Здесь предусмотрен способ внутрикадрового сжатия с коэффициентом компрессии 3.3:1. Возможен покадровый монтаж. Скорость движения ленты по сравнению с DVCPRO в 2 раза больше – 6,7626 см/с. Время записи на 1/4" кассеты DVCPRO 50 – 61,5 и 31,5 минут. Совместим с форматом DVCPRO. 6.14 Формат DVCPRO 100 Формат DVCPRO 100 - формат видеозаписи фирмы Panasonic характеризуется скоростью передачи видеоданных 100 Мбит/с, обработкой сигнала по стандарту 4:2:2, четырьмя несжатыми каналами звука 16бит/48 кГц. Для записи одного кадра используются 48 наклонных дорожек. Имеются 2 продольные дорожки - режиссерская (монтажная) и управления. Время записи на 1/4" кассеты DVCPRO 100 – от 45 до 120 минут. В 1999 г. журналом TVB Europe опубликованы результаты ответов на вопрос: "Какой видеоформат будет доминировать в будущем европейском вещании?". В результате выяснилось, что в ответах на долю DVCPRO приходится 7%, на долю DVCAM – 5% [23]. Журнал “Television Broadcast” (January 2000, volume 23, issue 1, p.14) опубликовал результаты ежегодного опроса главных операторов программ новостей, работающих в телекомпаниях США. Цель опроса – определить, кто «Номер 1» среди цифровых форматов для электронной журналистики. 49 процентов телекомпаний, предполагающих перейти к цифровым технологиям в сфере программ новостей, рассматривают Betacam SX в качестве основного варианта (на втором месте - DVCPRO с 42% голосов). Еще более показательны следующие данные опроса. Сейчас 31% процент операторов программ новостей использует Betacam SP, 29% - Betacam SX, 21% DVCPRO. 6.15 Цифровой формат видеозаписи MPEG IMX (D10) Разработанные как цифровая замена видеомагнитофонов Betacam SP аппараты Betacam SX записывают видеоинформацию с использованием цифрового сжатия согласно стандарту MPEG-2 4:2:2P@ML с потоком 18 Мбит/с. В настоящее время стандарт Betacam SX широко распространился во всем мире в целях производства различных программ, начиная с программ для видеожурналистики и спорта и заканчивая обычными телепрограммами и теледрамой. После внедрения стандарта Betacam SX некоторые пользователи начали предъявлять дополнительные требования. Речь идет о реализации сетевых систем на основе цифрового сжатия, причем с увеличенным до 50 Мбит/с по 75
током, т.е. до верхнего предела стандарта MPEG-2 4:2:2P@ML. Это обеспечило бы повышение ценности продукции, создаваемой аппаратами MPEG-2 4:2:2P@ML, а также позволило бы поддерживать высокое качество исходного программного материала, что особенно касается материалов, подвергаемых сложной обработке в процессе компоновки программ. Отвечая этим требованиям, Sony разработала новую систему для производства вещательных программ — MPEG IMX (D10). Этот формат разработан для записи компонентного цифрового сигнала потоком 50 Мбит/с с компрессией MPEG -2 4:2:2 P@ML (см. раздел «Технология компрессии MPEG») на 12,65 мм (1/2’) ленту длительностью до 220 минут. Скорость ленты 5,3776 см/с, частота вращения БВГ 50 Гц, 4 или 8 аудиоканала (соответственно 48кГц, 24 бит или 18 кГц, 16 бит).
А (нижний край дорожки временного кода) - 0 мм, В (верхний край дорожки временного кода) - 0,4 мм; С (нижний край дорожки управления) - 0,7 мм; D (верхний край дорожки управления) - 1,1 мм; E (нижний край программной зоны) - 1,597 мм; F(верхний край программной зоны) - 11,465 мм; I (шаг наклонных дорожек) - 0,02 мм; J (шаг наклонных дорожек) - 0,0434 мм;. K1 (длина видеосектора 1) - 47,032 мм; К2 (длина видеосектора 2) - 47,032 мм; L (полная длина наклонной дорожки) – 122,092 мм; M (длина звукосектора) - 2,93 мм; (N 9длина сектора микрослежения) 1,002 мм; Р1 (расстояние между опорной точкой программной зоны и опорным импульсом дорожки управления) – 47,228 мм; Р2 (расстояние между стартовым битом временного кода и опорным импульсом дорожки управленгия) - 178,792 мм; W (ширина ленты) - 12,65 мм, X1 (начало видеосектора 0) – 0 мм; X2 (начало видеосектора 1) –75,06 мм; начало 8-ми звуковых секторов: Х3=47,558; X4=50,745; X5=53,932; X6=57,119; Х7=62,111; Х8=65,298; Х9=68,485; Х10=71,673 мм; Y (положение опорной точки программной зоны)- 1,629 мм; Θ (угол наклона дорожки)- 4,62644о; α0 (азимутальный угол)- -15,269о; α1 (азимутальный угол)- +15,231о
Рис. 6.12. Сигналограмма видеоформата D10
76
Как видно из рисунка 6.12, в формате применяется азимутальная запись наклонных дорожек. В отличие от Betacam SX сервисная (верхняя) продольная дорожка не записывается. В начале наклонной дорожки записывается видеосектор V0, содержащий программные видеоданные, начало которого определяет опорная точка программной зоныY. Затем следуют звукосекторы А0-А3, сектор микрослежения ST (Servo tracking), звукосекторы A4-A7 и видеосектор V1 [24]. Открытая технология видеопроизводства по стандарту D10 (MPEG-2 4:2:2P@ML с потоком 50 Мбит/с) дает значительные преимущества в отношении качества программ, производительности и снижения стоимости производственных операций. Все изделия MPEG IMX Sony действуют с потоком 50 Мбит/с при внутрикадровом сжатии и способны взаимодействовать с многими устройствами, пригодными для обмена данными MPEG-2 с использованием стандартных интерфейсов. Легко реализуемая подача воспроизводимых накопленных программных материалов в комплексы, созданные для потока 50 Мбит/с, предоставляет пользователям возможность эволюционного перехода на инфраструктуры с потоком 50 Мбит/с. Таким образом, в 2002 г. фирма Sony стала первым производителем видеооборудования, предложив полностью цифровую видеосистему MPEG2 (50Мбит/с) "от видеосъемки до передачи".
77
7 ВИДЕОЗАПИСЬ НА ДИСКИ 7.1 Фотографическая видеопластинка Одновременно с разработкой ВМ фирмы Ampex в 1957 г. итальянец Рубино сконструировал видеопроигрыватель, в котором использовалась пластинка из оргстекла с тонким слоем светочувствительного материала на поверхности. При частоте вращения 50 Гц длительность записываемого телевизионного сигнала составляла 3 мин. [4]. В 1961-1963 гг. в США был разработан стеклянный фотографический диск диаметром 30 см для записи телевизионного сигнала длительностью 30 мин. Запись осуществлялась лазерным лучом. В 1973 г. фирма Merix (США) усовершенствовала эту пластинку, сделав ее более тонкой из лавсана. Запись осуществлялась также лазерным лучом, а воспроизведение кварцево-галогенной лампой. Частотный диапазон передачи составил 3 МГц при отношении сигнал/шум 40 дБ, разрешение -250 строк. 7.2 Магнитная видеопластинка В 1973г. фирма Bogen (Западный Берлин) продемонстрировала магнитную видеопластинку диаметром 30 см, на которую с помощью универсальной магнитной головкой с зазором 0,2 мкм осуществлялась запись на спиральную дорожку шириной 50 мкм при 156 об/мин ЧМ телевизионного сигнала длительностью 5 мин. 7.3 Механическая видеозапись Простота и дешевизна грампластинок привлекла специалистов использованием их для видеозаписи. В 1970 г. в ФРГ и Англии, применяя более узкие канавки и уменьшенный шаг записи, получили при диаметре видеопластинки 21 см длительность записи телевизионного сигнала 5 мин. В 1972г. фирма Teldeck (Англия) разработала видеопластинку TED (television disk) диаметром 21 см при 1500 об/мин для записи цветного телевизионного сигнала длительностью 10 мин. Плотность поперечной записи составила 280 канавок/мм, диапазон записываемых частот 3 МГц при отношении сигнал/шум 40 дБ, разрешение 250 строк. Воспроизведение осущесвлялось пьезоэлектрическим сигналоснимателем, соединенным с алмазным щупом в виде санного полоза. В 1973 - 1974гг. фирма RCA (Radio Corporation of America) разработала видеопластинку из металлического материала с рельефом, заполненным диэлектриком диаметром 30 см для записи ЧМ цветного телевизионного сигнала в вакууме длительностью 30 мин. При воспроизведении сапфировый щуп с микроэлектродом фиксирует изменение рельефа электрической 78
емкости рельефного слоя. Диапазон записываемых частот 3,5 МГц при отношении сигнал/шум 36 дБ, разрешение 250 строк. В 1972 –1974гг. фирмы Philips (Голландия), MCA (США) и Tomson (Франция) разработали видеопластинки VLP (Video Long Play), Discovision и Tomson, которые были изготовлены из прозрачной пластмассы с металлическими углублениями и защитным слоем для записи ЧМ цветного телевизионного сигнала длительностью 20-30 мин. Их особенностью является то, что видеосигнал записывается и воспроизводится лучом лазера. С 1980г. по совместному предложению фирм Sony и Philips для записи видеоинформации стали применять пластинки, аналогичные звуковым компакт-дискам CD-CDV (Compact Disk Video). С 1990г. выпускаются оптические цифровые видеопластинки, LD (laser disk) двух типов: записываемые с постоянными угловой (CAV) и линейной (CLV) скоростями. Проигрыватели этих дисков используют отражение лазерного луча от механического микрорельефа пластинки и обеспечивают хорошее качество воспроизведения цветной видеозаписи. Некоторые данные оптических дисков представлены в таблице 7.1. Т а б л и ц а 7.1 Основные технические характеристики оптических дисков Параметр Диаметр, см Число оборотов, об/мин Скорость воспроизведения, м/с Длительность записи, мин
Лазерный диск (LD) Двухстороннее проигрывание CAV CLV 20 или 30 20 или 30 1800 1800-600 Постоянная
10,4-11,4
20/30
40/60
Компакт-диск Одностороннее проигрывание CD-V (single) CD 12 12 2700-1800 500-200 500-330 (звук) 11-12 1,25 1,2-1,4 (звук) 5 (видео+звук) 74 звук 20 (звук)
7.4 DVD-Video В 1994 году специальный комитет (Motion Picture Studio Advisory Committe), созданный по инициативе ведущих голливудских компаний, сформулировал основные требования к фильмам на компакт-дисках: − разрешение видео выше, чем у лазерных дисков; − CD-качество звука и объемное звучание; − не менее 133 минут видео на одной стороне диска; − одновременно от 3 до 5 различных вариантов языков с возможностью выбора; − от 4 до 6 различных вариантов субтитров (на тех же или других языках); 79
− различные форматы отображения широкоэкранного видео на экране; − возможность запрета просмотра определенных сцен детьми (функция родительской защиты); − надежная защита от копирования; − совместимость с существующими CD дисками (на воспроизведение); − разделение на части и независимый доступ к ним; − и, наконец, низкая стоимость производства, сравнимая с достигнутой для CD дисков. В качестве возможных претендентов были изучены различные форматы, в том числе Super Disc (SD), предложенный в 1995 году компаниями Toshiba и Warner, и Multimedia CD (MMCD), в том же году анонсированный их извечными соперниками Philips и Sony. В качестве компромисса, призванного примирить претендующие на “царство” конкурирующие решения, в конце 1995 года объединением 10 мировых лидеров, получившим название DVD Consortium и объединившим Hitachi, Matsushita, Mitsubishi, Philips, Pioneer, Sony, Thomson, Time Warner, Toshiba и JVC, было достигнуто соглашение и утверждена спецификация стандарта DVD дисков, включающая следующие основные положения: − 133 минуты или более высококачественного MPEG-2 видео с многоканальным “объемным” звуком; − до 8 языков звукового сопровождения; − субтитры на 32 языках; − интерактивное разветвленное меню с произвольным доступом к различным главам и вариантам отображения; − возможность задания и пользовательского выбора до 9 углов зрения (camera angles) на показываемый объект; − цифровые и аналоговые защиты от копирования. Первоначально DVD означал сокращение от Digital Video Disc (цифровой видеодиск), позже он стал означать Digital Versatile (многофункциональный) Disc. В 1996 году были опубликованы спецификации DVD-ROM и DVD-Video форматов (версия 1.0), а в конце 1996г. в Японии были проданы первые DVD плееры. С 1997г. широкие продажи DVD начались по всей Америке (в Европе – на год позже), а название DVD Consortium было изменено на DVD Forum, при этом он стал открытым для вступления новых членов. В настоящее время форум объединяет более 200 членов (из них более 20 европейских), а в его регламентирующий комитет кроме первоначальных 10 компаний вошли еще 7: IBM, Intel, NEC, Sharp, LG Electronics, Samsung, Industry Research Institute of Taiwan. Форум поддерживает и продолжает развивать спецификации DVD форматов, в его составе постоянно работают 8 групп по следующим направлениям: − DVD-Video спецификация; 80
− − − − − − −
Спецификация физических параметров DVD дисков; Файловая система DVD; DVD-Audio спецификация; DVD-RAM спецификация; DVD-R и DVD-RW спецификации; Системы защиты от копирования; Промышленные и профессиональные применения DVD. Физические параметры Внешне DVD диск напоминает CD. Действительно, оба являются оптическими дисками диаметром 12 см и толщиной 1,2 мм. Аналогичны они и по принципам записи цифровой информации. Оба состоят из прозрачной полимерной подложки, отражающего слоя и вспомогательного защитного (несущего) слоя, придающего необходимую жесткость. В отражающем слое тем или иным образом формируется своеобразная матрица - в виде закрученной в спираль дорожки с “дырками” (питами). Считывание информации производится лазерным лучом, сканирующим отражающую поверхность. Будучи подобны в принципах, диски существенно отличаются значениями ключевых физических параметров (табл. 7.2). Т а б л и ц а 7.2 Параметры СD и DVD дисков [8] Параметры Диаметр, см
CD 12
DVD 12
Физическая толщина диска, мм Число информационных сторон Толщина стороны Число информационных слоев на одной стороне Емкость диска, ГБ Минимальная длина пита, мкм Ширина пита Шаг спирали (питов), мкм Длина волны лазера, нм Числовая апертура лазера Схема модуляции данных Схема коррекции ошибок
1.2
1.2
1
1 или 2
1.2 1
0.6 1 или 2
0,68 0.83 0.5
4.7-17 0.4 / 0.44 0.5
1.6
0.74
780
635 / 650
0.45
0.6
EFM
8 в 16
CIRC
RS-PC
Комментарии В цифровых камерах иногда используют 8-см диски
Пока распространены только однослойные диски 1 гигабайт (ГБ) = 109 байт 0.4 для однослойного, 0.44 для двухслойного
635 – для коммерческих DVD-Video (for Authoring) EFM – Eight to Fourteen Modulation, 8 в 14+3 CIRC – Cross Interleaved Reed-Solomon Code, RSPC - Reed Solomon Product Code
81
Главное преимущество DVD дисков над CD, а именно, существенно более высокая информационная емкость, обусловлено более высокой поверхностной плотностью пит (рис. 7.1). Это стало возможным в силу ряда технологических решений: среди которых нужно отметить: − в 2 раза уменьшены геометрические размеры; − более чем в 2 раза уменьшен шаг спирали между соседними дорожками пит; − для надежного считывания столь “малых” пит применяются лазерный луч с меньшей длиной волны и увеличенной до 0.6 апертурой фокусирующей линзы; − используются более эффективные схемы модуляции цифровых данных и улучшенная схема коррекции ошибок, что позволило на порядок повысить надежность считывания данных (несмотря на более высокую плотность их записи).
а)
б) Рис. 7.1. Поверхность CD (а) и DVD (б) дисков
Необходимо отметить еще одно важное отличие - DVD диски всегда двухсторонние. Две стороны, по 0,6 мм каждая, склеены между собой нерабочими сторонами. В простейшем случае только одна их сторон содержит (может содержать) данные, а вторая является пустой. Более того, с каждой стороны может быть не один, а два рабочих информационных слоя. Если первый из них – “основной” - выполняется по стандартной технологии создания пит, то второй – полупрозрачный (коэффициент отражения 40%) – наносится поверх первого. Для считывания двухслойных дисков применяются оптические головки с переменным фокусным расстоянием. Луч лазера, проходя через полупрозрачный слой, сначала фокусируется на внутреннем информационном слое, а по завершении его чтения перефокусируется на внешний. В результате может быть 4 варианта дисков с емкостью от 4.7 до 17 ГБ (табл. 7.3). Пропорционально емкости возрастает допустимая длительность видеофильма, который может быть размещен на диске. Это 133 минуты для DVD-5 и каждой стороны DVD-10, но уже 240 82
минут для DVD-9 и каждой стороны DVD-18. В настоящее время пока получили широкое распространение DVD-5 и DVD-10 [8]. Т а б л и ц а 7. 3
Виды DVD Тип DVD
DVD-5
DVD-9
DVD-10
DVD-18
DVD-R
1 1
1 2
2 1
2 2
1 или 2 1
DVDRAM 1 или 2 1
4.7
8.54
9.4
17.08
4.7 или 9.4
4.7 или 9.4
Число сторон Число слоев на сторону Емкость, ГБ
Все типы дисков (DVD-Video, DVD-ROM, DVD-Audio) содержат цифровые данные в файлах, причем файловая система общая для всех UDF Bridge Format. Но DVD-Video и DVD-Audio содержат данные в особых директориях (они не могут быть пустыми), а именно в VIDEO_TS и AUDIO_TS. У “обычных” DVD-ROM эти директории отсутствуют. Поэтому нередко, говоря о DVD-ROM, подразумевают именно диск с компьютерными данными. С информационной точки зрения все данные на DVD-Video разделяются на две взаимосвязанные категории: навигационные или, по-другому, управляющие (Control Data) и собственно воспроизводимые объекты (Object or Presentation Data). Навигационные данные служат указателями (адресами) на соответствующие объекты. Здесь можно увидеть аналогию между FAT таблицей (File Allocation Table) компьютерной операционной системы и собственно файлами с данными. Объекты воспроизведения в свою очередь делятся на видео, аудио и графику. Таким образом, DVDVideo диск содержит данные четырех типов (см. таблицу 7.4). Файловая система UDF Bridge Format является комбинацией MicroUDF и ISO 9660. Она разработана ассоциацией OSTA (Optical Storage Technology Association) на базе стандарта ISO 13346 и является очень гибким, многоплатформенным стандартом, используемым, в частности, в магнитооптических накопителях и DVD. ISO 9660 – стандарт файловой системы для CD-ROM в РС приложениях. Он включен в UDF Bridge для обеспечения совместимости с существующим программным обеспечением. Т а б л и ц а 7.4 Данные, хранимые DVD Тип данных
Число потоков
Видео Аудио
1 До 8
Субтитры и графика меню Навигация
До 32
Поток данных До 9.8 Мб/с До 6.144 Мб/с До 3.36 Мб/с
1
-
Кодирование MPEG-1 или MPEG-2 LPCM, MPEG, Dolby Digital, DTS 2 бит/пиксел Program Chains (PGC)
83
Принципиальная файловая структура диска является следующей (рис. 7.2). На самом верхнем уровне DVD диск – это том (Volume), содержащий файлы данных различного типа (в рамках UDF Bridge Format системы). Том делится на зоны видео (директория Video_TS), аудио (директория Audio_TS) и зону данных остальных типов (например, компьютерных данных общего назначения, обычно составляющих основное содержимое DVD-ROM).
Рис. 7.2. Файловая структура DVD Видеозона содержит все цифровые данные, необходимые и достаточные для воспроизведения записанного DVD-Video. Все файлы DVD-Video диска находятся в VIDEO_TS директории. Согласно ограничениям MicroUDF формата, они не могут быть размером более 1 ГБ и должны быть записаны в виде непрерывной последовательности. Имена файлов удовлетворяют правилу 8.3 (8 символов – название файла, 3 – его расширение). Все другие файлы, не соответствующие данным правилам, DVD-плеером просто игнорируются. Видеозона состоит из видеоменеджера VMG (Video Manager) и набора глав VTS (Video Title Set): VTS_01, VTS_02, ….. VTS_N, где N≤99. Видеоменеджер является мастер-директорией последующего содержимого DVD-Video и фактически представляет собой базовое оглавление диска. Для зрителя он обеспечивает воспроизведение вводного клипа (короткая аудио-видео последовательность, например, логотип компании производителя) и меню для выбора одной из последующих глав. На языке файлов VMG состоит из управляющих данных (файлы Video_TS.IFO & Video_TS.BUP) и меню (Video_TS.VOB). Отметим, что на пульте управления DVD-плеером есть особая кнопка Title, нажатие которой всегда возвращает зрителя именно к этому исходному меню. Каждая глава в свою очередь состоит из меню-оглавления по разделам (навигационные файлы TS_01_0.IFO & VTS_01_0.BUP и файл меню VTS_01_0.VOB) и набора VOB файлов собственно с содержимым главы (VTS_01_1.VOB, VTS_01_2.VOB ….. VTS_01_n.VOB, где n ≤ 9). Всего в главе может быть до 10 VOB файлов, максимальный размер которых ограничен 1 ГБ. Базовой единицей файловой системы диска являются VOB (Video Object) файлы. Они включают в себя не только собственно видео и аудио, но и вспомогательные субизображения и данные по навигации. В первую 84
очередь VOB-файлы используются для записи основного содержания соответствующей главы. Кроме того, VOB файлы могут входить в состав меню главы, если оно кроме статичных картинок включает вводные видеоклипы по последующим разделам. При проигрывании VOB файла плеер не только воспроизводит аудиовидео содержание, но и подчиняется заложенным в нем инструкциям по отображению меню, по переходам на соответствующие пункты программы согласно выбору зрителя (по командам с пульта управления). Каждый VOB состоит из ячеек (Cells). Ячейка является самой мелкой единицей DVD, к которой можно адресоваться при интерактивном просмотре. Они состоят из целого числа групп изображений (MPEG GOP). Минимальная длина ячейки совпадает с MPEG GOP, но ее можно задать и равной всей главе (в этом случае разбиение на разделы уже не имеет смысла). Ячейки связаны друг с другом навигационными цепочками PGC (Program Chains), определяющими порядок воспроизведения ячеек (переходов между ними) в соответствии с выбранной программой. Очередность взаимосвязанного показа сцен и задается соответствующей цепочкой программы PGC. Таким образом, глава может иметь как одну цепочку (One_Sequental_PGC_Title), так и несколько (Multi_PGC_Title). Одни ячейки могут быть одновременно задействованы в нескольких цепочках, а на другие зритель будет попадать только в “особых” случаях. Сложность файловой структуры является обратной стороной многослойной и мультивариантной логической структуры DVD-Video. Разработка полноценного проекта, реально задействующего все возможности, действительно является трудоемкой творческой задачей, требующей тщательной проработки всех деталей. Цена профессиональных программ DVDавторинга измеряется тысячами и десятками тысяч долларов. Недавно появились разнообразные облегченные и упрощенные версии таких программ: Impression DVD-SE, Sonic DVDit! LE, Spruce MyDVD, PixelTools SimpleDVD, Ulead GoDVD и другие - стоимостью всего в несколько сотен долларов (а некоторые из них условно бесплатны), которые ограничивают пользователя минимальным набором функций: только один вариант языка, статичные меню, только стереозвук, упрощенная структура глав. Но эти программы ориентированы на непрофессионалов, сравнительно просты в начальном освоении и последующей работе. Для компрессии видео в DVD используется MPEG. Хотя использование MPEG-1 для DVD-Video и допустимо, основным алгоритмом сжатия видео является MPEG-2, причем по схеме 420 MP@ML со структурой GOP 15/3 (см. раздел «Технология компрессии MPEG»). Что касается звука, то, как уже отмечалось, DVD диски могут нести до 8 цифровых потоков аудио (вариантов звукового сопровождения для разных языков). Каждый из них, в свою очередь, может содержать от 2 (стерео) до 6 (или даже 8) каналов. В последнем случае реализуется кон 85
цепция объемного звучания 5.1 (или 7.1), при которой звук поступает к слушателю с 5 (или 7) сторон: − из центра спереди, − слева и справа спереди, − слева и справа по бокам (только для варианта 7.1), − слева и справа сзади. Последним во всех случаях является низкочастотный канал (НЧ) глубоких тонов, которые вне зависимости от места расположения одинаково доносит до зрителя особые эффекты глубоких тонов. Его еще называют сабвуфером (sub-woofer). Отметим, что в DVD проигрывателях, не оснащенных декодером объемного звука, “излишние” каналы смешиваются до стандартного стерео. DVD стандарт допускает следующие кодировки цифрового звука: LPCM, Dolby Digital, MPEG-1 и MPEG-2, DTS. LPCM (Linear Pulse Code Modulation) - единственный некомпрессированный цифровой формат. Он подобен используемому в аудио CD, но обеспечивает более качественный звук за счет увеличенных частоты дискретизации и глубины квантования. Если аудио CD – это стерео на 44.1 кГц при 16-бит, то LPCM – это от 1 до 8 каналов, частота дискретизации каждого из которых 48 или 96 кГц, глубина оцифровки 16, 20 или 24 бит. При этом полоса частот составляет 4-24000 Гц (для 48 кГц) или 4-48000 Гц (для 96 Кгц), а динамический диапазон записи – 96дБ при 16-битах и более 120 дБ при 20-разрядном [8]. Платой за такое высокое качество является слишком высокий поток, требуемый для аудио. Максимальный цифровой поток данных при LPCM составляет 6.144 Мб/с, что оставляет недопустимо мало для видео. Поэтому некомпрессированный звук используется только в стандарте DVD-Audio, но в случае DVD-Video, как правило, применяются различные схемы сжатия. Dolby Digital, известный также как AC-3 (Audio Coding 3), обеспечивает звук по схеме 5.1. Это означает 5 полноценных каналов в диапазоне 2020000 Гц и еще один НЧ канал глубоких тонов в диапазоне 20-120 Гц. Для компрессии звука используется разработанный в лаборатории Dolby специальный алгоритм (Multichannel Perceptual Coding), учитывающий особенности человеческого слуха. Он в основном пренебрегает неслышимыми или плохо различаемыми человеческим ухом звуками. Понятно, что при этом происходит определенная потеря данных, однако в результате 6 каналов берут меньше, чем 2 исходных некомпрессированных канала. В полном варианте 5.1 требуется 384 Кб/с. MPEG компрессия звука также связана с потерей данных и, как следствие, определенным ухудшением по сравнению с исходным качеством. Различают MPEG-1 и MPEG-2 форматы. Более простой MPEG-1, предназначенный только для моно или стерео звучания с постоянным потоком данных (CBR – Constant Bit Rate), характеризуется тремя возможными уровнями компрессии звука: соответственно Layer 1/2/3 (см. раздел «Технология компрессии MPEG»). 86
Однако для DVD основное значение имеет MPEG-2 формат. Он может быть многоканальным, обеспечивая объемный звук по схеме 5.1 или 7.1, может быть с переменным (VBR – Variable Bit Rate) или постоянным потоком данных в диапазоне от 32 до 914 Кб/с (суммарно). При этом частота оцифровки фиксирована (48 Кгц). Важно отметить, что для стереозвука кодирование в MPEG-1 и MPEG-2 идентично. В первоначальной формулировке DVD стандарта система MPEG-2 5.1 была определена как основная система записи звука для PAL/SECAM видеодисков (т.е. для Европы). Однако впоследствии из-за отсутствия серийно выпускаемых дешевых кодеров-декодеров многоканального звука MPEG-2 это требование было снято. И сегодня Dolby Digital вляется основным звуковым форматом для DVDVideo. Разработанный в США метод DTS (Digital Theater System) является альтернативой Dolby Digital. Он во многом повторяет принципы AC-3: те же методы компрессии и те же алгоритмы кодирования (частота дискретизации 48 Кгц, до 24 бит на отсчет), но при этом поток данных может достигать 1536 Кб/с. Первоначально разработанный для записи звуковых дорожек к кинофильмам для современных кинотеатров, DTS в последнее время стал довольно популярным. По мнению американских специалистов, он обеспечивает лучшее воспроизведение пространственных звуковых эффектов, но при этом требует в 4 раза больше данных. Отметим, что большинство современных DVD проигрывателей уже поддерживают как AC-3, так и DTS. В состав DVD-Video, кроме динамически меняющегося основного видео, могут входить фиксированные изображения (кадры) с различной информацией, требующей внимательного просмотра (чтения). Это могут быть страницы с информацией об авторских правах, предупреждения против несанкционированного копирования, слайд-шоу из включенных в содержание фотографий или сложные меню. С целью экономии дискового пространства они хранятся на диске не в виде последовательностей, а как отдельные I-кадры. Также присутствуют особые графические субизображения (произвольного размера – от нескольких пикселей до полного кадра 720х576), состоящие всего из 4-х цветов (3 + прозрачный). Они используются для отображения поверх видео субтитров, кнопок меню, другой дополнительной графической или текстовой информации. Поскольку стандартом для любого фильма допускается до 32 вариантов субтитров на различных языках (и это в дополнение к 8 вариантам звукового сопровождения), то сохранение на диске субтитров в виде самодостаточных готовых графических файлов, а не специфических кодов букв различных алфавитов, представляется более гибким и надежным решением. При этом возможность выбора одного из 3-х цветов отображения позволяет добиваться читаемости текста/графики на любом фоне. 87
Фильм на DVD-диске превосходит его VHS копию не только по качеству звука и видео. Не менее привлекательны возможность произвольного доступа к любой части записанного фильма и интерактивное управление различными функциями его просмотра. Иерархическая структура построения DVD-Video является многоуровневой и многослойной. Все содержимое диска делится на различные главы (Titles - наименования, фильмы, альбомы) – до 99 на диск. Главы в свою очередь состоят из разделов (Chapters сцен, клипов, программ) – максимальным числом также до 99. Переход на любую из частей диска может выполняться “мгновенно”. При этом каждая глава допускает несколько различных версий развития, связанных, например, с выбором угла наблюдения (камеры), варианта финала, установкой ограничений показа “жестких” сцен (защита родителей). Зритель через экранное меню с помощью дистанционного пульта может выбирать язык звукового сопровождения, вариант сопровождающих субтитров, угол камеры или даже возможное развитие сюжета, вызывать дополнительную видео и графическую информацию (биографии актеров, подробности съемки и т.д.). Защита DVD от копирования. Для защиты авторских прав и предотвращения несанкционированного распространения DVD-дисков стандартом предусмотрено специальное региональное кодирование как самих дисков, так и проигрывателей для них. Для этого весь мир условно поделен на 6 регионов, каждому из которых присваивается соответствующий код: 1 – США и Канада; 2 – Европа, Япония, ЮАР, Ближний Восток; 3 – Юго-Восточная и Восточная Азия, включая Тайвань и Гонконг; 4 – Центральная и Южная Америка, Карибские острова, Австралия и Новая Зеландия; 5 – Территория бывшего Советского Союза, Африка, Индийский полуостров (Индия, Пакистан), Монголия и Северная Корея; 6 – Китай. Для каждого из регионов выпускаются свои, предназначенные только для него, версии DVD-дисков и соответственно проигрывателей. Только при совпадении кодов проигрыватель будет воспроизводить установленный в него диск. Россия вместе с Африкой, Индией и Пакистаном попала в 5 зону, но большинство продающихся у нас дисков из Европы (2 зона) или Америки (1 зона). Впрочем, и DVD проигрыватели у нас продаются в основном для 2-й зоны. Что касается чисто российских DVD-дисков, то их ассортимент пока очень мал, но выпускают их сразу в мультизонном варианте (они могут быть воспроизведены на любом DVD плеере). Стоит отметить, что сейчас на рынке широко представлены мультизонные проигрыватели. Собственно защита от копирования (только аудио и видео) сочетает как цифровые, так и аналоговые методы. Цифровая защита основана на кодировании (“перемешивании”) исходных данных (scrambling raw data) с за 88
данными ключами, которые в свою очередь в зашифрованной форме записаны на сам диск. Декодер (плеер) расшифровывает ключи и по ним восстанавливает исходные данные. Схемы кодирования для разных типов дисков различаются. В DVD-Video используется метод CSS (Content Scrambling System), в DVD-Audio – CPPM (Content Protection for Pre-Recorded Media). В то же время записываемые диски используют CPRM (Content Protection for Recordable Media). CSS защита требует лицензирования. При этом каждому из лицензиатов “выдается” фиксированный ключ из мастер-набора, содержащего 400 различных ключей. Именно этот ключ записывается на каждый CSS-защищенный диск (соответственно, по ключу можно определить, кто его правообладатель). Аналоговая защита APS (Analogue Protection System) основана на технологии фирмы Macrovision, в соответствии с которой волновой фронт аналогового сигнала на выходе проигрывателя подвергается особому роду искажений. А именно, в состав видеосигнала вводятся особые импульсы, которые не мешают смотреть программы на экранах телевизоров, но делают невозможной их запись – блокируется работа схемы АРУ видеомагнитофона. Таким образом, хотя исходная картинка остается “идеальной”, запись на VHS ленту видеомагнитофона идет с помехами, так что последующее воспроизведение полученной копии теряет смысл. Конструктивное отличие DVD-R дисков (DVD-Recordable – однократно записываемый) от фабрично тиражируемых DVD-ROM заключается в наличии специального пигментного слоя между прозрачной подложкой и отражающей поверхностью. Дырки в таком слое не штампуются, а выжигаются лазерным лучом повышенной мощности. В отличие от однократно записываемого формата DVD-R диски типа RW допускают до 1000 перезаписей. Процесс перезаписи основан на свойстве изменения фазового состояния специального органического красителя, используемого в RW дисках в качестве физического носителя информации. Более подробно, при точечном нагреве лучом лазера (на 650 нм) до определенной температуры краситель переходит из кристаллического состояния (“светлое”, высокоотражающее) в аморфное (“темное”, неотражающее) и наоборот. В Таблице 7.5 приведены характеристики DVD-ROM, DVDR и DVDRW. Следует отметить, что наиболее распространенной системой защитного кодирования является CSS, для расшифровки которой необходимо ключевое число, записанное в особой зоне DVD-диска. У DVD-R(G) эта зона оказывается недоступной для записи, так что перенос ключа при копировании оказывается физически невозможен. Диски DVD-R(A) не обладают такой защитой, но очень дороги. 89
Т а б л и ц а 7.5 Характеристики DVD DVD-ROM Однослойный
DVD-R
DVD-RW
ДвухAuthoring слойный
DVD+RW
General
4.7
8.54
4.7 (3.95)
4.7
4.7
4.7
Длина волны
650 нм
650 нм
635 нм
650 нм
650 нм
650 нм
Отражающая способность
45-85%
18-30%
45-85%
18-30%
18-30%
Глубина модуляции
>0.6
>0.6
>0.6
>0.6
>0.6
Ширина дорожки
0.74 мкм
0.74 мкм
0.74 мкм
0.74 мкм
0.74 мкм
Минимальная длина пита
0.4 мкм
0.44 мкм
0.4 мкм (0.44 мкм)
0.4 мкм
0.4 мкм
Емкость, ГБ
В DVD+RW используется иной органический краситель, чем у DVDRW и для изменения фазового состояния требуется более высокая температура, но коэффициент отражения красителя в кристаллическом состоянии выше, чем у DVD-RW [8]. Между тем эта технология не может рассматриваться как носитель профессионального качества, поскольку ее пропускная способность равна 10 Мбит/с. Однако вскоре ожидается появление новой версии этого формата DVD PRO, в котором этот параметр будет составлять значения от 25 до 50 Мбит/с, что обеспечит конкуренцию ленточным цифровым форматам DVC PRO 25, DVC PRO 50 и Betacam SX.
90
ЗАКЛЮЧЕНИЕ В настоящее время самыми распространенными в России на профессиональных телестудиях являются аналоговые форматы Betacam SP и SVHS. Однако в последнее время все шире на телестудиях страны внедряют цифровые форматы, как правило, DVCAM и DVC PRO (Орловская, Ростовская, Тульская, Тверская области) [Журнал "625 – 2002. – №/1-4], так как видеомагнитофоны этих форматов позволяют читать и записывать видеокассеты форматов Betacam SP и S-VHS. Для получения очень высокого качества некоторые отечественные телестудии используют формат Digital S (D9) [Журнал "625". – 2002. – №1.]. Для кинематографии мировые киностудии широко используют цифровой формат DVCAM [Журнал "Broadcasting". – 2001. – №3. – С.11]. Также в мире в эксплуатации находится более 16000 студийных магнитофонов и видеокамер с цифровой системой видеозаписи Digital S (D9): FOX (США), BBC (Великобритания), RTL (Германия), RAI (Италия) [Журнал "Kameramann". – 2001. – №4], киностудия им. Горького (Россия), "Маски-шоу" (Россия – Украина), "Узбекфильм" (Казахстан) и мн. др. [Журнал "625". – 2001. – №7, – С.71]. В Европе и в США идет тенденция к применению формата MPEG IMX (D10), разработанного фирмой SONY [Журнал "625". – 2001. – №4]. Цифровой формат DVD рекомендовано применять для создания архивов [5].
91
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Михайловский Ю. Цифровые форматы видеозаписи // 625. - 1999.- №7. 2. Справочник по технике магнитной записи / В.И. Антонов, В.П. Веклич, Л.П. Водяницкий и др.: Под ред. О.В. Порицкого, Е.Н. Травникова.- Киев: Технiка, 1981.- 319с. 3. Справочная книга радиолюбителя-конструктора: В 2-х кн. Кн.1 А.А.Бокуняев, Н.М. Борисов, Е.Б. Гумеля и др.; Под ред. Н.И. Чистякова. - 2-е изд., испр. - М.: Радио и связь, 1993. - 336с. 4. Ершов К.Г. Видеооборудование. Справ. Пособие / К.Г.Ершов, С.Б.Дементьев. - СПб.: Лениздат, 1993. - 271с. 5. Манипуляции с видеоизображениями (практикум для менеджеров)// Broadcasting. - 2001. - №4. - с.38-45. 6. Гласман К.Ф. MPEG - это просто! // 625. - 2000. - №3. 7. MPEG2 и нелинейный видеомонтаж - просто о сложном // Цифровое видео. - 2000. - №1. 8. DVD-Video: принципы и ограничения // Цифровое видео. - 2001. - №4. 9. Гласман К.Ф. Цифровая магнитная видеозапись. Формат D-1 // 625.1998. - №№4-5. 10. Шкритек П. Справочное руководство по звуковой схемотехнике: Пер. с нем. - М.: Мир, 1991. - 446с. 11. Гласман К.Ф. Цифровая видеотехника: кодирование, обнаруживающее, исправляющее ошибки // 625. - 1997. - №8. 12. Гласман К.Ф. Цифровая магнитная видеозапись: форматы цифровой композитной видеозаписи D-2 и D-3 // 625. - 1998. - №7. 13. Гласман К.Ф. Цифровая магнитная видеозапись: форматы Ampex D-5, Panasonic D-5, Sony Digital Betacam // 625. - 1999.- №2. 14. Гласман К.Ф. Видеокомпрессия // 625. - 1999. - №2. 15. Гласман К.Ф. Цифровая магнитная видеозапись: формат Digital S // 625. - 1999. - №3. 16. Хлеборобов В.А. Особенности стандарта видеозаписи SMPTE 365M (D10) // Техника кино и телевидения. - 2002. - №3. 17. Гласман К.Ф. Цифровая магнитная видеозапись: формат Sony BETACAM SX // 625. - 2000. - №4. 18. Television Broadcast.- 2000, volume 23, issue 1. - №1. - p.14. 19. Кисилев В. 1394о по версии IEEE. Подробное описание нового стандарта IEEE 1394 // Мир ПК. - 2000. - №11. - с.10-17. 20. Гласман К.Ф. Цифровая магнитная видеозапись: формат DV // 625. 2002. - №3. 21. Гласман К.Ф. Цифровая магнитная видеозапись: формат DV // 625. 2002. - №4. 92
22. Хлеборобов В.А. Анализ форматов DVCAM и DVCPRO // Техника кино и телевидения. - 1999. - №8. 23. Ringrose F. Europeans reject HDTV // TVB Europe. - 1999. - №4. 24. Хлеборобов В.А. Особенности стандарта цифровой видеозаписи SMPTE 365 (D10) //Техника кино и телевидения. - 2002. - №3. 25. Афанасьев А.П. Бытовые видеомагнитофоны./ А.П.Афанасьев, В.П.Самохин.- М.: Радио и связь, 1989. - 160с. 26. Зубарев Ю.Б. Передача изображений: Учебник для вузов / Ю.Б.Зубарев, Г.Л. Глоризов.- 2-е изд., перераб. и доп. - М.: Радио и связь, 1989. - 336с. 27. Колесниченко О.В. Бытовые видеомагнитофоны формата VHS. Ч.1./ О.В.Колесниченко, И.В.Шишигин. - СПб., 1994. - 145с. 28. Седов С.А. Индивидуальные видеосредства: Справ. Пособие. - Киев: Наук. Думка, 1990. - 752 с. 29. Самойлов В.Ф. Основы цветного телевидения / В.Ф. Самойлов, Б.П.Хромой. - М.: Радио и связь, 1982. - 160 с.- (Массовая радиобиблиотека, Вып.1047). 30. Петров В.П. Видеотехника. Ремонт и регулировка: Учебник для нач. проф. образования/ В.П. Петров. – М.: Образовательно-Издательский центр "Аадемия", 2002.- 152с. 31. Котов Е.П. Носители магнитной записи: Справочник / Е.П.Котов, М.И.Руденко. - М: Радио и связь, 1990. - 384с. 32. Методические указания к выполнению лабораторных работ по курсам: "Бытовая аппаратура записи-воспроизведения", "Видеотехника" для студентов очной и заочной форм обучения направления 5525 "Радиотехника" специальностей 200700 "РТ",230200 "Сервис БРА", 201400 "Аудивизуальная техника". Часть 1 / Сост.Медведев В.В., доц., к.т.н., Кокарев И.В., ст.пр. - Шахты: ДГАС, 1997. – 23с. 33. Колесниченко О.В. Обслуживание и ремонт зарубежных бытовых видеомагнитофонов: Справочное пособие / О.В.Колесниченко, И.В.Шишигин. - СПб.: Лань, 1995. – 272с. 34. Бродский М.А. Аудио - и видеомагнитофоны: Справ.пособие / М.А.Бродский. - Минск: Вышэш.шк., 1995. - 476с. 35. Современная видеозапись: Пер. с венгер. / З.Вайда; Под. ред. Л.С.Виленчика. - М.: Связь, 1987. – 172с. 36. Гончаров А.В. Канал изображения видеомагнитофона / А.В.Гончаров, М.И.Харитонов. - 2-е изд.перераб.и доп. - М.: Радио и связь, 1987. 264с. 37. Альбом схем стационарных телевизоров и кассетных видеомагнитофонов. - 1994. - 405с. 38. Бытовые видеомагнитофоны "Электроника ВМ-12" и их ремонт / В.К.Зольников, В.Г.Калинин, О.Н.Мануковский, Г.А.Горина. - Воронеж: Линктрейд, 1993. - 177с. 93
39. Ронэн Д.Т. Ремонт видеомагнитофонов: Практическое пособие / Д.Т.Ронэн; Пер.с англ. Д.Я.Мовшович. - Ростов н/Д: Феникс, 1997. 640с. 40. Пескин А.Е. Зарубежные видеомагнитофоны и видеоплейеры: Устройство, регулировка, ремонт / А.Е. Пескин, А.А.Коннов. - М.: Солон, 1998. - 208с. 41. Хофф Ф. Устройство аудио- и видеоаппаратуры: Пер. с англ. Т.1 / Ф.Хофф. - М.: ДМК, 2001. - 288 с. 42. Афанасьев А.П. Бытовые видеомагнитофоны / А.П. Афанасьев, В.П.Самохин. - М: Радио и связь, 1989. - 160с. Основная литература: [36], [42], [27], [30], [32].
94
Пособие обсуждено и рекомендовано к внутривузовскому изданию на заседании кафедры РЭС, протокол № 1 от 02.09.02. Согласовано на заседании НМСС, протокол № 1 от 06.09.02.
Ответственный за выпуск Н.В.Ковбасюк Редактор В.В.Крайнова Технический редактор Т.В.Кватер Компьютерная обработка и верстка Е.Н.Черненко
ИД № 06457 от 19.12.01 г. Подписано в печать 17.01.03. Печать оперативная. Усл. п.л. 5,5. Уч.-изд. л. 4,4. Тираж 118 экз. Заказ №315. ПЛД № 65-175. Издательство ЮРГУЭС. Типография Издательства ЮРГУЭС. 346500, г. Шахты, Ростовская обл., ул. Шевченко, 147. 95