|
利用图像的可预测性,可以大大的提高“图形库”的利用律,即很多幅图像都可以公用一个“图形库”。MPEG在传送图像时就是这样,对于高速变化的图像,如果时间来得及(即码率不是很高时),就传送新的内容来显示,如果来不及(即码率很高时)就用“图形库”中的内容来顶替(即预测),反正高速运动的图像人们也看不清。例如:MPEG在传送5幅图像时,可能只传其中的3幅(时间来得及时),也可能只传两幅(时间来不及时),具体过程是,先传第1和第5幅,然后时间来得及就传第3幅,时间来不及就插第3幅(根据1和5预测3),最后再插第2幅(根据1和3预测2),和第4幅(根据3和5预测4)。
上面我们只是从感性上和很肤浅的对图像压缩的原理进行了分析,如果我们把上面的分析内容移到数学领域,那么我们将要面对非常多的西格玛“∑”(求和)和矩阵符号。顺便介绍一下,对数字电视图像压缩处理最出名的理论是:DCT(Discrete Cosine Transform)离散余弦变换(付立叶变换),和DPCM差动脉冲编码调制,还有哈夫曼编码(Huffmancoging)。
图像信号的压缩过程也是数字电路(或计算机)对数字信号的处理过程,计算机虽然很聪明,但它只会做加法运算。其它的减法、乘法、除法还有函数运算,计算机都是把它们转换成加法进行运算。付立叶先生60年前可能就预见到了我们要对数字信号进行处理,所以他发明了付立叶变换。其原理是:一个周期函数可以展开成无数个正弦或余弦函数之和,函数的周期越短,其(级数)收敛就越快,周期越长其收敛就越慢。对于上面我们分析的图像信号,全部都可以看成是周期函数信号。相关性很强的图像信号可看成是短周期函数信号,相关性很弱的图像信号可看成是长周期函数信号。因此,经过付立叶变换后的信号,只需对展开成级数的各项系数进行处理和传送。在实际处理过程中,一般只取付立叶级数的前几项,因为大部分能量都是集中在前三项级数之中,信号相关性越强,能量越集中。
DPCM差动脉冲编码调制也有人叫预测编码,它的定义是:在线性预测编码中,首先用过去的若干像素值对当前像素值进行线性预测,然后将其差值进行PCM编码传送,接收端将此差值积分而再生图像;哈夫曼编码也叫可变长编码,它对出现概率大的差值信号编以短码,对概率小的差值信号编以长码,哈夫曼编码可获得最小的平均码长。
在数字电视技术中,除了图像需要压缩以外,声音也要压缩,但声音压缩要比图像压缩简单很多,因为声音的信息量比起图像的信息量来,少得可怜。人的耳朵能听到声音的频率范围是20Hz到20kHz,如果我们把20Hz到20kHz按照一定的频带宽度分成很多个频率通道,用来对声音进行过滤和处理,就能对声音信号进行压缩。这个频率通道就相当于,歌曲中的谐音:多、来、米、发、梭、拉、妻、多(12345671)。
声音压缩的原理也是利用“字库”的概念,在信号的译码端,安装有很多个与信号发送编码端对应的频率发生器(如12345671谐音器)。另外声音还有一个屏蔽效应,就是,人的耳朵对某个频率范围的声音灵敏度特别高(600Hz附近),对一些频率却很低(低频和高频);还有,如果有几种声音同时存在,声音大的内容很容易听到,而声音很小的东西要非常注意才能听到(对数特性)。利用这些特点,在编码的时候就可以分长码和短码来对不同的内容进行编码,对主要声音内容用长码,对次要内容用短码——这叫有所为和有所不为。经过多种方法对声音信号压缩处理后,声音信号传送的码率可变得非常低,即压缩比非常大。
声音信号压缩的原理可以比喻成,某人想听某钢琴家弹钢琴,一种方法是把钢琴家连同钢琴都请到家来;另一种方法是,只请钢琴家而用自己的钢琴进行演奏;再有一种方法是,只需对方把曲谱寄过来,而用自己的钢琴和家人来演奏,显然是最后一种方法最简便。
在全数字信号电视系统中,图像信号和音频号之所以能压缩,并不完全是信源编码端的功劳,接收端译码器的功劳也非常大,没有译码器强大的数据处理功能,图像信号和音频信号的压缩是不可能的。其实从信源端发送给接收端,真正属于图像内容的信息并不多,大部分都是“补丁”(差值),和“指令”(代码),译码器通过对这些数据进行加工,不断地更新自己的“数据库”(图形库),然后重新编码输出,最后进行D/A转换,输出音视频。
目前图像压缩标准有MPEG1、MPEG2、MPEG4、MPEG7,根据用途的不同压缩方法和码率也不一样。MPEG1用于VCD,清晰度很低,但码率也很低;MPEG2用于SDTV或HDTV,清晰度很高,但码率也很高;MPEG4本来准备用于可视电话,它压缩比很高,码率也很低,活动图像质量比MPEG2差,但它可以在电脑上进行标清节目显示,所以有人准备把它进行升级来替代MPEG2(如MPEG4的升级版JVT);MPEG7用于图书馆档案查询,压缩比非常高,码率很低。声音压缩标准现在较常用的有杜比和AC3两种。
我们国家目前也想自己搞一套音视频压缩编码标准AVS(Audio Video coding Standard),AVS1.0的标准准备与新的国际音视频标准JVT(Joint Video Team)兼容,性能与MPEG4的升级版本差不多,这个AVS标准是否成功,取决于国内IC生产厂家愿不愿意跟进,和政府扶植的力度,但愿上帝保佑中国。
2、信道编码
数字信号传输和模拟信号传输是不一样的,模拟信号一般通过高频调制以后就可以通过线路进行传输,接收端对输入信号进行解调后,就可以输出模拟信号;而数字信号传输就不同了,数字信号不但需要调制,调制之前还要进行编码,接收端对输入信号首先进行解调,然后再解码。经过编码的信号一般含有同步头,用户码、数据码、自由码、结束码等,这叫做一帧编码,数字信号就是一帧,一帧地进行传送的,如MPEG数字信号,每帧为188bit。对数字信号解码也必须按顺序,一帧,一帧地进行。
同步头一般人都很容易理解,它表示一帧编码信号的开始;用户码用来表示这帧内容的属性,即这一帧东西是谁的,在数码通信中一般都有多个用户同时在进行通信,编码时就按用户分帧来传输信号,这样对解码比较简单,如果只有一个用户,可以不需要用户码;数据码是需要传输的最主要内容,在属性不容易出错的情况下,它可以有多组数据码,每组分别表示一个信号分量;自由码一般是作为备用的,用来加密或其它用途;结束码表示这一帧内容传输已经结束,告诉译码器做好下一帧信号解码的准备。
模拟信号需要同时传输多路信号时(或多个信号分量),一般是采用正交调制或复合调制,如PAL电视信号:亮度信号,6MHz(标称为6MHz,实际只有4.15MHz),对38MHz载波调幅;两个色差Y-R和Y-B,1.5MHz,对4.43MHz付载波正交调幅;伴音,500KHz,对6.5MHz付载波调频。它占用的频率资源,除了载波频率外还要把频率带宽算上,因为载波是可选择的,所以一般都只说频率带宽,PAL电视信号的带宽为8MHz(6 + 1.5 + 0.5)。PAL电视信号的4个模拟分量在传输时,属于同时传输。
而数字信号需要同时传输多路信号时(或多个信号分量),一般是采用串行编码,即一帧编码中可以有多组数据码(代表多个信号分量),如数据码1代表亮度信号,数据码2表示色差信号Y-R,数据码3表示色差信号Y-B,等等,如一帧容量有限,可以加用户码分帧来传输多个信号分量。数字信号调制要比模拟信号简单很多,一般用QPSK(正交调相)或QAM(正交调相又调幅)调制,也可以用FSK(键控调频)或ASK(键控调幅)调制,很少用AM(调幅)和FM(调频)调制。因为前者调制效率非常高,特别是QAM调制,256QAM调制的频谱利用率是8bit/Hz,还有一种多载波调制COFDM,其频谱利用率更高,可达16bit/Hz。数字信号传输占用的频率资源,除了载波频率带宽以外,还有一个传输码率。例如利用有线电视信号传输网络6MHz带宽可以传输两路标清电视信号,最高码率达36Mbit/S(64QAM)。
数码通信的好处是,可以把多路信号,或多个用户信号同时挤在一条线路上,只要这条线路传输码率足够高。这种情况叫打包,或就信号复用,解码时,则需要先拆包(也叫解复用)后才能解码。打包的原理就是上面的帧编码原理,不同传输系统,帧编码的长度是不一样的,因此在进行多种信号传输过程中,经常要拆包和重新打包。
数字彩色信号在传输过程中,一般都不是按电视机的扫描顺序来传送信号的,这是因为信号在传输过程中可能会出错。当信号在传输过程中出错时,如果信号按顺序传送,则电视画面上会集中在某个地方出现一大片马赛克,使人看起来非常不爽;如果信号不是按顺序传送,而是按某种分布规律来传送,同样出错时,马赛克会被均匀地散布在整个画面上,使人看起来感到还可以接受。这种错位传输信号的方法称为RS编码或卷积,这也是数字电视信道编码中的一项重要技术。 本新闻共 6页,当前在第 4页 1 2 3 4 5 6 |