利用真正视频调制解调器方案实现非压缩 HDTV 无线连接
2010-12-20 11:54:30
来源:《半导体器件应用》2008年10月刊
点击:1015
1 前言
从传统到高清内容的转换,催生了用户对高质量的数字视频互联的需求,比如像高清电视和高清投影仪这类的高清显示与其他产生高清节目源的消费电子设备之间的互联,这些源设备包括 HD-DVD,蓝光,HD 机顶盒,游戏机等。对于有线连接,最近几年出现了用于高清和消费电子的 HDMI 数字接口,该接口可以传输非压缩的高清音视频,速率超过了 1080p 所需要的 3Gbps。其结果,HDMI 已经几乎成为无处不在的音视频标准。问题是,无线连接能够提供类似的解决方案吗?
通过 Wi-Fi 和其他无线标准的成功可以发现用户喜欢无线技术。为了实现壁挂式平板电视的平滑设计,消费者希望能够摆脱讨厌的连线,而是使用灵活的,容易安装和使用方便的无线连接。但是,已有的甚至是新兴的无线标准,例如 802.11 和 UWB,都无法提供高质量视频连接所需的如此高的速率。为了能够与 HDMI 相匹敌,还需要考虑其他一些问题。
无线高质量视频发送是一个棘手的问题。一方面是高视频速率需要足够的带宽和 SNR(信噪比),即具备足够能力的通信信道。另一方面,却是无线信道不稳定和不可预测。其特性改变很快,起因是衰落和对 SNR 的干扰,通信容量变化很大。在数据发送的过程中,这些问题还可以通过采用缓冲器和重发来弥补。但对于视频(或音频)连接来说这是不可能的,因为在整个发送过程中必须是实时的且没有延迟,还必须维持高保真。
本文将阐述用于无线视频传送的一种新颖的视频调制解调器方案,该方案建立在联合信源信道编码(JSCC)的信息论原理之上。该方案克服了用于视频分发的无线信道方面的各种挑战。该方案用在 Amimon 公司的 WHDI 方案中,实现了非常健壮的无压缩无线 A/V 连接。WHDI 方案利用 5GHz 频段上的一个多输入多输出(MIMO)20MHz/40MHz 带宽的信道,这里,MIMO 提供一个超宽带宽和分集。该视频调制解调器 JSCC 方案可以被用到其他频段上,相对于传统的无线数据调制解调方案,健壮性得到 10 倍的改善,从而可以实现很高速率的无压缩视频的无线分发。
如何将一个信息从源端发送到目的地呢?特别地,要考虑到一个 HDTV 音/视频码流的发送是在有噪的、衰落的无线信道上进行的。从信息论的观点出发,一个通信信道有一定的容量,表示为 C,它指定了信道上能够可靠传送信息的最大速率(每秒比特)。至今,一个好的表达方式是一个简单公式,即香农定理,该公式表示了有加性白高斯噪声(AWGN)的信道的容量如下:
C = W log (1+SNR) b/s (1)
式中,W 为信道带宽(Hz),对数的底为 2,SNR 是信噪比。
一个信息论量纲 R(D),为信息源的速率失真函数,定义了在规定的失真度 D 的条件下,重现信源所需的最小比特率。通常利用源和重现之间的均方误差来度量 D,用作与源动态范围的比较。这个被称作为峰值信噪比的测量就是视频的 8 比特表征,即:
PSNR = 10 log10 (255)2/D dB (2)
视频源的 R(D) 不易确定,因为它取决于视频质量和像素与帧之间的相关,对于低 D(高 PSNR),可以假定高质量的视频样本是独立的。在该工作点上,要求每比特采样数减小一倍(或者 PSNR 改善 6dB)。由于 720p 的视频每秒的像素为 55.3M,或者说每秒的采样数为 55.3x3=166M。1080i 的像素数为 62.2M,或者说采样数为 186.6M。而对于 1080p,其像素数为 124.4M,而采样数为 373.2M。换句话说,对于高质量的视频,在高 PSNR 区域,要使视频质量改善 6dB,对于上述三种模式,分别需要 166,186.6 和 373.2Mbps 的采样数。
当在信息通道上利用任何通信方案来传输信源时,著名的香农“源信道编码理论”给出了可获得的最佳性能(最小失真),为:
R(D) = C (3)
即引起源失真的 D 不会优于 R-1(C)。
由于信道容量取决于信道的信噪比(CSNR),为了评估信道性能,需要绘制 PSNR 与信道容量或 CSNR 的关系。香农定理从直觉上是容易理解的。C 度量信道上可以可靠传输的最大比特率,而 R(D) 则是在达到失真 D 的条件下重现信息源所需的最小比特率。进一步,香农定理提出一个实现最佳性能的方案:即首先将信源压缩的 R(b/s),造成信源的失真为 D,然后(假定 R 小于信道容量 C)将这些比特的信息在信道上无错误地发送。这是最常见的方案。虽然该方案能够实现(理论上的)最佳性能,但由于过于复杂且延迟较大,实际上却无法实现,具体原因将在下面讨论。
一个替代方案是联合信道编码,其中信源编码和信道编码不相互分离。该方案导致了“视频调制解调器”架构。如下面所述,该方案比较适合无线信道的多变和不可预测的特性,通过一个健壮的,具有成本效益并自适应信道容量变化的解决方案,可以实现(逼近)最佳性能。
2 Amimon JSCC 方案评估
在讨论视频调制解调器之前,先利用上述的理论来检查 JSCC 方案的可行性。在 JSCC 方案中,信道容量确实大于信源码率失真函数并具有所期望的低失真吗?容量究竟如何?
JSCC 方案采用一个工作在 5GHz 频段上的无线 MIMO 通道,发射天线为 4 根,带宽为 20-40MHz。当信道矩阵为 H(接收机已知)且具有高斯噪声时,无线 MIMO 信道容量为:
C = log2 det(I+ρHHH) b/s/Hz (4)
式中,ρ 是每根发射天线的 CSNR,H 是信道矩阵,而上标 H 代表复共轭。如果接收天线数量 nR 大于或等于发射天线的数量 nT,则信道矩阵不是唯一的,信道容量公式近似为:
C ≈ nT log2 (1+ρ(H)) b/s/Hz (5)
式中,ρ(H)是一个有效平均 CSNR,与依赖于特定的衰落信道矩阵 H 的发射天线有关。很明显,该容量不是常数,而是一个取决于变化的有效 CSNR 的随机量。对于 nT=4 和 20MHz 的带宽,信道容量可以从 800Mbps(30dB CSNR)变化到大约 500Mbps(18dB CSNR),甚至可以下降到 250Mbps(大约 10dB 的 CSNR)。
现在考虑信源。如上所述,评估 HDTV 速率失真是困难的,因为视频是许多不同图像的合成,其中有些图像需要很低的速率(例如同一颜色的图像),而另一些则需要很高的速率。诚然,正如上述的一个事实是 8 比特 HDTV 样本可以无损压缩2倍,可以假定对于8比特失真的等级,HD(1080i 或 720p)速率失真低于 700Mbps 左右。如果允许更高的失真,则更低的速率即足以重现信源。在下列有关压缩算法性能的报告中,HDTV 信源要求大约 100-200Mbps 来重现信源,而 PSNR 低于 40dB。注意对于 1080p 信源的速率失真值的评估值是 1080i 信源评估值的两倍。
综上所述,对于 720p/1080i,Amimon 所用的 20MHz 信道具有 250-800Mbps 的容量,该容量高于视频质量为 40dB PSNR 时 HDTV 速率失真所对应的容量。然而,它强调了逼近香农限制的重要性并采用最佳性能。JSCC 方案可以动态实现,而在上述的分离方案中,要使信源质量(PSNR)改善 6dB,就需要每秒数百兆的比特率来进行可靠传输。
3 分离式解决方案
信源编码和信道编码的分离是传统视频通信系统的主要原理。用于无线视频分发的这类系统设计方案如图 1 所示。
信源-信道分离使得系统设计允许信源和信道编码器的优化独立,通过提供一个通用的数字接口实现互操作性。那么利用这样的传统模组方案究竟有什么错?
当分离原理用于无线视频传输时,几个问题就显现出来了。首先,分离原理假定了信道容量已知。这在无线通信中是绝无的情况,实际情况是信道在不断变化,容量事先完全无知。于是,香农定理的最优性不再成立,分离导致了性能损失。其次,图 1 中以分离为基础的系统缺乏健壮性。信源代码(压缩)是敏感的,要求其输出受到一个强壮的、具有保证性能(保证 BER 非常低)的信道代码的保护。最后,如图 1 所示的方案非常复杂,并且延迟很大。总而言之,建立在分离原理上的实际系统的工作性能距离可能的最佳性能相去甚远。
4 联合信源-信道编码方案
为了克服这些问题,采用了联合信源信道编码。图 2 给出了该系统设计方案。其中,JSCC 由以下三个部分组成:
(1) 根据视频分量的重要性来优化视频。具体为:
① 像素的最高位(MSB)要远比最低位(LSB)重要;
② 低空间频率要比高频更重要;
③ 亮度分量要比色度分量更重要。
(2) 不同等的错误保护(UEP)——对重要分量的最高位比特的编码保护等级要高于不重要分量的最低位的编码保护。
(3) 结合调制和 UEP,产生信道信号空间的合适星座图。例如,
① 重要分量用粗星座,而不重要分量用细星座;
② 将噪声较大的频段分给不重要的分量。
该方法将视频像素转换成正交频分调制符号(OFDM),几个图像行的延迟非常小。图 3 为联合信源-信道编码的方框图。
5 JSCC方案的优点
相对于传统的解决方案,联合信源-信道编码具有几个显著的优点。首先,因为视频分量和他们的比特表征的重要性不均等,JSCC 采用不均等的错误保护等级(UEP),而在传统方案中对所有位的保护是均等的。于是,在传统的方案中,重要分量的最高位受不到足够的保护,而对于最低位的保护却显得过度(因而浪费了信道资源)。图 4 描述了这种情况。
JSCC 方案较好地利用了可用信道容量,即便是容量在变化。传统系统应该工作在低于最坏情况下信道容量的速率上,否则视频通信将不可靠。通过将不好的信道容量分配给不敏感的信息,JSCC 总是将容量利用到极致。应该指出的是,某些传统系统可以在容量突然下降的地方做“短期平均”,但这需要很大的缓冲器,从而导致过高的复杂度和较大的延迟。其他传统的系统通过采用反馈来适应变化的信道特性。进一步,由于无线信道变化很快,等到发射机得到这些反馈信息时,信道又已经变化了。图 5 中描述了信道利用的情况比较。
相对于传统系统,JSCC 的主要优点体现在它对不断变化着的信道容量和信道的信噪比的适应能力上。传统系统中有一个门限效应-它必须保证最小的 DNR,否则整个通信将失败。为了降低门限,传统系统中降低了码率,例如通过深度压缩的方式,但这样做会降低质量。任何情况下,传统系统中有一个“质量天花板”,在这里图像质量无法改善,即便是信道变好,其质量也无法优于与最坏设计情况相对应的预定质量。Amimon 的 JSCC 方案没有这样的 SNR 门限,故在信道条件改善时图像质量将得到改善。图 6 中描述了在变化的信道条件下传统方案和 JSCC 方案的视频质量比较。
Smimon 的视频调制解调器的 CSNR 通常位于 20-30dB 之间,允许 PSNR 超过完美重构 45dB。即便是有偶然的下降,PSNR 仍保持良好,而在传统方案中将完全崩溃了。
6 健壮性和复杂度
对于无线视频连接解决方案来说,健壮性是一个极其重要的指标。根据上述分析,对于无线信道不断变化的特性来说,JSCC 的健壮性比传统的解决方案要好得多。图 7(a) 显示的是在给定情况下信道支持大于 B 的比特率时的概率。为了确保系统的正常工作,传统解决方案必须工作在可获得的比特率达到 99.99..% 这一点上(否则将会不断地重传)。从图中可以发现,该速率可能低于平均速率的 5 倍,而比最大容量高 10 倍,见图 7(b)。即便是在这个工作点上,信道仍然还有不能支持所要求的比特率的概率(0.01%)。所以说基于分离解决方案的传统系统将会崩溃,从而导致大量的错误,特别是当为了满足工作点上可用的传输速率,数据不得不预先压缩的时候。另一方面,JSCC 方案允许利用瞬时容量,故可以享用高得多的容量,这等效于可以获得较好的视频质量(如图 7c 所示),况且还无需担心信道容量和可用的比特率低于某个特定值时的概率。
从传统到高清内容的转换,催生了用户对高质量的数字视频互联的需求,比如像高清电视和高清投影仪这类的高清显示与其他产生高清节目源的消费电子设备之间的互联,这些源设备包括 HD-DVD,蓝光,HD 机顶盒,游戏机等。对于有线连接,最近几年出现了用于高清和消费电子的 HDMI 数字接口,该接口可以传输非压缩的高清音视频,速率超过了 1080p 所需要的 3Gbps。其结果,HDMI 已经几乎成为无处不在的音视频标准。问题是,无线连接能够提供类似的解决方案吗?
通过 Wi-Fi 和其他无线标准的成功可以发现用户喜欢无线技术。为了实现壁挂式平板电视的平滑设计,消费者希望能够摆脱讨厌的连线,而是使用灵活的,容易安装和使用方便的无线连接。但是,已有的甚至是新兴的无线标准,例如 802.11 和 UWB,都无法提供高质量视频连接所需的如此高的速率。为了能够与 HDMI 相匹敌,还需要考虑其他一些问题。
无线高质量视频发送是一个棘手的问题。一方面是高视频速率需要足够的带宽和 SNR(信噪比),即具备足够能力的通信信道。另一方面,却是无线信道不稳定和不可预测。其特性改变很快,起因是衰落和对 SNR 的干扰,通信容量变化很大。在数据发送的过程中,这些问题还可以通过采用缓冲器和重发来弥补。但对于视频(或音频)连接来说这是不可能的,因为在整个发送过程中必须是实时的且没有延迟,还必须维持高保真。
本文将阐述用于无线视频传送的一种新颖的视频调制解调器方案,该方案建立在联合信源信道编码(JSCC)的信息论原理之上。该方案克服了用于视频分发的无线信道方面的各种挑战。该方案用在 Amimon 公司的 WHDI 方案中,实现了非常健壮的无压缩无线 A/V 连接。WHDI 方案利用 5GHz 频段上的一个多输入多输出(MIMO)20MHz/40MHz 带宽的信道,这里,MIMO 提供一个超宽带宽和分集。该视频调制解调器 JSCC 方案可以被用到其他频段上,相对于传统的无线数据调制解调方案,健壮性得到 10 倍的改善,从而可以实现很高速率的无压缩视频的无线分发。
如何将一个信息从源端发送到目的地呢?特别地,要考虑到一个 HDTV 音/视频码流的发送是在有噪的、衰落的无线信道上进行的。从信息论的观点出发,一个通信信道有一定的容量,表示为 C,它指定了信道上能够可靠传送信息的最大速率(每秒比特)。至今,一个好的表达方式是一个简单公式,即香农定理,该公式表示了有加性白高斯噪声(AWGN)的信道的容量如下:
C = W log (1+SNR) b/s (1)
式中,W 为信道带宽(Hz),对数的底为 2,SNR 是信噪比。
一个信息论量纲 R(D),为信息源的速率失真函数,定义了在规定的失真度 D 的条件下,重现信源所需的最小比特率。通常利用源和重现之间的均方误差来度量 D,用作与源动态范围的比较。这个被称作为峰值信噪比的测量就是视频的 8 比特表征,即:
PSNR = 10 log10 (255)2/D dB (2)
视频源的 R(D) 不易确定,因为它取决于视频质量和像素与帧之间的相关,对于低 D(高 PSNR),可以假定高质量的视频样本是独立的。在该工作点上,要求每比特采样数减小一倍(或者 PSNR 改善 6dB)。由于 720p 的视频每秒的像素为 55.3M,或者说每秒的采样数为 55.3x3=166M。1080i 的像素数为 62.2M,或者说采样数为 186.6M。而对于 1080p,其像素数为 124.4M,而采样数为 373.2M。换句话说,对于高质量的视频,在高 PSNR 区域,要使视频质量改善 6dB,对于上述三种模式,分别需要 166,186.6 和 373.2Mbps 的采样数。
当在信息通道上利用任何通信方案来传输信源时,著名的香农“源信道编码理论”给出了可获得的最佳性能(最小失真),为:
R(D) = C (3)
即引起源失真的 D 不会优于 R-1(C)。
由于信道容量取决于信道的信噪比(CSNR),为了评估信道性能,需要绘制 PSNR 与信道容量或 CSNR 的关系。香农定理从直觉上是容易理解的。C 度量信道上可以可靠传输的最大比特率,而 R(D) 则是在达到失真 D 的条件下重现信息源所需的最小比特率。进一步,香农定理提出一个实现最佳性能的方案:即首先将信源压缩的 R(b/s),造成信源的失真为 D,然后(假定 R 小于信道容量 C)将这些比特的信息在信道上无错误地发送。这是最常见的方案。虽然该方案能够实现(理论上的)最佳性能,但由于过于复杂且延迟较大,实际上却无法实现,具体原因将在下面讨论。
一个替代方案是联合信道编码,其中信源编码和信道编码不相互分离。该方案导致了“视频调制解调器”架构。如下面所述,该方案比较适合无线信道的多变和不可预测的特性,通过一个健壮的,具有成本效益并自适应信道容量变化的解决方案,可以实现(逼近)最佳性能。
2 Amimon JSCC 方案评估
在讨论视频调制解调器之前,先利用上述的理论来检查 JSCC 方案的可行性。在 JSCC 方案中,信道容量确实大于信源码率失真函数并具有所期望的低失真吗?容量究竟如何?
JSCC 方案采用一个工作在 5GHz 频段上的无线 MIMO 通道,发射天线为 4 根,带宽为 20-40MHz。当信道矩阵为 H(接收机已知)且具有高斯噪声时,无线 MIMO 信道容量为:
C = log2 det(I+ρHHH) b/s/Hz (4)
式中,ρ 是每根发射天线的 CSNR,H 是信道矩阵,而上标 H 代表复共轭。如果接收天线数量 nR 大于或等于发射天线的数量 nT,则信道矩阵不是唯一的,信道容量公式近似为:
C ≈ nT log2 (1+ρ(H)) b/s/Hz (5)
式中,ρ(H)是一个有效平均 CSNR,与依赖于特定的衰落信道矩阵 H 的发射天线有关。很明显,该容量不是常数,而是一个取决于变化的有效 CSNR 的随机量。对于 nT=4 和 20MHz 的带宽,信道容量可以从 800Mbps(30dB CSNR)变化到大约 500Mbps(18dB CSNR),甚至可以下降到 250Mbps(大约 10dB 的 CSNR)。
现在考虑信源。如上所述,评估 HDTV 速率失真是困难的,因为视频是许多不同图像的合成,其中有些图像需要很低的速率(例如同一颜色的图像),而另一些则需要很高的速率。诚然,正如上述的一个事实是 8 比特 HDTV 样本可以无损压缩2倍,可以假定对于8比特失真的等级,HD(1080i 或 720p)速率失真低于 700Mbps 左右。如果允许更高的失真,则更低的速率即足以重现信源。在下列有关压缩算法性能的报告中,HDTV 信源要求大约 100-200Mbps 来重现信源,而 PSNR 低于 40dB。注意对于 1080p 信源的速率失真值的评估值是 1080i 信源评估值的两倍。
综上所述,对于 720p/1080i,Amimon 所用的 20MHz 信道具有 250-800Mbps 的容量,该容量高于视频质量为 40dB PSNR 时 HDTV 速率失真所对应的容量。然而,它强调了逼近香农限制的重要性并采用最佳性能。JSCC 方案可以动态实现,而在上述的分离方案中,要使信源质量(PSNR)改善 6dB,就需要每秒数百兆的比特率来进行可靠传输。
3 分离式解决方案
信源编码和信道编码的分离是传统视频通信系统的主要原理。用于无线视频分发的这类系统设计方案如图 1 所示。
信源-信道分离使得系统设计允许信源和信道编码器的优化独立,通过提供一个通用的数字接口实现互操作性。那么利用这样的传统模组方案究竟有什么错?
当分离原理用于无线视频传输时,几个问题就显现出来了。首先,分离原理假定了信道容量已知。这在无线通信中是绝无的情况,实际情况是信道在不断变化,容量事先完全无知。于是,香农定理的最优性不再成立,分离导致了性能损失。其次,图 1 中以分离为基础的系统缺乏健壮性。信源代码(压缩)是敏感的,要求其输出受到一个强壮的、具有保证性能(保证 BER 非常低)的信道代码的保护。最后,如图 1 所示的方案非常复杂,并且延迟很大。总而言之,建立在分离原理上的实际系统的工作性能距离可能的最佳性能相去甚远。
4 联合信源-信道编码方案
为了克服这些问题,采用了联合信源信道编码。图 2 给出了该系统设计方案。其中,JSCC 由以下三个部分组成:
(1) 根据视频分量的重要性来优化视频。具体为:
① 像素的最高位(MSB)要远比最低位(LSB)重要;
② 低空间频率要比高频更重要;
③ 亮度分量要比色度分量更重要。
(2) 不同等的错误保护(UEP)——对重要分量的最高位比特的编码保护等级要高于不重要分量的最低位的编码保护。
(3) 结合调制和 UEP,产生信道信号空间的合适星座图。例如,
① 重要分量用粗星座,而不重要分量用细星座;
② 将噪声较大的频段分给不重要的分量。
该方法将视频像素转换成正交频分调制符号(OFDM),几个图像行的延迟非常小。图 3 为联合信源-信道编码的方框图。
5 JSCC方案的优点
相对于传统的解决方案,联合信源-信道编码具有几个显著的优点。首先,因为视频分量和他们的比特表征的重要性不均等,JSCC 采用不均等的错误保护等级(UEP),而在传统方案中对所有位的保护是均等的。于是,在传统的方案中,重要分量的最高位受不到足够的保护,而对于最低位的保护却显得过度(因而浪费了信道资源)。图 4 描述了这种情况。
JSCC 方案较好地利用了可用信道容量,即便是容量在变化。传统系统应该工作在低于最坏情况下信道容量的速率上,否则视频通信将不可靠。通过将不好的信道容量分配给不敏感的信息,JSCC 总是将容量利用到极致。应该指出的是,某些传统系统可以在容量突然下降的地方做“短期平均”,但这需要很大的缓冲器,从而导致过高的复杂度和较大的延迟。其他传统的系统通过采用反馈来适应变化的信道特性。进一步,由于无线信道变化很快,等到发射机得到这些反馈信息时,信道又已经变化了。图 5 中描述了信道利用的情况比较。
相对于传统系统,JSCC 的主要优点体现在它对不断变化着的信道容量和信道的信噪比的适应能力上。传统系统中有一个门限效应-它必须保证最小的 DNR,否则整个通信将失败。为了降低门限,传统系统中降低了码率,例如通过深度压缩的方式,但这样做会降低质量。任何情况下,传统系统中有一个“质量天花板”,在这里图像质量无法改善,即便是信道变好,其质量也无法优于与最坏设计情况相对应的预定质量。Amimon 的 JSCC 方案没有这样的 SNR 门限,故在信道条件改善时图像质量将得到改善。图 6 中描述了在变化的信道条件下传统方案和 JSCC 方案的视频质量比较。
Smimon 的视频调制解调器的 CSNR 通常位于 20-30dB 之间,允许 PSNR 超过完美重构 45dB。即便是有偶然的下降,PSNR 仍保持良好,而在传统方案中将完全崩溃了。
6 健壮性和复杂度
对于无线视频连接解决方案来说,健壮性是一个极其重要的指标。根据上述分析,对于无线信道不断变化的特性来说,JSCC 的健壮性比传统的解决方案要好得多。图 7(a) 显示的是在给定情况下信道支持大于 B 的比特率时的概率。为了确保系统的正常工作,传统解决方案必须工作在可获得的比特率达到 99.99..% 这一点上(否则将会不断地重传)。从图中可以发现,该速率可能低于平均速率的 5 倍,而比最大容量高 10 倍,见图 7(b)。即便是在这个工作点上,信道仍然还有不能支持所要求的比特率的概率(0.01%)。所以说基于分离解决方案的传统系统将会崩溃,从而导致大量的错误,特别是当为了满足工作点上可用的传输速率,数据不得不预先压缩的时候。另一方面,JSCC 方案允许利用瞬时容量,故可以享用高得多的容量,这等效于可以获得较好的视频质量(如图 7c 所示),况且还无需担心信道容量和可用的比特率低于某个特定值时的概率。
本文为哔哥哔特资讯原创文章,未经允许和授权,不得转载,否则将严格追究法律责任;
暂无评论