基于MPEG-4关键技术的视频医疗系统
摘要: MPEG-4图像压缩技术针对一定比特率下的视频、音频编码,强调了基于内容的交互性。因此,利用MPEG-4编码解码技术来实现视频数据压缩也就成为多媒体系统开发中进行无线视频传输的关键技术。多媒体视频会议系统是计算机技术与通信技术相结合的产物,它通过多媒体技术和通信技术的支持为跨地区的人们提供了一个相互交流、讨论问题和协同工作(CSCW)的环境,并产生“你见即我见”的效果。
多媒体应用的出现和多数据服务的繁殖,无线服务被广泛的应用到各个方面,在多媒体通讯中利用无线网络传输音频和视频信息变得更加重要。这就要求在多媒体信息处理中能够动态地、实时地处理声音、动画以及视频信号,但是计算机难以实时地从存储器中将图像信息处理过程中产生的海量数据传送到中央处理器,因此如果不对视频数据进行压缩处理,要达到实时性的要求几乎是不可能的。这就要求在易产生误码的无线环境中实现安全的低码率编码和传输,MPEG-4技术为此提供了实现的可能。
多媒体视频会议系统将大大提高人们的工作效率,并将改变人们传统的工作和交流模式,具有深远而又深刻的社会意义。视频医疗系统是多媒体视频会议系
统的一个崭新的应用领域。在视频医疗系统中,由JMF (JavaMedia
1 MPEG-4关键技术
MPEG-4采用了基于对象第二代压缩编码技术,并使用AV对象(Audio /VisualObject)进行的可视化编码,同时提供了许多基于内容的交互性视频服务功能,也支持传统的流视频。MPEG-4除了利用第一代视频编码的核心技术(如运动估计与补偿、熵编码)外,还提出了一些新的关键技术:
1) 视频对象分割MPEG-4的基于内容的交互性最主要是通过对视频对象的分割实现的。所谓的视频对象分割,就是将视频、图像分割成不同的对象或是将运动对象从背景中分离出来,进而对不同的对象采用不同的编码方法来实现高效压缩,比如对运动对象采用压缩比较低、损失较小的方法,尽可能保留视频对象的细节和平滑性;对背景对象采用大压缩比的编码策略,以取得压缩效率和解码图像之间的较好的平衡。基本可以分为三步:通过滤波对图像数据进行简化;对视频、图像数据进行特征提取,比如颜色、纹理、运动、语义等特征;最后是相关的后处理操作,以达到去噪和准确提取边界的目的。
由此可见,MPEG-4编码技术要求对图像以及视频作出更多的分析理解,而不同于过去的压缩算法,只是去掉了帧内和帧间的冗余。因此基于对象的编码可以提高数据的压缩比,视频对象的分割(提取)技术也成为MPEG-4视频编码中的关键技术。
2) 视频编码可分级技术视频分级编码技术的目的是解决在不同传输特性的异构网络上进行视频传输的需要。视频编码的可分级性,指的是码率的可调整性。也就是说,视频编码只压缩一次,却可以以多个帧率、空间分辨率或视频质量来进行解码,从而支持不同用户的不同应用需求。视频编码的分级技术是通过视频对象层(VOL)的数据结构来实现的。有两种基本的分级工具,分别是时域分级和空域分级,同时也支持时域空域的混合分级。每一级编码至少有两层的VOL,低层(基本层)用来提供视频序列的基本信息,高层(增强层)用来提供视频序列的更高的分辨率和细节。
3) 运动估计与补偿技术在视频编码中,运动估计相当耗时,对编码的实时性影响很大。在运动估计部分,必须通过反复计算,以确定邻近帧中宏模块的相关性。通常使用块匹配准则进行估计,比如绝对误差和( SAD)准则和均方差(MSE)准则,来选择进行一种最佳匹配操作来产生最佳匹配点的运动估计。例如,可以通过开发MPEG-4 专用的适应再同步、数据分割和数据恢复的句法单元来优化比特流,使其具有固定容错能力。在大多数情况下,高压缩比的视频数据无法避免由信道退化带来的误码影响。然而,只要通过采用一系列适当的方法和工具来减小误码的影响,高质量的无线视频传输是完全可能实现的。
2 MPEG-4技术的应用———视频医疗系统
通过以上对MPEG-4视频编码的关键技术的分析,可以看出, MPEG-4视频编码在视频传输方面有其独特的优点: (1)基于内容的交互性; (2)高效的编码方法; (3)通用的访问性。
将视频会议系统应用于医疗过程的视频医疗系统是视频会议的一个新的应用领域。在视频医疗系统中,可以采用点对点或点对多点的应用形式来进行一对一的诊疗以及专家会诊,还可以进行医疗教学实践等。视频系统主要具有视频的实时采集、同步压缩、实时传输及回放的功能。也就是说在传送本地视频的同时,可以回放并监控本地的视频信息,另外还提供视频的快照及存储功能。图1即为系统的结构模型图。
从图1可以看出,在视频医疗系统中,基于MPEG-4进行的视频采集及压缩是关键步骤。在视频医疗系统的设计过程中,由于软件的视频压缩算法极为耗时,因此为了提高压缩效率,在JMF 中引入了MPEG-4 压缩算法插件, 采用了基于MPEG-4的视频采集及传输技术来进行视频压缩,同时辅以双缓冲和多线程等技术。
视频对象的交互和编解码的一个重要前提就是利用视频对象的分割技术,通过运动估计和补偿技术得到一个基于运动信息和视觉特性的跟踪,并最终得到视频对象的跟踪结果。在视频采集线程将采集到的每一帧视频图像分别存放到视频源缓冲区1和视频源缓冲区2中,然后通过软件压缩线程对频源缓冲区1和视频源缓冲区2中的图像进行压缩,并将压缩后的结果分别保存到压缩视频缓冲区1和压缩视频缓冲区2中。在两个视频源缓冲区中至少
有一个为空时,视频采集线程将继续进行图像的采集工作;同样的,当视频源缓冲区至少有一个为满,并且压缩视频缓冲区至少有一个为空时,软件压缩线程才进行压缩。所有经过压缩的视频数据的线程按队列进行排列,它们可以同时使用非空的压缩视频缓冲区的数据。当最后一个线程使用完压缩视频缓冲区后,将向视频采集线程发出采集下一帧的命令。从缓冲区中取出数据并将缓冲区状态置为空,向缓冲区中放入数据时则将缓冲区的状态置为满。而MPEG-4视频编码的可分级技术则使视频在具有不同传输特性的异构网络上的传输得到了实现。
MPEG4压缩算法压缩比高,并且具有很好的网络适应性。在使用MPEG-4压缩算法的同时采用双缓冲和多线程等技术,可以使得图像的采集、压缩和传输并发执行,大大提高CPU的使用效率,使视频采集、压缩和传输的整体性能得到很大的提高。
3 结语
由于MPEG-4的可量测性和柔韧性以及宽带无线网络的出现,可以预见到在不久的将来无线多媒体服务将成为时代的潮流。宽带无线网络中的MPEG-4视频传输将成为不断出现的多媒体应用的一个重要组成部分。MPEG-4的低存储容量和高清晰度的特点,决定了MPEG-4在低带宽网络成为一种优越的视频压缩方式。由此可以看出,在视频医疗系统中进行视频压缩时,使用基于MPEG-4压缩算法的插件进行的一对一的视频传输,可以获得质量较高的视频图像,并且基本能够达到系统实时性的要求,这是传统的多点传输视频系统无法做到的。
暂无评论