以异质多核心平台实现多媒体可携应用
1. 前言
不论是制作端、播放端或设备端,数字多媒体的应用已愈来愈多样和广泛,在技术上的努力都致力于达到随时(Anytime)、随地(Anywhere)、任何设备(Any device)和各种网络(Any network)都能制作、播放数字多媒体的环境。这些设备包括电视、计算机和汽车影音播放器,以及各式各样的手持式设备,其中又以手机为众所关注的大宗市场。这些固定或随身型的设备不仅要能录、能放,而且开始要求能提供高画质(HD)的影音内容。
为实现这些应用需求,多媒体芯片目前面临极大的挑战,例如必须有能力支持广泛且持续更新的多媒体格式、提供高质量的编解码能力、适合多样化的可携式造型设计、延长电池的续航力,并能加速上市的时程。也就是说,今日的多媒体芯片必须在效能、弹性及功耗上获得突破,因而需要采用新一代的技术架构。本文将剖析数字多媒体的技术挑战,并说明异质多核心平台的优势所在。
2. 数字多媒体设计议题
今日市场上已开发许多的视讯编码标准,不同的设备会因应用性的不同而选择需要的视讯编译码技术。不过,随着这些消费性电子设备朝向互连性、开放性发展,愈来愈被要求能够兼容广泛的解码能力。要做到这一点并不容易,因为市场上已出现太多的影音标准,而这些标准中往往又存在不同的版本(versions)和规格(profiles);不仅如此,在传送上,视讯编码比特流会被包裹为各种不同的档案格式,视讯系统要能够阅读与译码。
在视讯标准的制定上,目前的工作以延伸现有的标准为主,而非开发全新的视讯编译码方法。在版本更新的制定目标上,是希望做到更高效率的频宽使用。其它的努力包括让 H.264 具备 3D 视讯的多重观看编解码能力,以及提高标准的延展性。延展性的目的在于让一种编码格式能够以不同的分辨率和讯框速率来译码,这有助于解决标准纷歧不兼容的问题。
其它要考虑的议题还包括影像分辨率、讯框速率(
另一个重大的设计挑战来自于手持式设备对高画质(HD)视讯的需求。HD 对内容质量的要求比 SD 高出许多,不论是音讯或视讯内容,都需要更高的取样速率及位速率,也需要更多的内存容量及处理器资源。以视讯内容为例,HD 的数据内容庞大,其讯框数据比 SD 多出 6 至 8 倍,数据传输率需要 90-120MB/s,HD 的位速率更可高达 100Mbps 以上。
3. 异质多核心平台架构
在为设备选择一个视讯处理系统时,最理想的作法是选择能处理许多视讯编译码标准和处理技术的系统,而且具备软件可程序性和韧体可升级性,这样才能提供最大的设计弹性来满足上述的设计议题。此外,对于运算资源有限的手持式设备来说,高画质视讯是相当不易达成的任务,因此必须采用突破性的视讯处理架构。
目前市场上存在多种视讯处理作法,基本上是以硬件加速器的方式来提高视讯运算的效能,或是采用 DSP 方案来满足设计上的弹性需求。这两类作法各有优缺点,ARC 则以可配置处理器(Configurable Processor)为核心,提出兼容性的 VRaptor 异质多核心平台的解决途径。
这套可平行运算的架构中包括三种不同类别的处理器核心:第一类是 ARC 的可配置 32 位 RISC 核心和以 128 位数据向量来运作 SIMD(Single Instruction Multiple Data)引擎。ARC 可配置处理器具有 7 个管线级数(pipeline stage),允许更高的频率速率,它能执行主处理(host-processing)功能,如执行操作系统、作为应用功能的控制器和进行音讯译码。
SIMD 的一个指令能操作 16 个平行的数据动作,它的一般指令集架构能支持广泛的应用,特殊指令则被用来加速 H.264 和 VC-1 所需要的去除方块效应算法。这些指令能够有效的利用核心的运算资源,例如能针对解决低通滤波器(low-pass deblocking filters)和图素转换等提供最佳化功能,而且能与 ARC 700 主核心平行地自行运作。
第二类为硬件加速器,例如熵编译码器(Entropy encode/decode)以及运动估算(Motion Estimation)等,在执行多媒体处理工作上,比一般用途可编程核心的效率更高,以硬件联机(hardwired)的 Entropy 译码加速度器来说,它支援霍夫曼式 MPEG-1/2/4 和 VC-1 视讯编译码标准,以及 H.264 BP 所需要多种译码方式。第三类包括高速 DMA 控制器,能解决 CPU 在处理多媒体编译码所涉及的复杂数据移动,它负责独立地从系统内存处移动数据。
透过这种异质核心架构,用户能够根据其需求做弹性的可配置设计,更重要的是,高效能的平行运算能够以有限运算资源来实现高画质的需求,而且保有低功耗的特性。举例来说,ARC 采用 65nm 制程的 AV417V 视讯子系统,以 2.35mm2 的芯片面积即可以 200MHz 的速度执行 D1/30fps 的 H.264 BP 编码,而且能进行动态编码,也就是可依处理器的频率及应用的复杂度来调整编码方式。
4. 结论
市场上对高画质的数字多媒体已有愈来愈高的需求,对于手持式设备来说,由于运算资源有限,设计上的挑战更为严苛,因此必须采用更高效率的先进技术架构才行。异质多核心平台的处理架构兼容硬件加速度器的效能和 DSP 的弹性优势,能够实现高质量的影音处理,同时能延伸多媒体标准的升级,并为系统做到最佳化调整,充分展现其在多媒体芯片设计上的优势所在。
暂无评论