大比特商务网旗下:
智能照明 智能家电 AI+IoT与智能家居 电机驱动与控制 快充与无线充 电驱动与BMS 锂电保护与BLDC 智能四表 汽车照明
/>
广告
广告
探讨人工智能芯片设计和开发的6个挑战
您的位置: 半导体器件应用网 >>行业要闻 >> 行业新闻 >> 正文

探讨人工智能芯片设计和开发的6个挑战

2020-07-28 09:57:59 来源:电子发烧友网

【大比特导读】深度学习为现实世界普遍存在复杂非线性问题提供了一种通用框架——不是写程序,目前AI芯片设计从算法开始,经历架构设计、逻辑设计和验证、物理设计和验证。对于芯片开发和应用方法,乃至处理器架构和编程提出了挑战。

引言

AI发展及其意义:

学术界和产业界对于人工智能的研究由来已久,但直到近期的2006年,伴随着CNN、GPU加速和海量数据,人工智能才伴随着机器学习(Machine Learning)/深度学习(Deep Learning)的分支再次起飞,这一次,飞到现实应用。谷歌AlphaGo打败人类最高棋手使得人工智能引起普通民众的注意。

深度学习为现实世界普遍存在复杂非线性问题提供了一种通用框架——不是写程序,而是通过框架和大量的数据经过高性能计算进行求解(训练和预测)。深度学习更加接近人类智能,并且有人类智能无可比拟的一些优越性,这为从现实世界已有的大量数据中挖掘价值提供了有效的手段。

本文:

- 分析人工智能在具体实现上的3个特点

- 探讨AI芯片设计和开发的6个挑战,以及相应的产业界方案、发展趋势。

1. AI实现的特点

1.1 AI属于典型的计算密集型应用

AI以密集运算为主,典型的是向量点积,基本单元是乘累加(MAC),动辄在TFLOPS量级;且对于数据带宽要求高,相应的运算延时要求主要在应用级,不像CPU一样敏感。

典型的通用处理器以ALU为中心,构建外围控制、中断和异常处理电路;为了高性能处理单元能够填满流水和快速运转构建乱序和预测、cache等机制,为了对于事件快速响应。然而运算能力不强,并且整个芯片运算所占的面积比重也很少。

高性能运算的一个极端情况是全硬件并行实现,对于10点的点积运算运用多个MAC并行计算;所以计算速度快但是面积消耗也很大。

1.2 AI要求芯片具有灵活性

AI算法以CNN、RNN等为主干,分支众多;同样的算法体制,其具体参数(层数、宽度等)也不一样;AI算法本身在不断的演进;AI算法优化的一个方向是稀疏矩阵处理、低运算精度实现高精度类似的性能。

然而,芯片设计的投入高、周期长、风险高;要让芯片开发能够应对算法多样化和快速演进的挑战,需要一款芯片能够应对不同类型的应用需求,这对于芯片的灵活性提出挑战。

1.3 AI芯片设计跨越算法和软硬件

鉴于上面的两个挑战,AI芯片设计从算法开始,经历架构设计、逻辑设计和验证、物理设计和验证。对于芯片开发和应用方法,乃至处理器架构和编程提出了挑战。

2. AI芯片开发挑战、现状和趋势

2.1 基于算法框架实现算法和芯片设计的接口

AI芯片的涉及到算法、软件、硬件三个专业方向,为了有效的分工和协作、实现相互之间的可移植性,界面的划分和定义很重要。

应用层面见到的无非是训练和测试数据,模型选择和基本参数,理想情况下解决方案可以自动有效完成训练和预测,正如当今没有体系结构和编程语言基础的的用户可以快速掌握和使用office软件。而下层实现当今深度学习的主流算法,并且具有一定的可配置性和可调试性。这部分在业界有多个算法框架,典型的如谷歌的TensorFlow、亚马逊的cafee等,也有在这些框架之上构建的封装更好的平台如Keras。

框架的相互交互和底层实现多种多样,平台不同实现方案也不同。一个有益的工作是定义中间层格式(IR),IR的一个重要基础是核心算子。这里有ONNX、NNVM等。

2.2 AI芯片架构

前文提到,AI芯片密集型运算和可编程性的要求,普通处理器不能够有效应对,需要大规模并行计算。

图片来源网络

图片来源网络

FPGA和GPU相对于普通的CPU和DSP更加折中实现并行性和可编程性。然而,FPGA核心是LUT,实现相同功能所需的器件面积远大于ASIC,同时运行频率受限。GPU是传统技术中最适合可编程并行运算的,但是GPU本质上是为了图像处理构建,架构与通用并行计算仍然有不少的距离;虽然GPGPU针对通用计算做了一些优化,但是仍然有不少的差距。

通用可编程并行计算最适合的是流处理器和可重构处理器。早些年在寻求突破传统处理瓶颈的时代不少学术和产业界项目做过尝试,但是当时对于高性能计算的要求并不普遍、不迫切所以没有有效的发展。随着AI对于计算的需求,这些技术正如深入学习算法走上算法舞台一样,走向架构设计舞台。

具体来说,很多原本只是探索的技术会走上AI架构设计的舞台,传统的程序优化技术会普遍应用的架构设计。如深度流水、并行计算、数据局部性原理相关的局部存储、延时隐藏、循环展开等。后面会有专门的文章介绍。

2.3 层次化实现和验证

AI芯片的大规模和并行特点,导致AI芯片的设计复杂并且有很大难度:展平式寻优策略在计算机算法上是NP问题,芯片设计每个流程的运行时间也很长,因而短时间找到最优方案并实现极具挑战,所以需要使用分治策略分层实现,以寻求现实的次优解。

分层体现在系统设计的处理单元(processing elements)-簇(cluster)-子系统-SoC芯片;体现在结构设计关注关键参数-逻辑设计关注微架构和周期一级-后端设计关注具体频率sign-off,不同的阶段有不同的关注点,通过上层设计明确关键参数,逐步往下渐进明细。相应的验证也是如此,通常架构设计明确主要参数和主体运算周期,逻辑设计除了关注具体时序,很多的是保证与算法设计bit对准来验证行为,而后端验证主要关注微架构的时序是否能够实现。

这方面主要是开发流程的规划和整合,不同的IP供应商会提供C++/SystemC模型供架构设计仿真,仿真平台有纯SystemC,也有Synopsys PA(集成了不少常用模型和系统构建调试机制)

2.4 算法和软硬件协同设计

传统芯片顶层设计中软硬件划分是一个重要主题。而AI芯片设计还需要关注算法,比如:卷积核的运算需求,数据存储和传输需求;卷积核的运算协作和数据交互需求等。以及引言部分提到的利用低精度运算实现类似高精度运算的算法精度,利用矩阵稀疏性简化运算同时保证算法性能等。这些优化本质上源于算法,但是需要芯片设计配合,但其在架构及优化对整个芯片PPA的优化立竿见影。对于熟悉传统芯片设计流程的芯片团队式巨大的挑战。

这里主要是算法优化方案在算法和模型层面,涉及到C/Python/SystemC。

2.5 应用开发工具链

AI芯片的大规模和并行特点,导致AI芯片的开发也极具挑战。以编译器为例,运算单元或者cluster内部涉及到并行编译和调度;整个算法在芯片上的实现也是很难展平开发,更多的是运算单元或者cluster为单位,根据数据流特征进行划分和映射,以及相应的通信和存储配备设计进行分治处理。

本质上当今的算法描述语言C/Python只描述算法的逻辑功能,不具备时空信息,不具备存储和传输信息,所以很多算法是先经过同时熟悉芯片架构和算法的工程师的规划,再通过工具链预定的指令指示工具链处理。这方面通用意义上有StreamC/KernalC,产业界NVIDIA的CUDA针对其GPU比较成功,谷歌针对TensorFlow的XLA,华盛顿大学针对GPU的TVM。更为普遍的使用LLVM的开放型构建自己的工具链。但目前工具链的自动化和性能与实际要求差别较大,很多大规模案例会有工具链和手工优化结合,方案供应商多以SDK形式提供,不同的应用提供不同的SDK,且SDK的版本不断更新。

大规模并行计算的调试和跟踪也是一个挑战,传统意义上的单步调试需要协调不同处理器核心之前的状态;而跟踪除了核间协调还需要dump大量的实时运行数据,这需要占用大量的片上带宽和芯片接口资源,还涉及到数据压缩和可视化。这方面比较典型的是UltraSoC。

2.6 产业格局

算法设计、芯片设计、应用设计、系统方案供应商、应用方案供应商、具体企业和个人用户是AI潮流的相关者。但是由于产业尚在迅速发展,尚未成熟,尚不能形成明确的的专业分工。并且一体化设计和应用也是不同方案差异化竞争力的体现,是构建技术壁垒的一种重要途径。

在这种环境下,AI的从业者大体可以分为供应商、用户、供应商和用户三种。前者主要是传统的芯片设计公司如英特尔、华为和新兴独角兽公司。后者主要是大的互联网公司,他们是AI的企业用户主体,由于业务体量的需求开始逐步构建自己的AI芯片方案,如谷歌、BAT等。中间的是中小用户,需要并认可AI的价值,但尚不具备构建AI芯片和全栈方案的资金和技术实力,需要依附专门的AI公司,或者在互联网公司的云端方案构建自己的方案。

接触到的行业前后两类的公司差别很大,传统的芯片设计公司具有很强的IC设计开发能力,但是不能够很好地理解AI应用,因而设计的芯片针对性欠缺;同时由于过多的传统芯片设计包袱,不能够果断地拥抱新的芯片设计架构和方法学。互联网公司的芯片设计团队芯片设计能力略有欠缺,但是可以很好的理解应用,拥抱新的架构和方法学;另外,由于目前AI尚不能明确分工的特点,互联网公司的芯片设计和应用可以有效协作,填补设计流程上不能自动化的挑战,尽早实现AI芯片的价值,即使设计可能不是很优秀。所以,哪一派最终能够胜出尚不明了。

 

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请与我们联系,

我们将及时更正、删除,谢谢。

  • 赞一个(
    0
    )
  • 踩一下(
    0
    )
分享到:
阅读延展
芯片设计 FPGA AI芯片
  • 高景气度延续 8英寸晶圆代工涨价动力足

    高景气度延续 8英寸晶圆代工涨价动力足

    产能吃紧、需求旺盛,8英寸晶圆代工涨价动力不减。有芯片设计公司日前再度发布涨价通知,直言“晶圆价格大幅上涨,值得一提的是,今年以来,5G手机渗透率快速提升,电源管理芯片需求从每台手机1-2颗提高到每台手机最高10颗。

  • 后摩尔定律时代的新救星?芯原戴伟民详解半导体新技术Chiplet

    后摩尔定律时代的新救星?芯原戴伟民详解半导体新技术Chiplet

    在摩尔定律的指引下,芯片上集成的晶体管数量不断超越人们的想象,值得一提的是,整体来看,Chiplet给半导体全产业链都带来了新的机会。戴伟民指出,芯片设计环节能够降低大规模芯片设计的门槛。

  • EDA突破“创芯”新思科技为芯片设计赋能

    EDA突破“创芯”新思科技为芯片设计赋能

    EDA是芯片的雕刻刀。随着芯片的集成度越来越高、功能越来越复杂,没有高可靠、智能化的EDA,完成芯片的设计及验证就成了一纸空谈。值得一提的是,定制设计与仿真、硅生命周期管理(Silicon Lifecycle Management)是我最为期待的两个技术发展方向。

  • 更严格的准确度!IC设计中DRC验证如何实现?

    更严格的准确度!IC设计中DRC验证如何实现?

    从芯片最初的架构设计到最后的流片,验证工作贯穿了整个设计流程,整个芯片设计70%左右的工作量已经被验证所占据。,随着集成电路规模和复杂度不断增大,验证的难度、工作量也急剧增加,设计规则检查(DRC)间距检查的复杂性更显著增加。

  • SIA:超过73%的美国芯片均可被他国产品取代

    SIA:超过73%的美国芯片均可被他国产品取代

    台媒digitimes消息称,即便中国必须花上10年时间,也将逐步取代美国芯片设计者、芯片软件开发商以及半导体设备制造商,并且将美国供应商逐出中国市场。此外,SIA还强调,中国市场是全球增长速度最快也是美国半导体产业的最大市场之一,每年的交易额占美国半导体厂商总营收的近三分之一。

  • 合创资本刘华瑞:浅谈消费电子领域芯片设计公司的投资

    合创资本刘华瑞:浅谈消费电子领域芯片设计公司的投资

    在过去的二十年中,随着mp3、功能手机、智能手机、平板、TWS等消费电子产品的蓬勃发展,广大的消费者获得了闲暇娱乐上甚至是主业工作上无穷的便利,另外,一种消费电子产品能否真正成为爆款,并不仅仅由消费者和产品公司双方就能决定。

  • 一起来讨论下国产FPGA芯片吧

    一起来讨论下国产FPGA芯片吧

    你知道国产FPGA芯片的现阶段情况怎样了吗?今日就让我们一起来讨论一下吧,首先小编会从国产FPGA芯片的市场容量分析,然后再和大家聊聊如今国产FPGA芯片较突出的问题是什么,好了,快来看看这篇文章吧!

  • 跟小编一起看看FPGA技术吧 你了解吗

    跟小编一起看看FPGA技术吧 你了解吗

    本文主要介绍了FPGA技术为什么能够存有潜在市场,主要原因是FPGA不但可以实现电子系统小型化、低功能损耗、稳定性好的优点且FPGA的设计周期短、资金投入少、价格较低。

  • 一篇关于FPGA芯片分析的文章 快来看看

    一篇关于FPGA芯片分析的文章 快来看看

    你想知道国产FPGA芯片近况如何了吗?今天小编就整理了一些有关国产FPGA芯片的资料,分别会从上游、中游、下游来分析国产FPGA芯片,如果有兴趣的可以看看这篇文章哦!

  • 在制定fpga芯片时会碰到什么麻烦呢

    在制定fpga芯片时会碰到什么麻烦呢

    fpga芯片是什么意思呢?我国fpga芯片未来会遇到怎样的挑战呢?这篇文章主要是分享一些专业的知识,例如怎样挑选fpga供应商、在设计fpga芯片时会遇到什么麻烦等,下面就来学习下吧!

  • 如何选择和设计国产fpga芯片,将会面临哪些挑战

    如何选择和设计国产fpga芯片,将会面临哪些挑战

    如果您对使用国产fpga芯片的电路板设计经验有限或没有经验,那么您面临的第一个问题当然是供应商和设备的选择,并且下一步是选择国产fpga芯片的系列和大小,另外,开发工具(或独立程序或电子表格)应该能够为给定的设计提供功率估计。

  • 我国FPGA芯片正在慢慢缩小差距 来看看吧

    我国FPGA芯片正在慢慢缩小差距 来看看吧

    本文主要介绍了FPGA芯片的市场前景,其次介绍了FPGA和它的优点以及FPGA主要应用在那些领域,虽然在FPGA技术上跟国外的FPGA行业大佬还是有不小的差距,但是我国的FPGA厂家正在慢慢崛起。

  • 自动驾驶大航海时代,AI芯片成最强发动机

    自动驾驶大航海时代,AI芯片成最强发动机

    当下,拥有高算力的车载AI芯片已经成为车企们的刚需,将其称为“通往智能汽车、自动驾驶征途上的最强发动机”也不为过。

  • 海宁研发出全球首款超高性能异构AI芯片

    海宁研发出全球首款超高性能异构AI芯片

    近日,位于海宁泛半导体产业园的浙江芯盟科技有限公司成功研发出全球首款超高性能异构AI芯片。据了解,芯盟科技成立于2018年11月,是一家专业从事类人感知人工智能芯片创新设计与智能生态孵化的企业,拥有国家级人才2人,省级人才1人,世界名校博士4人。

  • Edge将淘汰云作为AI芯片市场的驱动力

    Edge将淘汰云作为AI芯片市场的驱动力

    随着人们越来越关注低延迟、数据隐私以及低成本、超节能的人工智能芯片组的可用性,edge人工智能(AI)芯片组市场有望在2025年首次超过云AI芯片组市场。

  • 有来自AMD顶级视觉AI芯片团队,肇观电子完成新一轮融资

    有来自AMD顶级视觉AI芯片团队,肇观电子完成新一轮融资

    近日,肇观电子完成新一轮股权融资,投资方为众灏资本,据了解,肇观电子已成功发布刷新世界记录的视觉处理能力的N系列、D系列、V系列芯片,可广泛应用于专业安防、辅助驾驶、机器人、家用摄像、人脸识别等领域。

  • 科创板AI芯片第一股正式诞生!

    科创板AI芯片第一股正式诞生!

    7月20日,北京中科寒武纪科技有限公司(简称“寒武纪”)在科创板首发上市,发行价64.39元/股,开盘大涨288%,股价直达250元/股,市值一度冲破1000亿元。截至当天收盘,寒武纪报收212.40元/股,涨229.86%,市值近850亿元。

  • AI芯片是支撑人工智能技术和产业发展的基础设施

    AI芯片是支撑人工智能技术和产业发展的基础设施

    毫无疑问,AI技术已经被视为一种新的通用技术,对未来的影响和价值不容小觑,值得一提的是,由于AI语音识别是人工智能最重要的技术能力,因此,基于语音识别的智能音箱成为AI芯片的另一个重要秀场。

微信

第一时间获取电子制造行业新鲜资讯和深度商业分析,请在微信公众账号中搜索“大比特商务网”或者“big-bit”,或用手机扫描左方二维码,即可获得大比特每日精华内容推送和最优搜索体验,并参与活动!

发表评论

  • 最新评论
  • 广告
  • 广告
  • 广告
广告
Copyright Big-Bit © 1999-2016 All Right Reserved 大比特资讯公司 版权所有      未经本网站书面特别授权,请勿转载或建立影像,违者依法追究相关法律责任