快捷搜索:  ???  as  test  空调  创意文化园  ???????  ?????  ??????

达芬奇架构和arm架构有什么区别?

事实上,这两者不是同一个东西,ARM架构更多应该是与X86架构进行比较,两者都是CPU架构,分别基于精简指令集(RISC)和复杂指令集(CISC),简单来说就是ARM注重功耗比,适合散热能力有限的移动设备使用,而X86架构更注重性能和速度。

达芬奇架构是华为自研的NPU架构,在功能上与之前采用的寒武纪的NPU是一样的。所谓NPU即神经网络处理器,采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。可以简单的将NPU处理器理解为只处理单一领域,而CPU则处理所有领域,NPU一般也可称为是协处理器。

因此,该NPU本质上依旧是遵循RISC指令集的,可以理解为采用传统的ARM处理器 AI加速器,其AI加速器就是达芬奇核心。

达芬奇架构直接地把计算用的乘加器(MAC)按照不同的计算组织成不同的方式,并搭配标准的数据缓存。当要做人工智能相关的计算时,可以使用按cube(“三维立方”) 模式组织的MAC群,从而支持相关计算。当需要其他常规计算时,则可以使用矢量或标量计算MAC。对于不同规模的芯片,可以通过放置不同数量的达芬奇核心来满足需求,因此同一个达芬奇核心的设计可以灵活地满足华为战略横向上不同应用的需求。

华为自研的达芬奇架构更多的比较对象应该是其他的人工智能芯片架构,例如Nvidia的GPU和Google的TPU,而不是与CPU架构做比较。

简单来说,无论是GPU还是TPU以及NPU目前更多都是协处理器,承担部分领域的边缘计算,这与ARM或者是X86有着本质的区别。

目前,在人工AI芯片领域来说,Nvidia的GPU架构主要源自传统GPU多核并行架构,其GPU主要还是处理图像,并非天生为人工智能而生,因此在卷积神经网络推理等主流应用上,效率并不高;谷歌的TPU上使用systolic array架构,该架构采用脉动阵列,对于内存带宽的需求较小,但是很难小型化的同时保证运行效率,更适合需求高端算力的场景,对于终端低算力低功耗应用适配性不够好。

相较于以上两者,华为的NPU采用达芬奇架构,专门为卷积神经网络进行优化,并能够动态满足不同算力需求。

除了达芬奇架构,华为还有传说中的笛卡尔架构,主要用于自家的GPU上,不知道会不会在下一代麒麟芯片中发布,拭目以待。

本文源自头条号:岁月杂谈 转载申明:本文转载自以上微信公众号,若有侵占你的权益,请发邮件至本站邮箱,本站24小时内将予删除。

发表评论
sunbet声明:该文看法仅代表作者自己,与本平台无关。请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片

您可能还会对下面的文章感兴趣: