人工智能大浪来袭 ARM新品/新策略双管齐下
继2016年在台北COMPUTEX发表最新款CPU、GPU授权方案后,时隔一年,安谋国际(ARM)又选在COMPUTEX展会期间发表最新一代CPU及GPU方案。 值得注意的是,受到人工智能(AI)影响,今年ARM的新CPU及GPU不仅对AI算法有更完善的支持,同时在平台发展策略上也做了明显调整。
ARM副总裁暨运算产品事业部总经理Nandan Nayampally表示,集中式(Centralized)的人工智能架构在安全及隐私方面有许多疑虑,而且对网络基础建设有相当高的依存度。 ARM对人工智能的愿景是实现安全且无所不在的人工智能。 为了实现这个目标,ARM有责任重新规划其产品,以便为网络端点与云端挹注更具效率且安全的分布式智能(Distributed Intelligence)。
ARM在2017年3月发表其DynamIQ技术,并于COMPUTEX期间发表首波支持该技术的Cortex-A75、Cortex-A55处理器。 这两款处理器均支持专为提升人工智能运算效能设计的专属指令集,以便在未来3~5年将人工智能运算效能提升50倍。 另一方面,这些支持DynamIQ的核心,可以用更具弹性的方式组成核心丛集,以便在性能、功耗及成本上满足更多元的应用需求。
更细分来看,Cortex-A75是一款效能接近笔记本电脑处理器的高效能核心,其单线程的处理效能比前一代核心大幅提升50%,还搭载更好的多核处理功能,笔记本电脑、网络设备或服务器,都是这款核心锁定的应用目标。 Cortex-A55则锁定在中阶市场,虽然效能不比A75,但比起前一代相同定位的Cortex-A53,其每毫瓦效能仍提高了2.5倍。
至于在GPU方面,ARM则发表最新款GPU授权核心Mali-G72。 相较于前一代G71核心,G72核心支持Mobile Multiview、MultisamplingAnti-Aliasing、ASTC、Foveated Rendering与PLS-G Buffer等新技术,可以在更节省带宽的前提下提供更好的虚拟现实视觉体验。 据估计,在执行同一款游戏的情况下,G72核心的GPU写入带宽将比G71节省68%,因此省电性能将大幅提升。
事实上,不管是虚拟现实运算或是人工智能运算,最耗电的任务都不是运算本身,而是大量的数据传输。 因此,任何能节省带宽的新技术,都可以对芯片耗电量带来明显改善。
除了新的CPU及GPU核心外,ARM也发表了全新的ARM Compute Library。 这款免费开源的函式库(Library)汇集了一系列针对Cortex CPU及Mali GPU架构优化的低阶软件函数,不管是现有或即将推出的ARM SoC,都可以从这个函式库获得明显的人工智能算法效能提升效益。 据ARM内部估计,采用这个函式库,机器学习与人工智能算法的效能将可提升10~15倍之多。
此外,这个函式库也是ARM针对人工智能所做的最大策略调整之一。 该函式库不只支持ARM自家的处理器核心,同时也可以支持其他第三方人工智能加速器硅智财(IP)。
Nayampally指出,人工智能算法加速器并不在ARM的产品发展蓝图里,但许多芯片开发者都会在设计SoC时添加某种加速器,以提升执行某些人工智能算法的效率。 ARM副总裁暨多媒体处理器事业部总经理Jem Davies则补充,由于客户采用的算法不同,因此这类加速器可能是可编程的数字信号处理器(DSP),也可能是固定功能的实体电路,端视客户的应用需求而定。 因此,ARM将透过提供函式库的方式来协助客户实现SoC整合,并提高各种异质核心的协作效率。
除了新核心与新的函式库外,ARM也推出了对应的软件开发环境。 结合虚拟原型(Virtual Prototype)与DS-5 Development Studio开发环境,软件开发者将可在ARM生态系统推出芯片硬件前,便开始着手开发针对DynamIQ优化的软件。
Nayampally总结,展望未来5年,基于ARM核心的处理器芯片出货量,将达到1,000亿颗。 为了实现这个目标,ARM的生态系统必须从实体运算世界转型到无所不在的运算(Total Compute)。 在本届COMPUTEX期间所发表的新产品,将使ARM与其合作伙伴更接近Total Compute的愿景,并带动智能解决方案的转型。
ARM副总裁暨运算产品事业部总经理Nandan Nayampally表示,集中式(Centralized)的人工智能架构在安全及隐私方面有许多疑虑,而且对网络基础建设有相当高的依存度。 ARM对人工智能的愿景是实现安全且无所不在的人工智能。 为了实现这个目标,ARM有责任重新规划其产品,以便为网络端点与云端挹注更具效率且安全的分布式智能(Distributed Intelligence)。
ARM在2017年3月发表其DynamIQ技术,并于COMPUTEX期间发表首波支持该技术的Cortex-A75、Cortex-A55处理器。 这两款处理器均支持专为提升人工智能运算效能设计的专属指令集,以便在未来3~5年将人工智能运算效能提升50倍。 另一方面,这些支持DynamIQ的核心,可以用更具弹性的方式组成核心丛集,以便在性能、功耗及成本上满足更多元的应用需求。
更细分来看,Cortex-A75是一款效能接近笔记本电脑处理器的高效能核心,其单线程的处理效能比前一代核心大幅提升50%,还搭载更好的多核处理功能,笔记本电脑、网络设备或服务器,都是这款核心锁定的应用目标。 Cortex-A55则锁定在中阶市场,虽然效能不比A75,但比起前一代相同定位的Cortex-A53,其每毫瓦效能仍提高了2.5倍。
至于在GPU方面,ARM则发表最新款GPU授权核心Mali-G72。 相较于前一代G71核心,G72核心支持Mobile Multiview、MultisamplingAnti-Aliasing、ASTC、Foveated Rendering与PLS-G Buffer等新技术,可以在更节省带宽的前提下提供更好的虚拟现实视觉体验。 据估计,在执行同一款游戏的情况下,G72核心的GPU写入带宽将比G71节省68%,因此省电性能将大幅提升。
事实上,不管是虚拟现实运算或是人工智能运算,最耗电的任务都不是运算本身,而是大量的数据传输。 因此,任何能节省带宽的新技术,都可以对芯片耗电量带来明显改善。
除了新的CPU及GPU核心外,ARM也发表了全新的ARM Compute Library。 这款免费开源的函式库(Library)汇集了一系列针对Cortex CPU及Mali GPU架构优化的低阶软件函数,不管是现有或即将推出的ARM SoC,都可以从这个函式库获得明显的人工智能算法效能提升效益。 据ARM内部估计,采用这个函式库,机器学习与人工智能算法的效能将可提升10~15倍之多。
此外,这个函式库也是ARM针对人工智能所做的最大策略调整之一。 该函式库不只支持ARM自家的处理器核心,同时也可以支持其他第三方人工智能加速器硅智财(IP)。
Nayampally指出,人工智能算法加速器并不在ARM的产品发展蓝图里,但许多芯片开发者都会在设计SoC时添加某种加速器,以提升执行某些人工智能算法的效率。 ARM副总裁暨多媒体处理器事业部总经理Jem Davies则补充,由于客户采用的算法不同,因此这类加速器可能是可编程的数字信号处理器(DSP),也可能是固定功能的实体电路,端视客户的应用需求而定。 因此,ARM将透过提供函式库的方式来协助客户实现SoC整合,并提高各种异质核心的协作效率。
除了新核心与新的函式库外,ARM也推出了对应的软件开发环境。 结合虚拟原型(Virtual Prototype)与DS-5 Development Studio开发环境,软件开发者将可在ARM生态系统推出芯片硬件前,便开始着手开发针对DynamIQ优化的软件。
Nayampally总结,展望未来5年,基于ARM核心的处理器芯片出货量,将达到1,000亿颗。 为了实现这个目标,ARM的生态系统必须从实体运算世界转型到无所不在的运算(Total Compute)。 在本届COMPUTEX期间所发表的新产品,将使ARM与其合作伙伴更接近Total Compute的愿景,并带动智能解决方案的转型。
来源:新电子
#新品#
#人工智能#
THE END