日前,在美国夏威夷举办的2024骁龙技术峰会上,高通重磅推出新一代移动旗舰平台骁龙8至尊版。在为移动平台所定制的第二代自研Oryon CPU架构加持下,性能能效实现显著提升。
峰会举行期间,集微网采访了高通技术公司手机、计算和XR事业群总经理Alex Katouzian,围绕峰会上推出的新一代Oryon CPU、骁龙8至尊版移动平台、收购NUVIA等内容以及行业关心的话题进行了交流。
PC芯片两年一代 Oryon CPU保持年度更新
在去年的骁龙峰会上,采用第一代自研Oryon CPU架构的PC平台骁龙X Elite横空出世,率先在终端侧实现对于生成式AI的支持,性能能效的提升、高达45TOPS的NPU算力,碾压彼时竞争对手旗舰产品的表现,让业界印象深刻。随后,高通通过和微软在CoPilot PC上的深入合作,骁龙X Elite又率先引领AI PC的创新风暴,骁龙X Plus的发布使得高通完成在AI PC中高端产品层面上的布局。
由于去年推出了PC芯片新品,今年下半年相关AI PC上市,从产品上市节奏等因素考虑,高通并未在今年的骁龙峰会上进行新一代PC芯片的发布。
Alex Katouzian表示,去年的PC平台和今年的移动平台,都展示出高通在CPU设计方面的先进性。Oryon CPU不断迭代演进,因此CPU的内核发展并不是停滞不前,而是逐年提升。第一代Oryon CPU是面向PC平台,第二代Oryon CPU则是面向移动平台,尽管它是基于第一代产品,但是在微架构上针对移动终端进行了重新设计,使其更加实用且具备更出色的能效,但两者的微架构并非完全不同。
“明年骁龙峰会上,采用下一代Oryon CPU的新一代PC芯片将会面世,届时,在性能和能效方面会实现巨大提升。PC平台的更新策略则是两年一代,而Oryon CPU每年都会更新,”Alex Katouzian说。
而关于明年骁龙X Elite是否会采用第三代Oryon CPU这一问题,Alex Katouzian称目前无法透露,但肯定会是新一代的CPU。
对于社交媒体上有网友关于骁龙手机和PC芯片能否实现统一和融合的疑问,Alex Katouzian回应称,手机芯片和PC芯片内核在设计上有很不同的考量,两者很难进行融合或合并。
举例而言,一是在功耗分布方面,对于手机而言,其功耗通常是在2.5w-5w。一些时候可能会达到6-7w然后下降,因为考虑到必须确保一整天的电池续航。而对于笔记本电脑而言,需要同时兼顾功耗在15-30w的任务和功耗甚至超过50w的任务。二是PC芯片和手机芯片对于带宽的需求也有所不同。手机方面在设计时主要要考虑功耗高低、成本是多少;但对于PC而言,更多则是满足更丰富功能的需求。
Oryon CPU深度赋能 收购NUVIA助力多元化业务拓展
自研Oryon CPU在保持较高性能能效指标的基础上,还具有很高的灵活性以及扩展能力,因此可以结合不同领域、终端类型的实际需求,设计定制化的解决方案。从今年骁龙峰会上看到,Oryon CPU已经逐渐开始从PC、手机到汽车领域开枝散叶,成为高通在芯片设计创新上的核心和基石。
Alex Katouzian表示,目前,Oryon CPU应用于手机、PC、汽车业务领域,而高通的计划是将其应用于所有产品线的旗舰系列当中。
因此,从现在的视角看,高通2021年以14亿美元实现对于NUVIA的收购无疑获得了巨大成功。NUVIA在高性能芯片设计领域的经验和能力,有力地支持了高通在手机、PC、汽车等多个领域的CPU架构创新,以及其多元化业务战略的开展。
面向汽车的计算平台,需要具备很强的计算能力才能支持仪表盘上运行的多个应用负载。智能驾驶功能也需要很强的CPU作为支撑。
今年峰会上,高通推出新一代智驾和座舱芯片——骁龙座舱至尊版平台和Snapdragon Ride至尊版平台。在专为汽车定制的Oryon CPU的助力下,骁龙新一代智驾和座舱平台性能同样大幅跃进,CPU、GPU性能提升3倍,AI能力提升12倍。
“在汽车领域,我们的表现也很出色。实际上,目前高通已经成为汽车生态系统的优选合作伙伴,但汽车对于算力的需求还在不断增长。在PC领域,很大程度上依赖于CPU去实现众多功能。一旦CPU的性能不行,PC运行速度就会变得很慢,响应速度和流畅度也会下降,用户就无法获得很好的体验。因此CPU的性能极为关键。在移动领域,我们的产品具有很强的竞争力,我们还和众多生态伙伴开展合作;而PC是我们进入的相对较新的领域,我们也希望为PC带来非常强劲的算力。上述这些考量,都成为我们收购NUVIA的必要因素之一,我们希望具备面向多个业务提供高性能产品和解决方案的能力。”Alex Katouzian强调。
回应友商“高主频无用论” 空谈算力无意义
在此次发布的骁龙8至尊版中,CPU采用了2个超级内核+6个性能核的架构设计,取消了自骁龙8Gen1以来的能效核。联发科在过去两代旗舰芯片设计中,也采用全大核的形式。取消能效核成为一种设计趋势。实际上,从骁龙8Gen1到骁龙8Gen3,高通一直在逐步减少能效核的数量。
对此,Alex Katouzian解释称,此次Oryon CPU的性能内核已具备很强的性能和很高的效率。实际上,特定市场的不同用例对于核心的需求是不同的,有些用例偏向于使用效率内核,有些用例则更偏向于使用性能内核,而Oryon CPU的性能内核可以兼顾性能和效率方面的需求。
此外,骁龙8至尊版采用的缓存是24MB,而去年发布的骁龙X Elite缓存是42MB。Alex Katouzian表示,24MB实际上是为移动应用量身定制的大小,但是PC不一样,PC需要更大的缓存,对性能的要求也更高。但是针对移动领域,24MB的缓存是恰当的,并不会限制骁龙8至尊版性能的充分发挥。
骁龙8至尊版的CPU主频达到4.32GHz,相比于上一代骁龙8Gen3提高整整1GHz,领先苹果A18 Pro(4.05GHz)以及天玑9400(3.62GHz)。日前 ,也有竞品厂商称不会一味追求主频参数,而是要追求与终端性能需求相匹配。
对此,Alex Katouzian回应称CPU的频率仍然非常重要。
“游戏、AI、影像等在移动平台上处理的任务愈加复杂;甚至人们的浏览网页的习惯和使用方式的复杂性都在变得越来越高。因此,我们认为,只要能够保证能效在合理范围内,就可以在设计CPU时通过提高频率来实现性能提升。如果提高频率会导致电池续航只有3-5小时,那么这就不是一个实用的设计。因此,当我们提高CPU频率时,总是会有与之相匹配的功耗降低,在延长电池续航的同时,实现性能增强。对高通而言,每瓦特性能比单纯的性能和频率更加重要。”Alex Katouzian表示。
实际上,优秀的芯片设计是一项复杂工程,并非以追求某一项的技术指标为目标,而是始终在性能、功耗、成本等因素中寻求平衡的最优解。在此基础上如果能够实现部分或众多技术指标的显著性提升,非常考验芯片设计厂商的能力。
Alex Katouzian以NPU算力举例称,如果将所有的注意力都放在TOPS上,来讨论每秒能够完成多少万亿的运算,意义不大。因为如果只讨论超高的性能,而不把功耗与之相关联起来,这是没有意义的。所以高通不仅提升NPU的性能,也要相应考虑合理的能效。
“TOPS是衡量NPU性能的指标之一,在保证准确性的前提下,当NPU有越高的TOPS, token生成的速度就会越快。但是如果没有准确性,空谈TOPS没有意义。 骁龙X Elite达到45TOPS,已经能够比其他同级别处理器表现更出色。如果当我们的NPU性能达到100TOPS,并且还能拥有INT4精度、拥有运行相关模型足够的内存带宽,将方方面面的参数都包含进去,这样的讨论才有意义。”Alex Katouzian说。