当芯片已成为国之重器,而大国博弈的重心也转向更大范围、更具深远战略意义的AI芯片之争,对高端GPGPU的争夺将越来越激烈,并决定未来几十年的科技实力版图。
在生成式AI牵引的第四次工业革命时期,一方面GPU市场高歌猛进,据Verified Market Research数据统计,2027年全球GPU市场规模有望达到1853.1亿美元,年平均增速高达32.82%。另一方面,我国面临高性能GPGPU进口受限、国内采用国外IP等不可控因素较多等问题,发展强大的自主可控高算力GPGPU已成为确保我国未来国际竞争力的关键因素。
在这一情形下,清华大学集成电路学院副教授、博士生导师何虎对集微网表示,开源成为发展自主可控GPGPU的创新路径。而清华大学集成电路学院研发团队历经多年研发的“乘影”,在指令集架构、工具链、生态等层面均取得了不俗的进展,有望为国内GPGPU发展提供新的路径。
开源成自主可控GPGPU新路径
众所周知,GPGPU技术栈最重要的中间抽象层是指令集架构ISA,无论是英伟达还是AMD等,长期以来将其作为闭源技术规范,并建立了牢固的护城河。
对于国内GPGPU厂商来说,要在闭源领域闯出一条生路面临资金、人才、生态等重重挑战,再加上层出不穷的禁令和围堵,寻求开源或成为解锁之路。
何虎分析,将指令集架构变成开源技术标准,将带来诸多利好。上下游开源标准之间分割出的软硬件技术栈,有能力供养一批独立的软硬件解决方案公司。软件公司通过建立统一的软件生态系统,减少上层应用和工具软件的开发和迁移成本;芯片设计公司则可专注于设计,提高资源投入效率,进而提升技术水平和竞争力。
除此之外,何虎还指出,统一指令集架构可以形成合力,将分散的GPU研发力量聚合起来,形成可以和巨头竞争的局面,不会被竞争对手各个击破,也更利于人才的汇聚。而且,开源技术可以较为容易地设立离岸芯片企业,既满足知识产权自主可控,又可以打破先进工艺封锁。
为此,在深耕数年取得阶段性成果之后,清华大学“乘影”GPGPU开源项目正式启动,成为对国内GPGPU产业自主创新“开启山林”之举。
“乘影”的指令集架构大部分指令来自RISC-V指令集,并采用了GPGPU SIMT架构设计了多条扩展指令。经过多年的布局,如今与x86、Arm三分天下有其一的RISC-V已经从物联网向桌面级、边缘计算渗透,并继续迈向HPC、自动驾驶等场景,加之生态的蓬勃发展,为这一设想提供了底层技术支撑。
何虎提到,这可充分利用RISC-V现有的指令集架构生态,使得市场主体很容易接受和参与到软件开发和芯片设计中,从而为我国GPU产业长期发展奠定坚定基础,使其做大做强。
“乘影”生态构建深入推进
而开源技术要大行其道,生态至关重要。
特别是英伟达在GPGPU在AI市场一骑绝尘,离不开其倾尽十年之力打造的CUDA生态,成为支持主流AI框架、库、工具的强大AI基础设施。打破CUDA桎梏,在生态层面至少要有实力相抗衡。
何虎对此介绍,“乘影”开源GPGPU平台致力于提供包括开源指令集架构、微架构设计、OpenCL软件工具链在内的全套实现。经过长期的耕耘,目前“乘影”采用RISC-V部分指令和自定义指令构建的通用GPU指令集架构。研发团队还采用Chisel语言实现了硬件参考设计,同时还实现了OpenCL编译器、功能和周期软件仿真器、POCL、驱动软件等整套工具链软件,并且通过了大部分OpenCL 2.0 CTS测试集的验证。
综合来看,基于乘影GPGPU,相关成果也在全面一个开源GPU平台,包括开源指令集架构、OpenCL软件工具链、微架构设计的完整GPU实现;五项核心专利等等。在“乘影”GPGPU开源项目正式启动发布会现场,来自清华大学研发团队的研究生于芳菲等介绍了乘影GPGPU的指令集架构和硬件技术、软件开发和应用以及开源网站进展。
无疑,上述成就的取得离不开生态伙伴的积极合作与贡献。
以编译器为例,何虎介绍说:“乘影选择了将RISC-V向量扩展与SIMT架构结合的方式实现了GPGPU指令集架构。采用SIMT架构实现向量指令,编程灵活性上更高,编译器适用性更广。”
兆松科技主要为“乘影”GPGPU开发编译器。CTO伍华林指出,兆松科技完成了乘影GPGPU开源OpenCL编译器之后,还将继续推进乘影GPGPU的AI编译器的开源工作,解决AI模型到芯片端到端快速部署和适配度效率的问题。
在取得上述成效之后,何虎还提及乘影半年开发计划重心,将围绕64位硬件和软件工具链开发、SV39 MMU开发、Vulkan支持以及FPGA原型验证系统实现等方面持续推进。
据了解,后续“乘影”GPGPU将与电子四院合作,启动GPGPU指令集架构标准化工作。同时利用清华大学教育基金会的平台进行开源,让更多的生态伙伴能够加入进来,以“共有、共建、共享”为宗旨,为中国的GPGPU大芯片技术的夯实和应用的腾飞打下坚实的基础。
还要看到的是,完整的软件工具链需要庞大的资金投入和人才团队支撑,产业多方的合作才能久久为功。正如清华大学集成电路学院院长吴华强的总结所言:“一个人走得快,一起走才走得远!乘影GPGPU代表了清华大学集成电路学院在这一个领域的最新研究成果,我们开发乘影GPGPU的宗旨是:共有、共建、共享,其目的不仅仅是为了防止卡脖子,还为了把整个GPGPU上下游的生态聚集在一起,避免重复造轮子,形成合力,让每个参与者实现共赢!”