国产深度握手:摩尔线程全功能GPU获百度飞桨III级兼容性认证

来源:摩尔线程开发者 #摩尔线程# #百度飞桨#
1583

近日,摩尔线程旗舰级AI训推一体智算卡MTT S5000与百度飞桨(PaddlePaddle)深度学习平台成功完成III级兼容性测试。测试结果表明,双方在兼容性方面表现优异,系统整体运行稳定可靠。目前,Paddle-MUSA算子适配率已达91%,覆盖了深度学习训练与推理所需的主流算子,能够为大语言模型、OCR、图像分类、目标检测、图像分割、推荐系统等核心应用场景提供稳定的运行基础。

百度飞桨(PaddlePaddle)是百度研发的产业级开源深度学习平台,也是中国首个自主研发的深度学习框架,致力于降低深度学习技术的创新与应用门槛,产品支持从模型训练到多端部署的全流程开发,截至 2025 年底已凝聚超 2300万开发者,服务 76 万家企业。

本次适配工作全面覆盖PaddlePaddle主框架最新接口及算子注册体系,进一步增强了Paddle-Paddle-MUSAMUSA与飞桨主线开发版本的协同能力。

▼ 在工程效率方面:Paddle-MUSA已实现对PaddlePaddle最新联合编译模式的支持,开发者可在同一工程流程中完成主框架与MUSA后端的协同编译、安装与验证,显著降低构建成本,提升版本联调效率。

▼ 在技术架构方面:Paddle-MUSA建立了规则化适配机制,以轻量、可复用、可回放的规则替代传统大规模补丁或整文件覆盖方式,系统性地解决了MUSA算子库与CUDA生态接口间的差异化适配难题。该机制使PaddlePaddle主线版本升级时仅需维护必要的MUSA语义差异,无需携带大量上游源码副本,有效降低了代码合并冲突和回归风险。

基于上述能力,在本次PaddlePaddle最新版本适配过程中,整体适配周期已缩短至约2人天,极大提升了版本跟进效率和工程交付确定性。

目前,Paddle-MUSA已完成多类典型模型的适配与验证,部分代表性模型包括:

• 大语言模型与多模态模型:ERNIE-4.5、LLaMA、PaddleOCR-VL 等;

• OCR系列模型:PP-OCRv3、PP-OCRv4、PP-OCRv5等;

• 视觉分类模型:AlexNet、VGG11、ResNet18、ResNet50、PP-LCNet、PP-HGNetV2 等;

• 检测、分割与姿态估计模型:SOLOv2、OCRNet、DMNet、UNet、PP-TinyPose 等;

• 检索与识别模型:PP-ShiTuV2、MobileFaceNet 等;

• 推荐系统模型:DLRM、DeepFM 等。

从算子到框架,从训练到推理,Paddle-MUSA正持续拉近摩尔线程全功能GPU与飞桨开发者之间的距离。此次III级兼容性认证,既是国产算力与国产深度学习框架技术协同的又一次实质性突破,也为国内AI开发者提供了一个更加自主可控、高效稳定的开发选择。摩尔线程将继续深化与飞桨的合作,持续优化开发者体验,助力国产AI生态繁荣发展。

欢迎广大开发者下载体验Paddle-MUSA:

https://github.com/MooreThreads/paddle_musa

责编: 爱集微
来源:摩尔线程开发者 #摩尔线程# #百度飞桨#
THE END
关闭
加载

PDF 加载中...