华南理工大学邹毅教授课题组在ICCAD会议发表论文

来源:华南理工大学微电子学院 #华南理工大学#
723

近日,华南理工大学学院智能存储与计算研究团队(PI:邹毅教授)博士研究生郝英博与香港科技大学硕士研究生陈煌栩作为共同第一作者,在德国慕尼黑 ACM/IEEE 2025年度国际计算机辅助设计会议(International Conference on Computer-Aided Design,即ICCAD,CCF-A, h5指数66),宣读题目为“OA-LAMA: An Outlier-Adaptive LLM inference Accelerator with Memory-Aligned Mixed-Precision Group Quantization”的论文。

Introuduction

研究团队提出软硬件协同设计框架,研发出具备内存对齐混合精度分组量化特性的异常值自适应LLM推理加速器OA-LAMA。该框架包含三大创新:第一提出支持异常值重排序技术的内存对齐混合精度分组(OAMAG)格式,在保持DRAM对齐内存访问的同时确保精度;第二提出分布感知分组分配策略,解决层间异常值比例差异问题;第三设计出具有三级累加架构和时序平衡处理单元的OA-LAMA硬件架构,可高效支持OAMAG格式。评估表明,OA-LAMA在实现优于现有4位量化方法精度的同时,相比主流LLM加速器可获得1.21-3.09倍的性能提升和1.35-2.47倍的能效增益,为LLM推理的精度-效率协同优化建立了新的标准。

该工作是基于郝英博与陈煌栩同学在2025年ACM/IEEE 第62届自动化设计会议(Design Automation Conference,即DAC,h5指数77)发表的论文工作的延续和扩展。这也是继邹毅教授博士研究生杨延锋在ACM/IEEE DATE 2025(h5指数60)上发表论文后的又一重要成果,意味着团队在今年集成电路设计自动化领域三大顶会(DATE、DAC、ICCAD)均取得成果。

郝英博与陈煌栩同学均是学院24届本科毕业生,他们在本科阶段打下的良好学术基础为其深造阶段成果创新提供了有力保障。

责编: 集小微
来源:华南理工大学微电子学院 #华南理工大学#
THE END
关闭
加载

PDF 加载中...