1.电子科技大学集成电路学院张波、明鑫教授团队在激光雷达GaN驱动芯片领域取得系列突破;
2.华中科技大学集成电路学院李学飞/缪向水团队实现P型单层二硒化钨晶体管突破;
3.华中科技大学集成电路学院杨蕊/缪向水教授团队在光子概率计算领域取得新成果;
4.复旦大学全国重实验室4篇论文被体系结构顶会 ISCA录用
1.电子科技大学集成电路学院张波、明鑫教授团队在激光雷达GaN驱动芯片领域取得系列突破
激光雷达(LiDAR)正加速赋能高级驾驶辅助系统、机器人导航及无人机测绘等高精度三维感知要求极高的场景。传统Si基功率器件面临明显瓶颈,而基于GaN的激光二极管驱动器(LDD)能够充分发挥高开关速度优势,为高分辨率、远探测距离LiDAR系统提供关键支撑。
近期,集成电路学院张波教授领衔的功率集成技术实验室明鑫教授课题组长期专注于高速MHz单通道GaN驱动器设计,在领域国际权威期刊和顶级会议发表多篇论文。相关工作得到国家重点研发计划项目、国家自然科学基金、广东基础与应用基础研究项目的支持,并与企业合作实现成果转化,支撑相关公司推出高速GaN驱动量产芯片。
序号、论文名称、发表权威期刊/会议
1、A Monolithic GaN Driver With Power-Rail Charging Saturation Bootstrap Technique Achieving Enhanced Slew Rate and Gate Rise/Fall Time Ratio of 1.28、IEEE
JSSC
2、A Monolithic GaN Laser Diode Driver with Steep Edge Driving Current for LiDAR Transmitters Using a 3× Self-Circulating Charge Pump、IEEE TPE
3、Monolithic FET-Controlled GaN Driver with Pre-Boosting and Robust Dead Time Control for DToF LiDAR Application、IEEE ISPSD
4、An Integrated Low-power Enhanced Pull-up GaN Driver Using SenseHEMT for Reliable and Fast Short-Circuit Protection
5、A Monolithic GaN IC with Temperature Compensated Active Clamp Driver and Short-Circuit Protection for Wide Power Supply Range
6、A High-Speed Dual-NMOSFETs Output Stage Buffer with Charge-Transferring Bootstrap Circuit for GaN-Based DToF LiDAR Application
一、“单片GaN集成”方案:从根源抑制寄生效应
高频(MHz级)窄脉宽(ns级)工作时,栅极驱动环路的寄生电感LG会限制MCTRL开关速度,引发栅压振铃,导致误开启或过压风险。为解决这一根本问题,团队探索将预驱动和MCTRL单片集成的全新路径。
论文1: 电源轨充电饱和自举技术(PCSB)
提出嵌入式交叉耦合电荷泵(ECCP)+3VDD偏置级,显著提升栅极压摆率;集成过流保护电路,采用自动调零技术将GaN比较器失调电压降低20倍以上。栅极上升/下降时间比仅1.28,短路保护响应时间43ns。通讯作者为明鑫教授,第一作者为秦尧博士。
论文2:3X自循环电荷泵技术(3X SCCP)
利用扇出结构,有效打破功耗与上拉能力之间的设计瓶颈,采用晶圆级芯片封装,在20MHz开关频率,10A驱动输出电流条件下,实现435ps上升时间和259ps下降时间。通讯作者为明鑫教授,第一作者为博士生庄春旺。
论文3:预自举和稳健死区时间插入技术(PBRD)
利用信号链传输延时预先抬升驱动级自举电压,在不增加功耗前提下进一步提高驱动能力。在20MHz开关频率、10A驱动输出电流下,测得上升时间为319ps,下降时间为406ps。该技术由博士生庄春旺在ISPSD 2023上做口头报告,通讯作者为明鑫教授。
论文4:低功耗增强上拉技术(LPEP)
将充电电流Ichar路径和损耗电流Ileak路径解耦,在较小的Ileak下,实现大的充电电流Ichar。20MHz开关频率、10A驱动输出电流下,开启时间为710ps,关断时间为660ps,单级反相器静态损耗电流仅为28µA。该技术由博士生庄春旺在ISPSD 2024上做口头报告,通讯作者为明鑫教授。
论文5:温度补偿有源钳位技术(TCAC)
提出无电荷泵型GaN基驱动方案,摒弃常规电荷泵驱动所需的大面积自举电容,显著缩减芯片面积并实现超低传输延时(1.62ns);且能可靠的工作在低频工况。该技术由博士生陆毅在ISPSD 2025上做口头报告,通讯作者为明鑫教授。

(a)

(b)

(c)

(d)

(e)

(f)
图 1(a) 电源轨充电饱和自举技术 (b) 3X自循环电荷泵技术 (c) 预自举和稳健死区时间插入技术 (d) 低功耗增强上拉技术 (e) 温度补偿有源钳位技术 (f)高速GaN驱动测试波形
二、“Si基预驱动+GaN基MCTRL”方案
论文6 提出具有电荷转移自举(CTB)电路的双NMOSFET输出缓冲器。通过小电容Ccharge和电源轨VDD协同为自举电容Cboot1补充因电荷分享造成的电荷损失,在不额外增加电源轨的情况下,增强预驱动器驱动能力,减小自举电容面积。在100pF负载电容下,实现50MHz开关频率,0.9ns最小输出脉宽,2.41ns和2.56ns开启和关断延时,栅压上升/下降时间分别为323ps和333ps。该技术由秦尧博士在ISPSD 2024上展示,通讯作者为明鑫教授。



图 SEQ图 * ARABIC2具有电荷转移自举电路的双NMOSFET输出缓冲器
(来源:电子科技大学)
2.华中科技大学集成电路学院李学飞/缪向水团队实现P型单层二硒化钨晶体管突破

研究背景
硅互补金属氧化物半导体(CMOS)技术将在亚3纳米工艺节点达到其性能极限。二维(2D)半导体过渡金属二硫属化物(TMDs)因其无悬空键表面、单原子层厚度下的高载流子迁移率以及对短沟道效应的静电控制免疫特性,成为后硅时代的潜在沟道材料。为实现2D半导体材料在CMOS技术中的进一步缩放,需要同时具备N型和P型高性能金属氧化物半导体场效应晶体管(MOSFETs)。目前,虽然N型二维场效应晶体管(例如单层二硫化钼)方面已取得显著进展,但P型二维场效应晶体管的电学性能远未达到预期,极大地制约了二维CMOS电路的发展。
成果简介
华中科技大学国家脉冲强磁场科学中心/集成电路学院李学飞/缪向水等联合意大利比萨大学Gianluca Fiori提出了一种原子尺度可调氧掺杂p型方法,该技术能够提高单层WSe2的场效应迁移率和开态电流。室温条件下,单层氧掺杂WSe2(O2-WSe2)的场效应空穴迁移率(μFE)高达137 cm2V-1s-1,约为初始WSe2的三倍。同时,P型O2-WSe2晶体管实现了约49 meV的低SBH和约560 Ω·μm的低接触电阻。45 nm短沟道单层O2-WSe2 pFET实现了1245 μA/μm的高开态电流(Ion),性能优于对应nFET器件。
在器件基础特性研究中,研究人员首先比较了不同金属与两种衬底上生长的WSe2的输运特性。结果表明:Ni接触的转移到100 nm SiO2栅极介质上的单层WSe2场效应晶体管呈现N型输运特性,开关比高达108,场效应电子迁移率为5.8 cm2/V·s(图1a,b)。低功函数和高功函数金属均与转移的单层WSe2导带附近对齐,导致单调的N型电学特性(图1c)。另外,Pt接触的直接生长的单层WSe2场效应晶体管呈现P型输运及约108的高开关比,场效应空穴迁移率为45.2 cm2/V·s(图1d,e)。图1f展示了接触金属与直接生长在SiO2上的单层WSe2钉扎位置的能带示意图,生长在蓝宝石和SiO2/Si衬底上的单层WSe2表现出相反的传输类型。基于此,研究人员成功构建了基于单层WSe₂的CMOS反相器,为二维互补逻辑电路奠定了基础。

图1. 单层WSe2 nFETs和pFETs。Ni接触单层WSe2 FET的转移特性(a)与输出特性(b),单层WSe2在蓝宝石衬底上生长,随后转移至100 nm SiO2/Si衬底上;(c、f)示意图展示了从蓝宝石衬底转移至SiO2/Si衬底上的单层WSe2以及在SiO2/Si衬底上直接生长的单层 WSe2与接触金属在不同功函数下的钉扎位置;SiO2/Si衬底上直接生长的单层WSe2 FET的转移特性(d)和输出特性(e)。
进一步,研究团队通过低温光致发光(PL)测量来研究两种单层WSe2材料中的缺陷态。当温度降至20 K时,两种样品的自由激子峰均蓝移并在较低能量处出现宽峰,且峰强度随温度降低而增强,该现象归因于缺陷束缚激子。为深入理解WSe2中的激子态,我们在3.4 K下进行了变栅压的PL测量,对于转移WSe2样品,随着栅极电压(Vgs)从0 V升至20 V(更多电子掺入WSe2),由于库仑屏蔽效应导致XA-峰发生红移,表明样品最初呈N型掺杂状态(图2a)。当Vgs从0 V降至-20 V时,直接生长的WSe2样品XA+峰表现出相似的变化趋势,表明样品在Vgs = 0时处于P型掺杂状态(图2b)。此外,转移WSe2样品的缺陷束缚激子峰占比高于直接生长样品,表明其缺陷态密度更高(图2d)。

图2. 3.4 K下单层WSe2的栅压依赖性光致发光。转移的WSe2从蓝宝石转移(a)及直接生长的WSe2(b)在3.4 K不同栅极电压(Vgs)下的PL光谱;(c)带电激子与中性激子峰强度随栅极电压的变化;(d)束缚激子PL强度积分(IB/(IB+IF))百分比随Vgs的变化;(e)峰位置EB1与EB2随Vgs的变化关系;(f)示意图展示两种样品中束缚激子的不同来源。
为降低单层WSe2中的缺陷密度,研究团队提出了一种可调且与半导体工业兼容的氧掺杂方法。O2-WSe2样品中缺陷峰强度的显著降低证实了氧退火后单层WSe2中缺陷密度的降低(图3a)。O2-WSe2 pFET(沟长2 μm)在-2 V源极电压下实现1010的超高开关比,室温下场效应迁移率为137 cm2/V·s,迁移率统计分布显示O2退火后晶体管迁移率是不退火的三倍(图3b,c,d),O2-WSe2中较高的空穴迁移率主要归因于氧掺杂对Se空位的有效钝化及WSe2薄膜缺陷密度的降低。采用传输线法(TLM)结构提取接触电阻Rc发现,不退火WSe2的Rc值为2.4 kΩ·μm,O2-WSe2 pFET的Rc可降至0.56 kΩ·μm(图3e)。O2-WSe2 pFET肖特基势垒高度为49 meV,显著低于不退火WSe2器件的155 meV(图3f)。

图3. O2退火前后SiO2上的单层WSe2光致发光和电学表征。(a)直接生长的单层WSe2在3.4 K下经O2退火与未退火处理后的PL光谱;单层WSe2器件在430 mTorr O2环境中退火后的转移特性(b)与输出特性(c);(d)单层WSe2在430 mTorr O2退火前后空穴场效应迁移率的统计分布;(e)单层WSe2 pFETs在430 mTorr下O2退火前后的TLM电阻;(f)Rc随SBH的变化关系。
为了从理论层面解释实验结果,研究团队进一步采用Quantum Espresso进行了密度泛函理论(DFT)计算,研究发现VSe-WSe2会产生缺陷态,该缺陷态在O2钝化后消失,与前述实验结果一致。PDOS 显示,在O-WSe2和O2-WSe2结构中,价带顶部附近出现特定态峰,其中O2-WSe2结构中该现象更为显著,可能对应实验观测到的P型掺杂特征(图4)。我们还研究了不同 VSe 浓度的影响,以理解实验中观察到的不同(N 型或 P型)行为。较小的 ∆E对应N 型行为,而较大的 ∆E则对应P型行为。在图 4f 中,我们可以清楚地看到,随着缺陷密度的增加,∆E减小,导致体系从P 型(无缺陷或低浓度 Se 空位)转变为 N型行为,无论是否考虑自旋-轨道耦合(SOC)都是如此。

图4. 初始、有硒空位的、少量氧钝化、适量氧钝化的单层WSe2第一性原理模拟。a. 4×4超晶胞晶体结构:原始WSe2(左上图)、单个Se空位(右上图)、O钝化Se空位(左下图)、O2钝化Se空位(右下图);(b-e):未考虑自旋轨道耦合(SOC)时的能带结构及投影态密度(PDOS),原始WSe2(b)、单个Se空位(c)、O钝化Se空位(d)、O2钝化Se空位(e);(f)最小未占据缺陷态与费米能级间能量差∆E随Se空位浓度的变化关系(考虑SOC与不考虑SOC两种情况)。
为展示单层O2-WSe2晶体管的性能潜力,研究团队采用15 nm SiO2作为栅介质进行了沟道长度微缩方面的研究。我们发现,45 nm沟长的器件在Vds = -0.1 V时具有接近109的优异开关比(图5a),在Vgs = -9 V、Vds = -1.2 V条件下开态电流(Ion)高达1245 µA / µm,且未观察到高场输运区的自热效应(图5c)。与其他P型掺杂方法相比,我们通过标准CMOS兼容的工艺将晶体管的开关比、迁移率、接触电阻、开态电流都提升到了新的高度,单层WSe2 pFET的Ion值在类似工艺节点下高于P型Si晶体管,并满足高性能逻辑晶体管2028路线图目标(图5d,e,f)。这些结果表明,氧掺杂是实现高性能WSe2 pFET的有效可靠方法。

图5. 短沟道单层WSe2 pFETs器件表征。(a)300 K温度下,沟道长度分别为45 nm和500 nm的WSe2器件的转移特性曲线;(b、c)(a)图所示Lch为500 nm和45 nm的WSe2 pFET对应输出特性曲线;(d)文献报道的CVD单层WSe2晶体管的开关比与空穴迁移率总结;室温下CVD单层p型WSe2晶体管的接触电阻Rc(e)与开态电流Ion(f)基准数据。
总结展望
该研究表明,低温氧掺杂技术不仅能够有效钝化二维半导体中的缺陷态,还能够显著提升 p 型器件的载流子输运性能与接触质量,为构建高性能二维 CMOS 电路提供了关键技术路径。值得关注的是,研究团队还在 MoTe₂ 等其他二维材料体系中验证了该方法的普适性,说明氧掺杂有望发展成为二维半导体通用型 p 型调控技术。未来,随着二维材料大面积可控制备、低接触电阻工程以及器件集成工艺的持续发展,基于二维半导体的新型逻辑器件有望在后硅时代低功耗芯片领域发挥重要作用。
华中科技大学集成电路学院博士研究生孙蕾与博士后高婷婷为该工作的共同第一作者。华中科技大学国家脉冲强磁场科学中心/集成电路学院李学飞副研究员/缪向水教授和比萨大学Gianluca Fiori教授为该工作的共同通讯作者。合作者还包括华中科技大学李靖教授、何毓辉教授及南京理工大学张胜利教授。本研究工作得到了国家重点研究计划、国家自然科学基金和国家集成电路产教融合创新平台的支持。(来源:HUST集成电路学院)
3.华中科技大学集成电路学院杨蕊/缪向水教授团队在光子概率计算领域取得新成果
近日,国际期刊《Nature Communications》在线刊发了我校集成电路学院杨蕊/缪向水教授关于光子概率计算的最新研究成果“Compact photonic spiking neuron with inherent stochasticity based on phase-change material for probabilistic computing” 我院杨蕊教授、缪向水教授为通讯作者。我院2022级博士生董云潇、2025级博士生王天赐为共同第一作者。华中科技大学集成电路学院为论文第一完成单位。

光子神经网络(PNN)具有超快速度、大带宽、低功耗和并行处理的优势,成为一种新兴的计算范式。然而,现有光子神经元大多面临着尺寸大、光学响应弱的问题,且通常用于执行确定性计算。相比之下,生物神经元因离子通道随机开启而具有内在随机性,支持概率计算和不确定性量化。目前光子概率计算通常依赖额外熵源,增加了系统复杂度。为解决这一难题,我院缪向水/杨蕊教授团队在国际上首次研制出一种基于新型相变材料的紧凑型片上光子脉冲神经元,该工作突破了传统光子概率硬件设计的局限,为开发大规模、低复杂度的光子概率计算系统提供了具有本征随机性的紧凑神经元。

研究团队在硅基波导上异质集成相变材料SbTe9,成功研制出一种新型光子脉冲神经元器件。SbTe9相变材料在外加激励时发生固-液相变,激励撤去后自发发生液-固相变,这一过程中相变材料的消光系数发生变化,实现了对波导中光信号的调制。团队利用该材料在相变过程中微观结构的随机演化动力学过程,赋予器件天然的概率发放特性.该光子神经元的核心调制面积仅为 1.5 μm² ,同时展现出 2 dB μm⁻¹ 的出色光学调制能力。
这种具备内在随机性的光子神经元为光子神经网络系统提供了有效的不确定性量化能力与抗干扰优势。在乳腺癌细胞的医疗诊断任务中,基于该器件构建的概率脉冲神经网络(P-SNN)实现了高精度的预测(98.67%),同时通过预测熵有效量化诊断结果的不确定性。将光子相变突触与神经元集成后,系统表现出良好的鲁棒性:在面对不可避免的突触编程误差时,系统准确率仅下降0.47%,约为确定性神经元的十分之一;在 15% 的输入噪声干扰下,识别准确率下降幅度为4.28%,显著低于确定性神经元的 10.1%。该工作为高集成密度、高鲁棒性的片上光子集成电路发展建立了一种全新的范式。
研究工作得到了国家自然科学基金、湖北省杰出青年基金等项目的资助。

团队介绍:
集成电路学院缪向水教授团队长期从事三维相变存储器、忆阻器、类脑智能计算与逻辑运算等信息存储材料及器件方向的研究。2018年出版了国内第一本忆阻器专著《忆阻器导论》;2019年团队将93项三维相变存储器芯片专利许可给国内存储器龙头并合作开发产品,并与行业龙头企业合作建立了联合实验室,推动存储器芯片技术成果转化和未来引领技术探索。杨蕊教授长期致力忆阻器及类脑计算方面的研究。针对相变光子忆阻器循环寿命短状态数少的问题,创新性地提出了新型沟槽电加热器结构,将相变光子忆阻器的循环寿命提升到>3万次 (Laser Photonics Rev. 2024, 18, 2300722),结合相变材料结晶动力学过程精确调控,器件可调状态数提升至>7 bits(ACS Photonics 2024,11,723),研制出具有脉冲时序相关可塑性的光子突触器件(Laser Photonics Rev. 2025, 19, e00840)。同时,发明了多功能集成的高仿生忆阻型神经元,包括柔性跨模态感知神经元(CSSN)(Nat. Commun. 2024, 15, 7275),Hodgkin-Huxley (HH) 神经元(Adv. Mater. 2019, 31, 1803849,封面论文),簇发放leaky integrate-and-fire ( LIF) 神经元(IEEE T. Electron Dev. 2023,70,1374)等忆阻神经元。
论文链接:https://www.nature.com/articles/s41467-026-73070-8
4.复旦大学全国重实验室4篇论文被体系结构顶会 ISCA录用
近日,复旦大学集成芯片与系统全国重点实验室有4篇论文被ISCA 2026会议接收录用,研究主题涵盖智能感知/计算/存储、异质异构集成等方向,展现了全国重实验室在高性能芯片体系结构前沿领域的持续创新能力。
ISCA(International Symposium on Computer Architecture)是计算机体系结构领域的顶级国际会议,汇聚全球最前沿的处理器、存储和加速器设计研究成果。自1973年创办以来,ISCA长期代表着全球计算机体系结构研究的最高学术水平,被广泛视为该领域的旗舰会议。ISCA 2026会议的录用率约为19%,预计将于2026年6月27日至7月1日在美国召开。
1.NS-FPS: Accelerating Farthest Point Sampling via Neighbor Search in Large-Scale Point Clouds
针对自动驾驶等场景中大规模点云处理的性能瓶颈,该研究提出了一种基于邻域搜索的最远点采样加速方法 NS-FPS。该方法结合维诺图几何特性,充分利用采样过程的空间局部性,将传统最远点采样(FPS)转化为迭代邻域搜索问题,从理论上将算法复杂度从O(N2)降至O(NlogN)。同时,本文设计了融合莫顿码空间划分、流水线邻域搜索引擎与分层最大值缓存的专用 ASIC 加速架构,构建了软硬件协同优化的大规模点云采样加速框架。在此基础上,NS-FPS 可无缝集成至 PointNet++、PointRCNN 等主流点云神经网络,为 3D 目标检测、语义分割等任务提供高效采样支撑。实验结果表明,与 GPU 实现相比,NS-FPS 在大幅降低内存访问量的同时实现 81.6 倍加速;与现有先进点云采样加速器相比,性能提升 2.9 倍、内存访问量降低 13.4 倍,在大规模点云实时处理场景中兼具高效率与高扩展性。
该论文的第一作者为博士生郑佳培和杨树安,通讯作者为陈迟晓副研究员。

NS-FPS硬件架构
2.TDMSim: Enabling High-Density and Energy-Efficient GPU DRAM Caches with 2D-Materials for Data-Intensive Applications
针对新一代人工智能技术对存储容量的急速增长需求,以及传统硅基缓存中存储密度、访问延迟与能耗之间的矛盾,该研究提出了国际上首个面向二维材料缓存的体系结构仿真工具及架构优化方法。首先,针对新型半导体材料缺乏体系结构仿真工具、器件特性难以系统映射至架构优化的问题,该工作开发了一套跨层仿真工具,实现了晶体管级、电路级和系统级的统一建模与分析。基于这套工具,团队进行了多目标设计空间探索,评估各类缓存作为GPU末级缓存的性能潜力,并首次将二维材料DRAM缓存集成至现代CPU-GPU异构计算系统中。其次,针对存储单元在规模集成下表现出的非均一性问题,该工作提出了一种保持时间感知的管理策略,包括刷新调度、循环缓存块布局和热页重映射等,有效延长了刷新时间并优化了缓存访问。实验结果表明,在真实GPU应用负载下,该DRAM缓存相较传统SRAM缓存可实现79.4%的能耗降低与42.1%的性能提升。这将为突破传统缓存架构的性能与能效瓶颈提供新的技术路径。
该论文的第一作者为傅超青年副研究员(绍芯实验室)和硕士生郑靖炀,通讯作者为韩军教授。该论文也是与二维材料与器件领域的交叉研究成果,论文作者还包括周鹏教授、包文中教授。

跨层仿真工具链及体系结构优化示意图
3.GauTracer: Extending Ray Tracing Accelerator for Gaussian-based Scene Representation
针对当前图形GPU架构中光线追踪加速器(RTA)缺乏对高斯图元原生硬件支持的问题,该研究提出了一种面向高斯场景表示的光线追踪加速器GauTracer。近年来,高斯泼溅技术(GS)凭借显式点云和可训练参数,实现了高保真场景建模与实时渲染。然而,由于传统光线追踪加速器专为三角网格设计,将GS管线集成到光线追踪管线时面临严峻挑战:高斯图元在现有RTA架构中只能依赖软件着色器模拟,由此产生了大量冗余指令与全局内存访问开销。为此,研究团队提出将高斯图元提升为RTA中的一等公民。在硬件架构层面,设计了轻量级微架构扩展和专用光线-高斯求交单元(RGIU),支持3D椭球体和2D椭圆片两种主流表示,通过重构计算数据流实现硬件资源共享。进一步提出基于最大堆的高斯命中单元(AGHU),在寄存器中维护每光线命中缓冲,实现高效的体渲染混合。在遍历优化层面,采用基于树块的BVH遍历方案并引入远节点剪枝机制,有效减少超出缓冲容量的冗余节点访问。实验结果表明,GauTracer相比基线方案,对3D高斯和2D高斯场景分别实现了平均5.8倍和7.3倍的性能提升。该工作通过将高斯图元原生集成到光线追踪加速器中,为高斯场景表示在AR/VR等高级图形应用中的高效部署提供了可行路径。
该论文的第一作者为博士生吴立舟,通讯作者为朱浩哲助理教授。

GauTracer支持高斯图元的光线追踪架构图
4.LoRA: Towards Improved Applicability of Reconfigurable Architecture for Versatile Nonlinear Functions
针对人工智能等新兴应用中大量涌现的复杂非线性函数,本文提出了一种基于切比雪夫多项式的非线性函数近似方法。该方法能充分利用目标函数的代数特性(如奇偶性),为给定非线性函数推导出高精度近似多项式。同时,本文设计了一种基于对数运算系统的计算单元(XCore),将高次幂运算转换至对数域,有效降低了高次多项式计算的硬件开销。在此基础上,本文将上述近似方法集成至粗粒度可重构架构(Coarse-grained Reconfigurable Architecture,CGRA)软件工具链,并将XCore单元嵌入CGRA阵列,构建了支持多种非线性函数的可重构架构研究框架LoRA。实验结果表明,与现有先进非线性函数计算单元相比,XCore在实现更高计算精度的同时,能在图像处理、大模型等应用中提供充分的精度保障,且开销更小;与商用MCU和前沿CGRA研究相比,LoRA CGRA的性能分别提升了23.33倍和2.18倍,能效则较前沿CGRA研究提升了2.13倍。
该论文的第一作者为博士生戴源和硕士生邹桂镔,通讯作者为王伶俐教授。

LoRA框架流程图
集成芯片与系统全国重点实验室
集成芯片与系统全国重点实验室是科技部遴选的首批20个标杆全国重点实验室之一,依托复旦大学建设,刘明院士任实验室主任。实验室围绕“集成芯片与系统应用”等任务,下设集成芯片、EDA、IP/架构、超高速电路与系统和未来芯片5个创新中心。
(来源:集成芯片与系统全国重点实验室)