北京大学:杨玉超教授团队研制全球首款基于可控存内计算的忆阻器神经动力学芯片

来源:北京大学 #神经芯片# #忆阻器# #北京大学#
1598

近日,新基石研究员、北京大学集成电路学院杨玉超教授团队在新型神经动力学计算芯片领域取得重大突破。

团队成功研制出全球首个基于相变忆阻器的毫秒级神经动力学系统芯片,突破了相变型忆阻器长期面临的“可控存内计算”世界级难题,首次将神经动力学系统的单步运算时延压缩至2.12毫秒。神经动力学系统将神经网络的表达能力与微分方程的连续演化机制相结合,在物理世界建模、计算成像等领域具有广泛用途,自神经动力学系统诞生半个世纪以来,如何在保持高精度连续建模能力的同时实现低延迟实时计算,始终是制约该类系统走向实际应用的核心瓶颈。针对这一问题,团队提出了基于相变型忆阻器的“可控存内计算”新范式,通过调控相变存储器电导漂移与多级电导特性,构建出精准可控的原位存内计算机制,系统性地融合器件物理特性与神经动力学算法,实现了自适应积分步长的原位搜索以及多级电导的存内乘累加计算芯片设计。该方案显著减少了传统数字硬件中频繁的读写、乘法运算、缓存访问与数据搬运等高开销操作,兼具高精度与实时性,为后摩尔时代计算芯片提供了一种全新范式。

相关实验结果表明,在执行相同神经动力学运算时,该系统较当前最先进的专用加速器(ASIC)实现3.82×~36.27×倍速度提升,功耗仅为其1/24.73~1/11.75;在脑皮层表面重建等高保真脑建模任务中,较NVIDIA A100 GPU提速达50.38×~478.18×。这一成果标志着在神经动力学系统实时计算方面取得关键突破,它不仅将原本需要离线运行的复杂建模方法推向毫秒级实时在线操作,也为下一代脑机接口、脑数字孪生、神经导航和神经退行性疾病智能诊疗提供了全新的硬件底座。

图1 基于相变型忆阻器的毫秒级神经动力学系统

脑是自然界最复杂的动力学系统之一。脑机接口要实时解析神经状态,医学影像要高精度重建脑皮层,都依赖对连续神经形态和动态过程的快速建模。神经动力学系统将神经网络的表达能力与微分方程的连续演化机制结合起来,能够从带噪声、不完整的影像数据中恢复平滑、拓扑一致的三维脑结构。但其求解过程需要反复积分、误差控制和自适应步长搜索,计算量巨大,并且在传统冯·诺依曼计算架构中存储与计算分离,神经动力学系统中间变量需要在存储器与处理器之间频繁搬运,进一步放大了延迟和能耗,成为实时高保真脑建模的核心瓶颈。

面对这一难题,杨玉超研究团队从忆阻器器件物理出发,提出了一条以“可控存内计算”为核心的融合创新路线,实现存算一体芯片领域重大突破。相变存储器具有连续电导演化和多级电导调控能力,其电导状态不仅可以被精细编程,而且能够在特定时间窗口内呈现可预测、可映射、可调控的动态变化。团队抓住这一物理特性,将其与神经动力学系统中的自适应积分过程建立对应关系,使器件本身的电导演化不再只是存储状态的变化,而成为可被精确利用的原位计算过程。

基于这一发现,团队提出细粒度可控电导演化机制,将有效积分步长直接编码为相变存储器的电导状态,并利用器件自身的物理演化完成自适应步长搜索。换言之,原本需要由数字电路反复计算、比较和判断的步长选择过程,被转化为阵列中的原位物理计算过程。这一设计突破了神经动力学系统半个世纪以来精度与延迟相互制衡的核心瓶颈,通过“可控存内计算”机制从根本上减少了读写、乘法器、加法器、缓存访问和数据搬运需求,使神经动力学系统的关键计算过程被压缩到毫秒级。

图2 细粒度可控电导漂移调控机制

与此同时,研究团队进一步利用相变存储器的多级电导调控能力,构建高密度存内计算阵列,将内嵌神经网络的权重存储和矩阵运算统一映射到器件阵列中。通过利用多电导态的精准写入校验机制,能够实现稳定、可控的多级权重存储,并在阵列内部直接完成神经网络推理。由此,自适应步长搜索和神经网络矩阵运算这两类原本依赖复杂数字电路的核心计算过程,被统一集成到相变忆阻器物理系统中,形成了从器件、算法到架构协同设计的可控存内计算新范式。

图3 多级电导特性精准映射调控机制

基于相变器件两种电导可控特性,采用40纳米工艺制造神经动力学芯片,存内计算与步长漂移阵列总面积仅0.28平方毫米,并配备编程脉冲生成电路、模数转换器等外围电路。芯片运行频率为50 MHz,单步积分仅需9级流水,最终实现2.12毫秒的神经动力学单次迭代计算时延,首次将神经动力学硬件系统运行时间推进到毫秒级时代。

图4 基于相变型忆阻器的神经动力学芯片性能

值得注意的是,研究团队将该芯片用于大脑白质与脑灰质皮层表面的实时重建以及三维流形网格生成。结果表明,该系统能够生成平滑、闭合、拓扑一致的脑皮层表面,准确刻画复杂皮层褶皱结构,并有效抑制传统神经网络方法中常见的自相交(Self Intersection)和非流形伪影。重建结果在对称表面平均距离(Average Symmetric Surface Distance)和豪斯多夫距离(Hausdorff Distance)等指标上均显示出优势,满足高保真脑结构建模要求。

图5 实时大脑皮层表面重建以及三维流形网格生成

这一突破对脑机接口具有重要启示。未来脑机接口不仅需要读取神经信号,更需要实时理解大脑状态、预测神经动力学演化,并根据反馈进行闭环调控。高保真脑建模能够以毫秒级速度运行,有望为脑机接口提供个体化、动态化、可解释的脑状态模型,使脑机系统从简单信号识别走向实时脑状态建模与智能交互。

在医学场景中,该技术也有望支撑脑数字孪生、术中神经导航、脑皮层实时重建和神经退行性疾病辅助诊断。对阿尔茨海默症、帕金森病等疾病而言,脑结构和脑功能的细微变化往往具有重要临床价值。该项研究在低功耗硬件上快速完成高保真脑建模,为脑疾病早筛、病程监测和个性化干预提供新的技术路径。

该研究得到新基石研究员项目、国家重点研发计划、国家自然科学基金、广东省存算一体芯片重点实验室、深圳市重点产业研发计划等支持。

责编: 集小微
来源:北京大学 #神经芯片# #忆阻器# #北京大学#
THE END
关闭
加载

PDF 加载中...