上海交大集成电路学院义理林团队发布光领域垂直大模型Optics GPT,入选OFC PDP论文

来源:上海交通大学 #上海交大# #光通信# #义理林#
1297

近期,上海交通大学集成电路学院(信息与电子工程学院)义理林教授团队在光通信与光学领域取得重要突破,发布光领域垂直大模型Optics GPT。该成果论文以“Optics GPT: The First Vertically Pre-trained Foundation Model for Optics and Optical Communications”为题,入选OFC 2026 Post-Deadline Paper(PDP)。

研究背景

随着大语言模型在代码生成、数据分析、自动化控制等任务中展现出强大能力,光通信领域也开始探索将其应用于意图解析、告警分析、网络自治等场景。然而,通用大模型在光学领域的表现受限于领域知识不足、数据隐私风险以及部署成本高等问题。如何在保证安全性与专业性的前提下,实现真正具备光学“认知能力”的AI系统,成为亟需解决的关键技术难题。

核心创新

为解决上述问题,研究团队提出了Optics GPT,首次在通用基座模型基础上,通过三阶段渐进式认知训练,将光学知识深度内嵌于模型之中。为系统评估模型性能,团队同步构建了首个面向光学领域的综合性评测基准OptiEval。在测试中,Optics GPT(8B)在专业测试上取得了82.45分,超越GPT-4o(76.53)与DeepSeek-R1(671B)(78.52);在研究生入学考试中,以74.12分同样领先。这一结果表明:结构化、渐进式的领域知识注入,比单纯扩大参数规模更能带来本质性的专业能力提升,同时8B参数规模也使其具备了本地部署、安全可控的实用价值。

Optics GPT训练流程以及评测性能

在实验验证中,Optics GPT的三大应用成果展现了其从算法生成到系统管控的全面能力:在自动代码生成方面,模型根据自然语言指令自动生成可部署的DSP代码,在1600公里传输实验中,其生成的线性DSP性能与人工设计相当,而非线性算法更带来0.4 dB的性能增益,实现了真正的算法自动生成;在自主网络管理方面,模型在20种故障场景下实现100%的诊断准确率,显著优于通用大模型;在现网性能预测方面,模型预测链路的OSNR平均误差仅0.44 dB,与专用神经网络相当,证明其已内化物理规律,具备真实的工程推理能力。

Optics GPT在光通信算法生成、网络运维等场景的应用

该工作不仅为光通信系统提供了从“通用AI”走向“专业AI”的可行范式,也为未来智能光网络、自动化光通信研发、光学设计等方向奠定了坚实基础。团队所构建的OptiEval基准,也为光学AI领域的标准化评估提供了重要参考。

责编: 集小微
来源:上海交通大学 #上海交大# #光通信# #义理林#
THE END
关闭
加载

PDF 加载中...