上海交大集成电路学院义理林团队发布光领域垂直大模型Optics GPT，入选OFC PDP论文

作者：集小微 2小时前

来源：上海交通大学 #上海交大# #光通信# #义理林#

1297

近期，上海交通大学集成电路学院（信息与电子工程学院）义理林教授团队在光通信与光学领域取得重要突破，发布光领域垂直大模型Optics GPT。该成果论文以“Optics GPT: The First Vertically Pre-trained Foundation Model for Optics and Optical Communications”为题，入选OFC 2026 Post-Deadline Paper（PDP）。

研究背景

随着大语言模型在代码生成、数据分析、自动化控制等任务中展现出强大能力，光通信领域也开始探索将其应用于意图解析、告警分析、网络自治等场景。然而，通用大模型在光学领域的表现受限于领域知识不足、数据隐私风险以及部署成本高等问题。如何在保证安全性与专业性的前提下，实现真正具备光学“认知能力”的AI系统，成为亟需解决的关键技术难题。

核心创新

为解决上述问题，研究团队提出了Optics GPT，首次在通用基座模型基础上，通过三阶段渐进式认知训练，将光学知识深度内嵌于模型之中。为系统评估模型性能，团队同步构建了首个面向光学领域的综合性评测基准OptiEval。在测试中，Optics GPT（8B）在专业测试上取得了82.45分，超越GPT-4o（76.53）与DeepSeek-R1（671B）（78.52）；在研究生入学考试中，以74.12分同样领先。这一结果表明：结构化、渐进式的领域知识注入，比单纯扩大参数规模更能带来本质性的专业能力提升，同时8B参数规模也使其具备了本地部署、安全可控的实用价值。

Optics GPT训练流程以及评测性能

在实验验证中，Optics GPT的三大应用成果展现了其从算法生成到系统管控的全面能力：在自动代码生成方面，模型根据自然语言指令自动生成可部署的DSP代码，在1600公里传输实验中，其生成的线性DSP性能与人工设计相当，而非线性算法更带来0.4 dB的性能增益，实现了真正的算法自动生成；在自主网络管理方面，模型在20种故障场景下实现100%的诊断准确率，显著优于通用大模型；在现网性能预测方面，模型预测链路的OSNR平均误差仅0.44 dB，与专用神经网络相当，证明其已内化物理规律，具备真实的工程推理能力。