传国产AI芯片公司曦望完成股改,将赴港IPO

来源:爱集微 #曦望# #IPO# #AI芯片#
2382

近期,专注于全栈自研AI推理GPU杭州曦望芯科智能科技有限公司完成股改,更名为“浙江曦望智能科技股份有限公司”(简称“曦望”)。据智能纪元AGI,曦望内部已经启动赴港IPO上市流程,正进行财务法务审计和辅导工作。曦望有望与昆仑芯争夺第三家港股 GPU/AI 芯片上市公司名额。

4月20日,曦望宣布已完成新一轮超10亿元人民币融资。距离上一轮近10亿元的融资(2025年7月初)不到10个月时间。至此,曦望自2024年底从商汤大芯片部门分拆独立以来,累计已完成七轮融资,总融资额约40亿元,成为国内首家估值突破百亿元的纯推理GPU独角兽。

曦望在官方公告中指出,2026年被行业视为“AI智能体元年”。大模型从对话式交互进化为可思考、可执行的数字员工,推理算力需求呈现指数级增长。英伟达GTC 2026大会已明确,AI产业正全面迈入“推理落地、智能体普及”的新阶段,并将“每瓦Token吞吐量”定义为核心竞争力——这与曦望自创立之初的主攻方向高度一致。

曦望董事长徐冰表示:“AI算力基建的重心已彻底切换。2026年,AI推理计算需求将达到训练需求的4至5倍,推理算力租赁价格在半年内上涨了近40%。”目前公司已推进三代推理GPU迭代、数万颗GPU量产落地,实现了从芯片研发、产品量产到解决方案交付的完整闭环,并保持“芯片均实现一次性流片成功、流片后性能符合设计预期”的标准。

目前曦望团队规模已扩大至400人,研发人员占比超过80%,硕士及以上学历同样超过80%。核心团队来自英伟达、AMD、华为海思等头部芯片企业。

产品线方面,已量产的曦望S1和S2,以及即将量产的旗舰产品“启望S3”构成公司的三代芯片矩阵:

S1是面向云端及边缘端视觉推理专用芯片,主攻视频分析模型,累计出货超2万片;S2是7nm工艺的GPGPU,兼容英伟达CUDA生态,性能对标A100,实现指令集、IP架构、算子及编译器全自研;启望S3于2026年1月发布,是国内首款搭载LPDDR6(同时兼容LPDDR5X)的推理GPU。针对Agent推理需求,从AI Core到内存IO全链路重构,推理性能较S2提升5倍,目标将Token成本降低90%。

启望S3的核心突破,在于GEMM和Flash Attention(占大模型推理计算量90%以上)的利用率分别达到约99%和98%,标称算力几乎全部转化为有效吞吐。此外,S3原生支持FP4低精度推理,在DeepSeek V3/R1等主流模型上实现接近无损的FP4推理,吞吐量较FP16提升3至4倍。

曦望2026年将全力推进S3芯片的量产交付,并完成与国内外主流大模型、多模态模型及Agent框架的全面适配。同时,公司已规划下一代S4高性能推理GPU和S5安全可控推理GPU,并持续投入近存计算、光电共封等前沿技术。(校对/赵月)

责编: 李梅
来源:爱集微 #曦望# #IPO# #AI芯片#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...