• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
集微视频
登录登录
bg_img
search_logo
大家都在搜

科大讯飞:星火大模型单次训练成本和DeepSeek V3在一个层次

作者: 黄仁贵 02-14 10:35
相关舆情 AI解读 生成海报
来源:爱集微 #科大讯飞#
1.6w

近日,科大讯飞在接受机构调研时表示,训练成本是讯飞星火大模型的竞争优势,单次训练成本和DeepSeek V3在一个层次,而且后面优化路径也很明确,目前以昇腾910B为代表的国产硬件还不支持FP8精度训练以及DualPipe的实现,随着国产算力在底层能力上进一步提升,讯飞星火的训练成本还有较大的下降空间。

基于此前在评语模型、强化学习方面的积累,科大讯飞在2024年10月就实现了蒙特卡洛树搜索(MCTS)等算法创新并跑通了深度推理模型训练算法,因为只能使用国产算力,额外花费2个月完成华为昇腾910B算力的适配和优化并大幅提升训练效率(训练效率相比A100从55%提升到85%),于今年1月15日完成了星火深度推理模型X1的训练和发布。

虽然当前X1模型很小(仅130亿参数),但依靠科大讯飞算法和数据优势,星火X1已达到可以和OpenAI o1-preview对标的水平;科大讯飞表示,随着国产算力的逐步到位,模型参数增加后,公司完全有信心实现数学答题和过程思维链能力全面对标甚至超过OpenAI o1。

责编: 邓文标
来源:爱集微 #科大讯飞#
分享至:
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

相关推荐
  • 科大讯飞斥资7000万元在湖北成立两家人工智能公司

  • 科大讯飞2024年营收233.43亿元,净利润同比下降14.78%

  • 国产大模型:既需向上突破也要向下扎根

  • 刘庆峰:科大讯飞将做全栈自主可控的大模型国家队

  • 总投资4.5亿元,中颖电子第二总部基地正式启用

  • 讯飞医疗:AI技术领域持续突破 “一体两翼”框架迭代演进

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
黄仁贵

微信:ren378087210

邮箱:huangrg@ijiwei.com

邀您一起关注汽车电子,关注智驾未来!


6112文章总数
26.4w总浏览量
最近发布
  • 中国重汽:重汽国际公司已连续20年保持出口量第一

    3小时前

  • 蔚来ET9于4月上险量达835辆,超同级宝马7系、奥迪A8L

    3小时前

  • 传丰田汽车欲收购哪吒汽车,加速电动化进程

    05-12 11:50

  • 中国汽研:华东总部基地将在年底投入试运行

    05-12 11:13

  • 乘联分会:4月零售汽车175.5万辆,同比增长14.5%

    05-12 10:54

最新资讯
  • 英唐智控:车载显示芯片获境内外多个项目定点

    5分钟前

  • 雅化集团子公司与Core公司终止锂精矿承购协议

    6分钟前

  • 理想汽车辟谣6月裁员传闻:称消息不实

    7分钟前

  • 捷顺科技中标重庆公租房车位运营项目,总金额将超过1亿元

    1小时前

  • 鸿富瀚加速海外布局,拟在泰国成立散热模组组装基地

    1小时前

  • 茂莱光学:募投项目预计6月全面结项,交付能力将显著提升

    1小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号