根据美媒《The Information》周五 (4 日) 援引知情人是消息报导,Meta Platforms(META-US)计划于本月发布其最新的语言模型 Llama 4,尽管该模型已经至少两次推迟。这是 Meta 为在人工智慧 (AI) 竞赛中争夺领先地位所作的努力之一,但报导指出,Meta 可能会再次推迟 Llama 4 的发布。
随着 OpenAI 的 ChatGPT 大获成功,改变了科技领域的格局并推动机器学习的投资,全球大型科技公司在 AI 基础设施上积极投入。尽管如此,Llama 4 的开发并不一帆风顺。报导指出,Llama 4 在开发过程中未能达到 Meta 的技术基准,特别是在推理和数学任务上表现不佳。
此外,Meta 也担心 Llama 4 在进行类人语音对话方面的能力不及 OpenAI 的模型,这也是推迟的原因之一。该报导提到,Meta 正积极考虑如何提升 Llama 4 的能力,以便在 AI 竞争中不落人后。
在投资人的压力下,Meta 计划今年投入高达 650 亿美元扩展其 AI 基础设施,这一举措也是为了让大型科技公司能够显示其投资回报。而来自中国科技公司 DeepSeek 的低成本 AI 模型的崛起,也挑战了“开发最佳 AI 模型必须花费数十亿美元”的观念。
报导称,Llama 4 将会借鉴中国新创公司深度求索 (DeepSeek) 的一些技术,至少有一个版本预估会采用“专家混合”(Mixture of Experts)技术,这是一种让模型的不同部分专注于特定任务的机器学习方法,从而使这些部分在特定领域内成为专家。
此外,Meta 也考虑过先透过 Meta AI 发布 Llama 4,然后再将其作为开放原始码软体推出。去年的 Llama 3 模型可以说是 Meta 的一次突破,该模型不仅能够进行八种语言的对话,还能够编写更高品质的电脑程式并解决比以往更复杂的数学问题。
评论
文明上网理性发言,请遵守新闻评论服务协议
登录参与评论
0/1000