传Meta新AI模型Llama 4将于本月发布但可能再延后

作者：爱集微 04-05 07:39

来源：钜亨网 #Meta#

1.8w

根据美媒《The Information》周五 (4 日) 援引知情人是消息报导，Meta Platforms(META-US)计划于本月发布其最新的语言模型 Llama 4，尽管该模型已经至少两次推迟。这是 Meta 为在人工智慧 (AI) 竞赛中争夺领先地位所作的努力之一，但报导指出，Meta 可能会再次推迟 Llama 4 的发布。

随着 OpenAI 的 ChatGPT 大获成功，改变了科技领域的格局并推动机器学习的投资，全球大型科技公司在 AI 基础设施上积极投入。尽管如此，Llama 4 的开发并不一帆风顺。报导指出，Llama 4 在开发过程中未能达到 Meta 的技术基准，特别是在推理和数学任务上表现不佳。

此外，Meta 也担心 Llama 4 在进行类人语音对话方面的能力不及 OpenAI 的模型，这也是推迟的原因之一。该报导提到，Meta 正积极考虑如何提升 Llama 4 的能力，以便在 AI 竞争中不落人后。

在投资人的压力下，Meta 计划今年投入高达 650 亿美元扩展其 AI 基础设施，这一举措也是为了让大型科技公司能够显示其投资回报。而来自中国科技公司 DeepSeek 的低成本 AI 模型的崛起，也挑战了“开发最佳 AI 模型必须花费数十亿美元”的观念。

报导称，Llama 4 将会借鉴中国新创公司深度求索 (DeepSeek) 的一些技术，至少有一个版本预估会采用“专家混合”(Mixture of Experts)技术，这是一种让模型的不同部分专注于特定任务的机器学习方法，从而使这些部分在特定领域内成为专家。

此外，Meta 也考虑过先透过 Meta AI 发布 Llama 4，然后再将其作为开放原始码软体推出。去年的 Llama 3 模型可以说是 Meta 的一次突破，该模型不仅能够进行八种语言的对话，还能够编写更高品质的电脑程式并解决比以往更复杂的数学问题。