发布时间:2025-01-27 已有: 位 网友关注
面对DeepSeek的挑战,Meta迅速采取行动,已组建了多个“小组”来研究DeepSeek的技术细节。
其中两个小组正在试图了解DeepSeek如何降低训练和运行大模型的成本,第三小组正在试图弄清楚DeepSeek使用的数据集,第四小组则正在考虑基于DeepSeek模型属性重构Meta的Llama模型。
此外,DeepSeek此前在技术论文中介绍的降本方法,也已被Meta的研究小组列为重点研究对象,包括模型蒸馏等技术。Meta希望通过这些努力,能够在即将发布的Llama 4中实现技术突破。
Meta的AI基础设施总监Mathew Oldham等高层领导此前公开表示,他们对Llama的表现感到担忧,担心其无法与DeepSeek竞争。
Meta的开发者社区也反映,尽管Llama模型是免费的,但其运行成本往往高于OpenAI的模型——因为OpenAI能够通过批量处理数百万用户的查询来降低成本,而使用Llama的小型开发者则无法达到这种规模。