当前位置:主页 > 要闻 > 正文

“世界模型”——AI下一个“必争之地”,英伟达、谷歌双双下场

发布时间:2025-01-07 已有: 位 网友关注

  DeepMind正在组建一支专门的世界模型研究团队,以扩大其在该领域的领先地位。该团队将由前OpenAI研究员Tim Brooks领导,他于去年10月加入DeepMind。

  DeepMind上个月发布了Genie,该模型可模拟虚拟世界以及逼真的动画和物理效果,并支持所有这些元素之间的交互。例如用户可以使用Genie创建的各种示例世界,包括航海模拟、赛博朋克西部片等,还可以使用文本、图像或两者的组合来提示Genie。

  除了英伟达、谷歌等科技巨头,还有不少耀眼的初创玩家。“AI教母”李飞飞的World Labs已筹集2.3亿美元用于构建“大世界模型”,以及Decart、 Odyssey等公司也入局其中。此外,OpenAI此前发布的Sora模型也可视为一种“世界模型,它能够模拟如画家在画布上留下笔触等行为,以及渲染类似Minecraft的UI和游戏世界。

  AI领域的下一个关键突破:世界模型

  什么是AI“世界模型”?为什么它们很重要?

  具体来看,世界模型是指通过大量图像、音频、和文本数据训练,创建对世界运作方式的内部表征,并能推理行为的后果。这使它们能更好地理解和模拟现实世界的规律。

  世界模型的概念源自人类大脑形成的心智模型,我们的大脑能够将感官获取的抽象信息整合成对周围世界的具体理解,从而形成模型,这些模型帮助我们预测和感知世界。

  世界模型的特点是试图超越数据,模拟人类的潜意识推理,例如,棒球击球手能在毫秒内决定如何挥棒,是因为他们能本能地预测球的轨迹。这种潜意识推理能力被认为是实现人类级智能的先决条件之一。

  “世界模型”的意义在于可以实现复杂推理和规划,还将生成式技术的突破:

  1. 生成式技术的突破:世界模型在生成式领域展现出巨大潜力。与传统的生成模型相比,具备基本物理规律理解的世界模型能更准确地模拟物体的运动。例如,它不仅能预测篮球会弹跳,还能理解为什么会弹跳。Snap前AI负责人、Higgsfield公司CEO Alex Mashrabov表示,有了强大的世界模型,创

  拥有这些能力后,“世界模型”可广泛赋能影视、游戏,自动驾驶以及机器人等行业。

  World Labs联合创始人Justin Johnson预测,未来的世界模型可能能够按需生成用于游戏、虚拟摄影等用途的3D世界,大大降低开发成本和时间。世界模型将不仅能获得图像或片段,还能得到一个完全模拟的、生动的、可交互的3D世界。

  代表好莱坞动画师和漫画家的工会动画协会 一项2024年研究估计,人工智能有可能在未来两年内颠覆美国10多万个电影、电视和动画工作岗位。

  世界模型还有望推动机器人技术进步,通过增强机器人对周围环境和自身的感知能力,帮助它们更好地理解所处情境并推理可能的解决方案。

  尽管前景诱人,世界模型的发展仍面临诸多技术挑战:

  巨大的计算需求:训练和运行世界模型需要比当前生成模型更多的计算能力;幻觉和偏见问题:像所有AI模型一样,世界模型也会产生幻觉并内化训练数据中的偏见。训练数据限制:缺乏足够广泛而又具体的训练数据可能会加剧上述问题。复杂行为模拟:目前的模型难以准确捕捉世界居民的行为。

  过去一年AI技术在多元方向持续突破,世界模型被视为下一个重大突破。虽然距离成熟的“世界模型”还有数年时间距离,但这一技术已展现出巨大潜力。如果所有主要障碍都能克服,“世界模型”有望在虚拟世界生成、机器人技术和AI决策等领域带来重大突破,为人工智能与现实世界的融合开辟新的途径。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。