当前位置:主页 > 业界 > 正文

谷歌大幅更新生成式AI,推出模型VEO 2和最新版Imagen3

发布时间:2024-12-17 已有: 位 网友关注

  谷歌的旗舰AI研究实验室Google DeepMind周一大幅升级其人工智能驱动的内容生成工具,推出了Veo 2生成模型和增强版Imagen 3图像模型,挑战OpenAI在AI图像和生成的领先地位。谷歌表示,这些更新有望彻底改变创意工作流程,为和图像创

  谷歌介绍,Veo 2是谷歌的生成工具,能够生成多样化主题和风格的高质量。谷歌在博客中表示,这款模型在真实感方面表现卓越,能够捕捉到人类表情和电影效果等细节。其增强的物理和电影学理解能力使用户能够生成令人惊叹的内容,包括跟踪镜头和广角构图等。

  例如,Veo 2熟悉电影拍摄语言,用户可以要求某种类型的风格,指定镜头,建议电影效果,Veo 2都会以高达4K分辨率并延长到数分钟的长度来呈现。比如,要求“低角度跟踪镜头穿越场景中央”或“特写科学家通过显微镜观察”的镜头,Veo 2都能实现。提示“18mm镜头”,Veo 2知道生成广角镜头;要求“浅景深”,它会模糊背景,突出主体。

  值得注意的是,这一分辨率是OpenAI Sora模型的4倍,时长更是其6倍以上。

  不过,目前这些优势仍是理论上的。在谷歌的实验性创作工具VideoFX中,Veo 2生成的被限制为720p分辨率、8秒的长度。

  谷歌表示,虽然生成模型往往会“幻象化”出不需要的细节,例如多余的手指或意外的物体,但Veo 2在这一方面的表现更为真实,生成错误的频率较低。

  此外,Veo 2生成的包括不可见的SynthID水印,用于标记它们为AI生成的内容,从而减少误用或错误归属的风险。

  DeepMind产品副总裁Eli Collins对媒体表示,随着模型逐渐具备规模化使用的准备,谷歌将通过其Vertex AI开发者平台提供Veo 2。

  “未来几个月,我们将根据用户反馈持续迭代,并寻求将Veo 2的更新能力整合到谷歌生态系统中的相关应用中……我们预计明年会分享更多的更新内容。”

  开发者和创

  同时,Imagen 3模型在图像构图和细节准确性方面得到了增强,支持从写实到抽象的各种风格,能够生成更丰富的纹理,并更加忠实地回应用户提示。

  目前,Imagen 3已经通过谷歌实验室的ImageFX工具在100多个国家上线,全球用户可以试验其尖端功能。

  此外,谷歌还推出了Whisk,这是一款结合了Imagen 3和Gemini

  谷歌介绍,Whisk结合了Imagen 3模型和Gemini的

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。