谷歌挑战ChatGPT创作者争夺AI视频创作桂冠

之间的人工智能之战

OpenAI(ChatGPT 背后的团队)正在升温,两家公司本月都推出了新产品、功能和更新。现在,谷歌的人工智能研究实验室 Google DeepMind 正着眼于在视频生成游戏中击败 OpenAI,而且它可能会成功,至少在一段时间内是这样。

谷歌用 Veo 2 挑战 OpenAI 的 Sora


DeepMind 推出了 Veo 2,下一代视频生成人工智能和 Veo 的继任者,为 Google 产品线中的各种产品提供支持。 Veo 2 可以生成超过两分钟的剪辑,分辨率高达 4K(4096 x 2160 像素)。这是分辨率的四倍和持续时间的六倍多

然而,这种优势仍然是理论上的。在 Google 的实验性视频工具 VideoFX(Veo 2 目前独占)中,视频的分辨率被限制为 720p,长度仅为 8 秒。 (另一方面,Sora 可以生成 1080p 的 20 秒视频。)

VideoFX 目前正在等待名单上,但谷歌本周正在增加可以访问它的用户数量。该公司计划明年某个时候将其推广到更多产品,包括 YouTube Shorts。与原始 Veo 非常相似,Veo 2 可以根据简单的文本提示或文本和参考图像的组合来创建视频。

使用 Veo 2 生成的短视频。视频来源 – 谷歌

那么,Veo 2 有何不同? DeepMind 表示,这个新模型可以更好地“理解”物理和摄像机控制,从而拍摄出“更清晰”的镜头。所谓更清晰,是指更清晰的纹理和图像,尤其是在充满动作的场景中。

在相机控制方面,Veo 2 现在可以更精确地定位虚拟相机并移动它以从不同角度捕捉人和物体。

它还可以模拟不同的镜头和电影效果,给视频带来更精美的电影般的感觉。另外,据说它可以捕捉更微妙的人类表情。 DeepMind 分享了一些精心挑选的样本,我认为它们对于人工智能生成的镜头来说看起来非常令人印象深刻。

视频来源 – 谷歌

也就是说,仍有一些工作要做。看看上面镜头中奇怪的光滑道路或背景中融合在一起的行人。因此,对于任何担心人工智能可能取代人类的人来说,它已经取得了巨大进步,但距离取代人类知识和技能还有很长的路要走。

Veo 2 经过大量视频的训练,这对于 AI 模型来说是相当标准的。通过输入无数的数据示例,这些模型开始识别能够生成新内容的模式。虽然 DeepMind 没有透露用于训练 Veo 2 的视频的确切来源,但考虑到 Google 拥有 YouTube,它是一个可能的候选者。

与其他 Google 图像和视频模型一样,Veo 2 在其输出中嵌入了不可见的 SynthID 水印,将其标记为 AI 生成,这有助于防止错误信息和错误归因。但说实话,大多数人在分享视频之前可能不会检查该水印,这仍然为错误信息的传播留下了空间。

除了 Veo 2 之外,Google DeepMind 还发布了对其图像生成模型 Imagen 3 的升级。从本周一开始,新版本的 Imagen 3 现已向 Google 图像创建工具 ImageFX 的用户开放。更新后的模型有望提供“更明亮、构图更好”的各种风格的图像和照片,包括照片写实主义、印象派和动漫。