Annotation

  • 简介
  • 基准主导地位和主要特点
  • 当前可用性和技术限制
  • 优点和缺点
  • 结论
  • 常见问题
科技新闻

Runway Gen 4.5 AI 在视频测试中击败 Google Veo 和 OpenAI Sora

Runway 的 Gen 4.5 AI 模型在视频生成基准测试中领先,凭借改进的真实感和物理模拟,超越了 Google Veo 和 OpenAI Sora,为创作者带来更佳体验。

Runway Gen 4.5 AI model generating a realistic cinematic video from a text prompt
科技新闻1 min read

简介

Runway已正式推出其Gen 4.5 AI模型,这是文本到视频生成领域的一次重大飞跃。据报道,这个新版本在独立评估中超越了谷歌的Veo 3和OpenAI的Sora等知名竞争对手,通过严格的盲人测试,在Video Arena排行榜上占据了首位。

基准主导地位和主要特点

该模型在Video Arena排行榜上登顶引人注目,因为它是由盲人评估决定的,测试者在不知道哪个AI生成的情况下比较输出结果。这种方法为感知质量和真实感提供了强有力的指标。Gen 4.5擅长从简单的文本描述中创建高清视频,在模拟真实世界物理、自然人体运动和动态摄像机工作方面有显著改进。其结果旨在呈现电影感,物体和液体的移动带有令人信服的重量和动量感。对于探索最新AI视频生成器的创作者来说,这代表了一个强大的新工具。

当前可用性和技术限制

Runway正在逐步向其用户群推出Gen 4.5的访问权限。公司表示,生成速度仍然高效,与其之前的模型相当。然而,该技术并非完美无缺。用户可能仍会遇到对象持久性的偶尔问题,即物品在帧之间不一致地出现或消失,以及因果推理错误,例如效果在视觉上发生在原因之前。这些是快速发展的AI自动化平台领域的常见挑战。

优点和缺点

优点

  • 在Video Arena基准测试中质量领先
  • 生成高度真实、电影感的视频
  • 改进了物理和运动的模拟
  • 保持快速的生成速度
  • 对摄像机动态有深刻理解
  • 在测试中优于主要竞争对手

缺点

  • 偶尔在对象持久性方面存在失误
  • 可能在逻辑因果关系上出错
  • 访问权限正在缓慢向用户推出

结论

Runway Gen 4.5标志着AI驱动视频创作的重大进步,为真实感和质量设定了新基准,挑战了谷歌和OpenAI等巨头。其在盲人评估中的成功突显了其视觉保真度。虽然在复杂推理方面仍存在限制,但其在物理和风格一致性方面的能力使其成为视频编辑和动画软件创作者和专业人士的领先者,预示着生成媒体的快速发展未来。

常见问题

Runway Gen 4.5 与 Google Veo 和 OpenAI Sora 相比如何?

Runway Gen 4.5 目前在独立的 Video Arena 排行榜上位居榜首,该排行榜采用盲测。这表明测试者认为其生成的视频比 Google 的 Veo 3 和 OpenAI 的 Sora 模型的输出更真实或质量更高。

Runway Gen 4.5 的主要改进有哪些?

主要改进包括更好地模拟现实世界物理和物体重量、更自然的人类动作、增强的相机动态,以及从文本提示中整体实现更具电影感和真实视觉风格的一致性。

现在任何人都可以使用 Runway Gen 4.5 吗?

不可以,Runway 正在逐步向用户开放 Gen 4.5 的访问权限。公司已确认该模型正在发布,但可用性可能取决于您的账户等级或是分阶段推出的一部分。

Runway Gen 4.5 在哪些基准测试中名列前茅?

Runway Gen 4.5 在 Video Arena 排行榜上名列前茅,这是一个独立的基准测试,使用盲测来评估和排名 AI 视频模型,基于感知质量和真实感。

使用 Gen 4.5 有任何费用吗?

访问 Runway Gen 4.5 可能涉及订阅费用,具体取决于 Runway 的定价等级,并且会根据用户的账户级别逐步向用户开放。