← 返回首页

Sora:在视频中模拟物理世界

世界模拟器

OpenAI 用 Sora 震惊了世界,这是一个扩散模型,能够生成长达 60 秒的高清视频。与以前的模型不同,Sora 展现出了对 物理学、物体恒存性和 3D 几何 的初步理解。

时空补丁 (Spacetime Patches)

Sora 不将视频视为图像序列,而是视为“时空补丁”——代表空间和时间中一小块视频的 token。这使得它能够像 LLM 处理文本 token 一样有效地扩展。

对好莱坞与现实的影响

逼真度如此之高,以至于区分 AI 视频和现实变得几乎不可能。

  • 创意产业:对素材库、视觉特效 (VFX) 和动画行业造成巨大颠覆。
  • 虚假信息:Deepfakes 进入了一个可信度极高的新时代。

Sora 不仅仅是一个视频生成器;它是一个数据驱动的物理引擎,从纯噪声中模拟光线、纹理和运动。