OpenAI 连续 12 天 AI 发布会:第三天完整视频(中英文双语字幕)

视频:https://youtu.be/5NzZQNx72Lc

Day 3 OpenAI 果然发布了 Sora ​​​

• 支持分辨率高达 1080p、时长最长 20 秒的视频,格式可选宽屏、竖屏或方形

• 提供文本转视频、图像转视频和视频转视频功能

• 配备精美的分镜工具,让您精准指导视频创作

• 包含“精选”和“最近”内容板块,从社区中汲取灵感

• 内置安全措施,确保透明性并防止滥用

• 通过 Plus 订阅可使用,或通过 Pro 订阅享受 10 倍使用量及更高分辨率

Sora 官网地址:sora.com

Sam Altman
大家好,欢迎来到第三天。
这是我们期待已久的发布会。
我们将推出 Sora,我们的视频产品。
我们会讨论为什么它如此重要且令人激动,但首先,它实在是太酷了,我们就想先给你们展示一下。
这里是 Sora 产品的一些界面预览。这是视频流页面,用户生成的视频内容都在这里展示。
稍后会详细讨论,但我们迫不及待地想先展示给大家一点点内容。

所以视频对 OpenAI 来说很重要,有很多原因,我想分享三点:
首先,我们热衷于为创作者打造工具。这种创造文化对我们至关重要,也是我们希望人类利用 AI 的方式之一。在早期测试者中,我们观察到一种新型的协作创作动态,这不仅有趣,而且显示了 AI 创意工具的潜在使用模式。

第二,我们不希望这个世界只是科技。如果 AI 系统主要通过文本来与人互动,我认为我们错过了一些重要的东西。我们希望我们的 AI 能理解并生成视频,我认为这将深刻改变我们使用计算机的方式。

第三,这对我们的通用人工智能路线图至关重要。视频将是一个重要的环境,我们或 AI 将在这里学习到很多关于如何实现我们在世界上所需的目标。

现在我把这个交给负责 Sora 的 Aditya 和 Sora Research 的 Bill。他们将为你介绍一些相关内容。接下来,我们将邀请产品团队上来。


Aditya Ramesh
谢谢,Sam。
大家好,今天终于是 Sora 正式上线的日子。
我们将在美国和大多数国际市场发布 Sora,并在今天晚些时候上线。
你可以在 Sora.com 访问该模型。
这是 OpenAI 从零开始设计的全新视频生成产品体验。
最棒的是,如果你已有 ChatGPT Plus 或 Pro 账号,你无需额外付费即可开始使用 Sora。我们已经将其包含在现有账户中。

要进行这样的大规模部署,Sora 研究团队付出了大量努力,改进了我们在二月份预览的模型,使其速度更快、成本更低。他们的努力卓有成效,今天我们推出了 Sora Turbo。这是原始 Sora 模型的全新高端加速版本,具备我们今年早些时候在技术报告中所提到的所有世界模拟能力,包括从文本生成视频、动画图像以及众多视频转换功能,如重混新风格、时间向前和向后延伸等。稍后其他同事会为你们展示这些功能。

正如 Sam 提到的,我们在 OpenAI 启动了 Sora 项目,以构建能够深刻理解世界及其物理的 AI 系统。我们才刚刚开始。这个早期版本的 Sora 会犯错误,并不完美。但它已经能够为增强人类创造力提供有用的工具。我们迫不及待地想看到,从今天起全世界将用 Sora 创造出什么。

Aditya Ramesh
Aditya?


Aditya Ramesh
嗨,我是 Aditya。
我对这次发布感到非常兴奋。
OpenAI 多年来致力于训练最先进的模型,不断推动视觉生成技术的边界。然而,我们认为,要在视觉生成领域实现更大的突破,既需要机器学习的进步,也需要人机界面设计的革新。

正因为如此,我对我们构建的这款产品感到无比自豪。接下来,我将把时间交给 Rohan 和 Joey,他们会告诉你更多信息。


Rohan Sahai
嗨,Rohan。


Joey Flynn
嗨,Joey。


Rohan Sahai
嗨,Sam,最近怎么样?
我很兴奋能展示这个产品。
我们开始吧。
我是 Rohan,我是 Sora 产品团队的负责人。

Joey Flynn
我是 Joey,Sora 的产品设计师。


Rohan Sahai
好的,Joey,我们开始吧。

Joey Flynn
好的。
我来介绍一下 Explore。Explore 是一个为获取创意灵感而设计的栏目。这里有一个社区分享的视频流,大家可以在这里汇聚,探索这个强大新模型的功能。我们知道这些模型在首次使用时,往往不知道能做些什么。因此,创建一个空间让人们可以聚在一起学习和分享技巧与创作方法,对我们来说既兴奋又有意义。

你可以在这里滚动浏览,你会被各种精彩视频启发。我刚刚看到一个非常有趣的视频。如果你觉得某个视频特别吸引人,可以点击进入观看,它会在弹出的对话框中显示。在对话框底部,你可以看到创建该视频的具体方法。不论是简单的文字提示词、图像扩展、视频扩展,还是我们其他强大的创意工具,你都可以学习如何将这些方法融入自己的创作流程中。

下面请 Rohan 开始我们的首次生成演示。


Rohan Sahai
好的,让我们进入库(Library)页面。你可以把它看作 Sora 的主界面,在这里查看所有生成内容。在这里你可以用几种不同方式切换视图:网格视图,列表视图。你可以创建文件夹,你可以收藏内容,查看信息流中的书签。这些都是细微的组织功能,但它们体现了我们对支持讲故事和实际应用的重视。

好的,下面你会看到我们简单的创作工具。在这里,你只需用文字描述场景,或者上传一张图片,就可以生成视频。Sam,你有什么想法吗?


Sam Altman
比如让猛犸象在沙漠中行走如何?


Rohan Sahai
好的,猛犸象在沙漠中行走。我喜欢这个创意。我们就说:“猛犸象在沙漠中行走。”是个风景画面。或许我们可以设定为一个宽景镜头。

在启动生成之前,我想快速介绍一下下面的一些选项:宽高比,Sora 可以生成横向、方形或纵向比例的视频。它可以生成分辨率从 480p 到 1080p。视频时长可以从 5 秒到 20 秒不等。此外,你还可以一次生成多个版本。如果你不确定描述的结果是否符合预期,Sora 会为你提供多个方向的尝试。Variations 功能让你看到不同选项。

最后,还有预设。有时候你可能会发现一个非常喜欢的风格,并希望将其变成可重复使用的组件。你可以做到这一点,也可以使用我们默认的预设,比如“定格动画”或“气球世界”。

好了,现在我们开始生成。接下来,我会把时间交给 Joey,他会为大家讲解另一项非常棒的功能——故事板(Storyboard)。


Joey Flynn
太好了。谢谢,Rohan。

Rohan 刚刚展示了如何将一个普通的想法发送给 Sora,让它创建一整套精彩的视频。今天,我们还将推出一项全新的创意工具——“故事板”。它允许你通过熟悉的时间轴为视频设定多个动作序列,像导演一样掌控全局。

我现在来展示一下“故事板”的一些功能。
在屏幕顶部是故事板卡片,你可以描述环境、角色,以及你希望在视频中特定时刻发生的动作。下面是时间轴,你可以为动作排序。然后是创作设置。

我来举例:
第一个场景卡片,我输入:“一只美丽的白鹤站在小溪中。”还加上黄色尾巴的细节。它站在小溪中。

我希望白鹤一开始站着,然后将头探入水中并叼起一条鱼。所以,我回到时间轴,在视频的某个时段添加第二张卡片:“白鹤将头探入水中,并叼起一条鱼。” 时间轴上的两张卡片之间有空隙,这给 Sora 提供了空间来衔接动作。
我设置好卡片后,点击生成,稍后查看结果。

我还想展示图像到视频的故事板功能:
我在第一张卡片上传一张桌面上有灯塔的图片。Sora 自动分析并为这张图片生成一个“续接描述”卡片,将静态图像转变为动态视频。
我可以随时编辑卡片内容或调整时间轴中卡片的位置。
现在,我也启动这一段生成,稍后查看结果。

我将时间交给 Rohan,让我们回顾一下这些生成的视频。


Rohan Sahai
好的,让我们来看看刚才的猛犸象视频。很棒!
非常好。我们可以悬停预览每个版本,看看哪一个最符合预期。

现在我觉得如果将猛犸象变成机器人可能会更有趣。
所以,我可以使用 Remix 功能,只需描述更改,Sora 会完成剩下的工作。
我点击 Remix,然后输入“将猛犸象替换为机器人”,选择强变化,启动生成。


Joey Flynn
让我们看看白鹤视频的生成结果。
看,中间部分白鹤将头探入水中。
嗯,不确定有没有成功叼起鱼。
再看另一个生成版本。
哦,有条小鱼出现了!
虽然不是完全完美,但已经非常出色。

Sora 的故事有一半是拍摄视频、编辑视频并在此基础上迭代。
我很喜欢白鹤头部入水的那一瞬间,所以我使用 ReCut 功能,只保留这精彩的前几秒。
ReCut 会自动将这段视频导入一个全新的故事板,我可以修剪视频并为后续片段添加新指示。
例如,我在后面留空,Sora 会填补这些空白,创造一个全新的结尾或开始。

现在我生成这个新的视频片段,稍后再看结果。


Rohan Sahai
让我们看看机器人版本的猛犸象视频。
太厉害了!
Sora 完美地执行了这个指令,用机器人替换了猛犸象。

再来看一看图像到视频的灯塔场景。 有几个不错的版本,如果我想让它循环播放,可以用 Loop 功能生成无缝循环的场景。

我们还有“场景融合”(Scene Fusion)功能,可以将两个不同的视频融合到一起。
例如,将机器人和猛犸象的场景融合。
选择另一个视频,设定一些参数,Sora 会创造一个全新的融合场景。

回到推荐内容页面(Explore),你可以逐步解析每个视频的创作过程,从中获得灵感。


Sam Altman
这真的很不可思议。
Rohan,Joey,你们做得很棒。现在我来讲一下发布的情况。

这款产品今天在大部分地区上线,但欧洲和英国的上线时间会有所延迟。我们会努力尽快上线,但目前没有确切的时间表。还有一些国家我们无法运营。

如果你有 OpenAI Plus 订阅,每月可以生成 50 次视频。如果你是 OpenAI Pro 用户,在慢速队列下可以无限制生成,并在快速模式下可生成 500 个视频。你还可以选择更高分辨率但更少数量的生成。任何账户都可以体验推荐内容功能。

我们非常期待大家的创作成果,期待见证这种新形式的娱乐和工具的应用方式。你们团队都做得非常棒,我非常喜欢这个产品。

有什么补充想法吗?


Aditya Ramesh
是的,我想感谢研究团队,他们开发了这款令人难以置信的模型,并将其推向世界。我们的产品团队只有五六个产品工程师,在短短几个月内完成了整个产品的构建。

同时,OpenAI 的支持团队也贡献良多。
我们非常重视滥用防范和安全性,这是 OpenAI 的核心价值之一。我们将防止 Sora 被用于非法活动,同时保护创意表达。这是一个长期挑战,一开始可能不完美。如果审核有误,请反馈给我们,我们会不断改进。
非常期待看到大家的创作。


Joey Flynn
是的,我想补充一点。
如果你期待按一个按钮就能生成一部完整电影,那么可能会失望。Sora 是一个工具,它让你可以快速尝试多个想法,实现以前难以想象的创作方式。它是创作者的延伸。
我们迫不及待想看到你们的作品,并会一直关注推荐内容页面。


Sam Altman
是的,Sora 就像 GPT 的第一个版本,还处于早期阶段。它会变得越来越强大。每次我们发布早期版本的产品,总会被用户用其实现的惊人创作和实际价值所震撼。我们期待在推荐内容页面上看到你的作品。谢谢大家。


众人
谢谢。