OpenAI 连续 12 天 AI 发布会:第三天完整视频(中英文双语字幕)
视频:https://youtu.be/5NzZQNx72Lc
Day 3 OpenAI 果然发布了 Sora
• 支持分辨率高达 1080p、时长最长 20 秒的视频,格式可选宽屏、竖屏或方形
• 提供文本转视频、图像转视频和视频转视频功能
• 配备精美的分镜工具,让您精准指导视频创作
• 包含“精选”和“最近”内容板块,从社区中汲取灵感
• 内置安全措施,确保透明性并防止滥用
• 通过 Plus 订阅可使用,或通过 Pro 订阅享受 10 倍使用量及更高分辨率
Sora 官网地址:sora.com
Sam Altman:
大家好,欢迎来到第三天。
这是我们期待已久的发布会。
我们将推出 Sora,我们的视频产品。
我们会讨论为什么它如此重要且令人激动,但首先,它实在是太酷了,我们就想先给你们展示一下。
这里是 Sora 产品的一些界面预览。这是视频流页面,用户生成的视频内容都在这里展示。
稍后会详细讨论,但我们迫不及待地想先展示给大家一点点内容。
所以视频对 OpenAI 来说很重要,有很多原因,我想分享三点:
首先,我们热衷于为创作者打造工具。这种创造文化对我们至关重要,也是我们希望人类利用 AI 的方式之一。在早期测试者中,我们观察到一种新型的协作创作动态,这不仅有趣,而且显示了 AI 创意工具的潜在使用模式。
第二,我们不希望这个世界只是科技。如果 AI 系统主要通过文本来与人互动,我认为我们错过了一些重要的东西。我们希望我们的 AI 能理解并生成视频,我认为这将深刻改变我们使用计算机的方式。
第三,这对我们的通用人工智能路线图至关重要。视频将是一个重要的环境,我们或 AI 将在这里学习到很多关于如何实现我们在世界上所需的目标。
现在我把这个交给负责 Sora 的 Aditya 和 Sora Research 的 Bill。他们将为你介绍一些相关内容。接下来,我们将邀请产品团队上来。
Aditya Ramesh:
谢谢,Sam。
大家好,今天终于是 Sora 正式上线的日子。
我们将在美国和大多数国际市场发布 Sora,并在今天晚些时候上线。
你可以在 Sora.com 访问该模型。
这是 OpenAI 从零开始设计的全新视频生成产品体验。
最棒的是,如果你已有 ChatGPT Plus 或 Pro 账号,你无需额外付费即可开始使用 Sora。我们已经将其包含在现有账户中。
要进行这样的大规模部署,Sora 研究团队付出了大量努力,改进了我们在二月份预览的模型,使其速度更快、成本更低。他们的努力卓有成效,今天我们推出了 Sora Turbo。这是原始 Sora 模型的全新高端加速版本,具备我们今年早些时候在技术报告中所提到的所有世界模拟能力,包括从文本生成视频、动画图像以及众多视频转换功能,如重混新风格、时间向前和向后延伸等。稍后其他同事会为你们展示这些功能。
正如 Sam 提到的,我们在 OpenAI 启动了 Sora 项目,以构建能够深刻理解世界及其物理的 AI 系统。我们才刚刚开始。这个早期版本的 Sora 会犯错误,并不完美。但它已经能够为增强人类创造力提供有用的工具。我们迫不及待地想看到,从今天起全世界将用 Sora 创造出什么。
Aditya Ramesh:
Aditya?
Aditya Ramesh:
嗨,我是 Aditya。
我对这次发布感到非常兴奋。
OpenAI 多年来致力于训练最先进的模型,不断推动视觉生成技术的边界。然而,我们认为,要在视觉生成领域实现更大的突破,既需要机器学习的进步,也需要人机界面设计的革新。
正因为如此,我对我们构建的这款产品感到无比自豪。接下来,我将把时间交给 Rohan 和 Joey,他们会告诉你更多信息。
Rohan Sahai:
嗨,Rohan。
Joey Flynn:
嗨,Joey。
Rohan Sahai:
嗨,Sam,最近怎么样?
我很兴奋能展示这个产品。
我们开始吧。
我是 Rohan,我是 Sora 产品团队的负责人。
Joey Flynn:
我是 Joey,Sora 的产品设计师。
Rohan Sahai:
好的,Joey,我们开始吧。
Joey Flynn:
好的。
我来介绍一下 Explore。Explore 是一个为获取创意灵感而设计的栏目。这里有一个社区分享的视频流,大家可以在这里汇聚,探索这个强大新模型的功能。我们知道这些模型在首次使用时,往往不知道能做些什么。因此,创建一个空间让人们可以聚在一起学习和分享技巧与创作方法,对我们来说既兴奋又有意义。
你可以在这里滚动浏览,你会被各种精彩视频启发。我刚刚看到一个非常有趣的视频。如果你觉得某个视频特别吸引人,可以点击进入观看,它会在弹出的对话框中显示。在对话框底部,你可以看到创建该视频的具体方法。不论是简单的文字提示词、图像扩展、视频扩展,还是我们其他强大的创意工具,你都可以学习如何将这些方法融入自己的创作流程中。
下面请 Rohan 开始我们的首次生成演示。
Rohan Sahai:
好的,让我们进入库(Library)页面。你可以把它看作 Sora 的主界面,在这里查看所有生成内容。在这里你可以用几种不同方式切换视图:网格视图,列表视图。你可以创建文件夹,你可以收藏内容,查看信息流中的书签。这些都是细微的组织功能,但它们体现了我们对支持讲故事和实际应用的重视。
好的,下面你会看到我们简单的创作工具。在这里,你只需用文字描述场景,或者上传一张图片,就可以生成视频。Sam,你有什么想法吗?
Sam Altman:
比如让猛犸象在沙漠中行走如何?
Rohan Sahai:
好的,猛犸象在沙漠中行走。我喜欢这个创意。我们就说:“猛犸象在沙漠中行走。”是个风景画面。或许我们可以设定为一个宽景镜头。
在启动生成之前,我想快速介绍一下下面的一些选项:宽高比,Sora 可以生成横向、方形或纵向比例的视频。它可以生成分辨率从 480p 到 1080p。视频时长可以从 5 秒到 20 秒不等。此外,你还可以一次生成多个版本。如果你不确定描述的结果是否符合预期,Sora 会为你提供多个方向的尝试。Variations 功能让你看到不同选项。
最后,还有预设。有时候你可能会发现一个非常喜欢的风格,并希望将其变成可重复使用的组件。你可以做到这一点,也可以使用我们默认的预设,比如“定格动画”或“气球世界”。
好了,现在我们开始生成。接下来,我会把时间交给 Joey,他会为大家讲解另一项非常棒的功能——故事板(Storyboard)。
Joey Flynn:
太好了。谢谢,Rohan。
Rohan 刚刚展示了如何将一个普通的想法发送给 Sora,让它创建一整套精彩的视频。今天,我们还将推出一项全新的创意工具——“故事板”。它允许你通过熟悉的时间轴为视频设定多个动作序列,像导演一样掌控全局。
我现在来展示一下“故事板”的一些功能。
在屏幕顶部是故事板卡片,你可以描述环境、角色,以及你希望在视频中特定时刻发生的动作。下面是时间轴,你可以为动作排序。然后是创作设置。
我来举例:
第一个场景卡片,我输入:“一只美丽的白鹤站在小溪中。”还加上黄色尾巴的细节。它站在小溪中。
我希望白鹤一开始站着,然后将头探入水中并叼起一条鱼。所以,我回到时间轴,在视频的某个时段添加第二张卡片:“白鹤将头探入水中,并叼起一条鱼。” 时间轴上的两张卡片之间有空隙,这给 Sora 提供了空间来衔接动作。
我设置好卡片后,点击生成,稍后查看结果。
我还想展示图像到视频的故事板功能:
我在第一张卡片上传一张桌面上有灯塔的图片。Sora 自动分析并为这张图片生成一个“续接描述”卡片,将静态图像转变为动态视频。
我可以随时编辑卡片内容或调整时间轴中卡片的位置。
现在,我也启动这一段生成,稍后查看结果。
我将时间交给 Rohan,让我们回顾一下这些生成的视频。
Rohan Sahai:
好的,让我们来看看刚才的猛犸象视频。很棒!
非常好。我们可以悬停预览每个版本,看看哪一个最符合预期。
现在我觉得如果将猛犸象变成机器人可能会更有趣。
所以,我可以使用 Remix 功能,只需描述更改,Sora 会完成剩下的工作。
我点击 Remix,然后输入“将猛犸象替换为机器人”,选择强变化,启动生成。
Joey Flynn:
让我们看看白鹤视频的生成结果。
看,中间部分白鹤将头探入水中。
嗯,不确定有没有成功叼起鱼。
再看另一个生成版本。
哦,有条小鱼出现了!
虽然不是完全完美,但已经非常出色。
Sora 的故事有一半是拍摄视频、编辑视频并在此基础上迭代。
我很喜欢白鹤头部入水的那一瞬间,所以我使用 ReCut 功能,只保留这精彩的前几秒。
ReCut 会自动将这段视频导入一个全新的故事板,我可以修剪视频并为后续片段添加新指示。
例如,我在后面留空,Sora 会填补这些空白,创造一个全新的结尾或开始。
现在我生成这个新的视频片段,稍后再看结果。
Rohan Sahai:
让我们看看机器人版本的猛犸象视频。
太厉害了!
Sora 完美地执行了这个指令,用机器人替换了猛犸象。
再来看一看图像到视频的灯塔场景。 有几个不错的版本,如果我想让它循环播放,可以用 Loop 功能生成无缝循环的场景。
我们还有“场景融合”(Scene Fusion)功能,可以将两个不同的视频融合到一起。
例如,将机器人和猛犸象的场景融合。
选择另一个视频,设定一些参数,Sora 会创造一个全新的融合场景。
回到推荐内容页面(Explore),你可以逐步解析每个视频的创作过程,从中获得灵感。
Sam Altman:
这真的很不可思议。
Rohan,Joey,你们做得很棒。现在我来讲一下发布的情况。
这款产品今天在大部分地区上线,但欧洲和英国的上线时间会有所延迟。我们会努力尽快上线,但目前没有确切的时间表。还有一些国家我们无法运营。
如果你有 OpenAI Plus 订阅,每月可以生成 50 次视频。如果你是 OpenAI Pro 用户,在慢速队列下可以无限制生成,并在快速模式下可生成 500 个视频。你还可以选择更高分辨率但更少数量的生成。任何账户都可以体验推荐内容功能。
我们非常期待大家的创作成果,期待见证这种新形式的娱乐和工具的应用方式。你们团队都做得非常棒,我非常喜欢这个产品。
有什么补充想法吗?
Aditya Ramesh:
是的,我想感谢研究团队,他们开发了这款令人难以置信的模型,并将其推向世界。我们的产品团队只有五六个产品工程师,在短短几个月内完成了整个产品的构建。
同时,OpenAI 的支持团队也贡献良多。
我们非常重视滥用防范和安全性,这是 OpenAI 的核心价值之一。我们将防止 Sora 被用于非法活动,同时保护创意表达。这是一个长期挑战,一开始可能不完美。如果审核有误,请反馈给我们,我们会不断改进。
非常期待看到大家的创作。
Joey Flynn:
是的,我想补充一点。
如果你期待按一个按钮就能生成一部完整电影,那么可能会失望。Sora 是一个工具,它让你可以快速尝试多个想法,实现以前难以想象的创作方式。它是创作者的延伸。
我们迫不及待想看到你们的作品,并会一直关注推荐内容页面。
Sam Altman:
是的,Sora 就像 GPT 的第一个版本,还处于早期阶段。它会变得越来越强大。每次我们发布早期版本的产品,总会被用户用其实现的惊人创作和实际价值所震撼。我们期待在推荐内容页面上看到你的作品。谢谢大家。
众人:
谢谢。