当前位置: 首页 > news >正文

OpenAI炸场!Sora 2正式发布,它不只是个视频模型,更是一个社交宇宙!

1、介绍

1.1 Sora2 模型升级点

2024 年 12 月,OpenAI 的 Sora1,瞬间引爆了大众对AI视频生成能力的想象。现在 Sora 2 终于来了,而且更加震撼。

Sora 2不仅仅是Sora 1的简单升级,它是一个在理解和模拟现实世界方面更智能、更强大,并且也更容易被创作者控制的新一代模型。而且可以说是当前最顶级的、旗舰级的视频和音频生成系统。是的,它可以原生支持音频和视频的同步生成。

这次发布 Sora2 模型,相较于前代产品在两个核心能力上有了巨大飞跃:【gzh:和平本记】

1)更强的物理真实感

它在模拟物体、人物与环境之间如何进行物理互动方面,比以往任何视频模型都更加智能和真实。

比如过去很多模型都无法处理的问题,奥运会体操和滑水后空翻,这些动作涉及到复杂的身体力学、碰撞和动态平衡,对模型的物理理解能力要求极高。

现在 Sora2模型能非常稳健的处理这类复杂的碰撞和动态,让生成的结果看起来极其的自然。

也就是说你用 Sora2 模型生成的视频,里面的动作和物理效果会更符合现实世界的规律,大大减少了过去AI视频中常见的物理错误或怪异感。

2)更好的可操控性

现在很多的模型通常只能一镜到底,很难在一次生成中创作出包含多个镜头、叙事连贯的长故事。

Sora 2在这方面的改进是,它能够更好地在一次生成中讲述更长、更连贯的故事。用户引导和控制模型生成内容的能力相较于以前大大提升了。对于那些想要创作完整短片或复杂叙事的专业人士和普通用户来说,都是一个非常好的消息。

1.2 下载使用

1)APP

使用美区苹果 apple store 搜索「Sora 不要 OpenAI」去下载

img

2)网页

使用美区 IP 访问

https://sora.chatgpt.com/

3)API

官方将在未来几周内推出API,开发者可以通过API将Sora 2的视频生成能力集成到自己的视频编辑软件或其他应用中,从而满足更多样化、更精细的创作需求

2、Sora 2 模型三项革命性新功能

2.1 从单镜头到完整故事

现在很多视频生成模型的一个核心局限就是,它们通常只能逐个镜头地生成内容。

如果你想制作一个包含多个不同镜头的短片(比如一个远景、一个近景、再一个特写),你需要多次生成,然后自己手动拼接,这非常繁琐且难以保证风格和人物的一致性

Sora 2 有了强大的叙事能力,可以在一次生成请求中,就创作出更长、更连贯、包含多个镜头切换的完整故事。这样创作者就可以专注于故事本身,不用再被技术工具所限制了。

2.2 音视频同步输出

这是Sora 2的另一个重大功能:它是第一个能够同时生成视频和音频的Sora模型。

我们现在很多模型只能生成无声的视频片段,用户需要自己后期配音、配乐。而 Sora 2 原生就支持同时生成视频和音频。

而且这个音频生成系统非常强大和通用。它不仅能生成简单的背景音乐或音效,还能:

  • 生成多语种、多角色的对话
  • 生成环境音,比如风声、雨声、城市噪音等,让视频更具沉浸感【gzh:和平本记】

2.3 重磅的功能:Cameo (客串)

这是Sora 2 所有新功能中最令人兴奋的功能。

Sora 2会观察一段关于某个真实人物的简短视频片段进行学习。

等他学习完成后,你就可以像使用一个指令一样,将这个人物形象投放到任何由Sora生成的虚拟场景中。

基于上面的功能,Sora 2 已经从一个单纯的视频生成模型,进化为一个强大的、能够创作完整音视频故事的平台。尤其是有了 Cameo 功能,你甚至能够亲自主演自己想象中的世界。

3、全新社交应用 Sora App

3.1 介绍

因为 Sora 2模型的能力太强大、太新颖了,所以 Openai 团队认为仅仅把它当成一个工具是不够的。为了让它的魔力能被大众真正体验和发挥,他们必须创造一个全新的产品,一个外观熟悉、但内容和体验完全不同的AI社交平台。

OpenAI 为什么会开发 Sora App 这款产品呢?

随着Sora 2模型,尤其是Cameo(客串)等功能的开发,OpenAI 意识到这些功能所带来的体验已经超越了传统工具的范畴,它们不仅仅是技术,更是一种全新的沟通和创造方式。为了不浪费这些惊人能力,他们需要一个专门的产品来承载。

为了让大家快速上手,降低使用门槛,他们使用了熟悉的社交界面。跟很多社交媒体一样,会有个人信息、关注、推荐流。

但是 Sora App与所有其他社交平台最根本的区别,就是在这个应用里,你看到的所有视频内容,都不是现实拍摄的,而是完全由AI生成的。

虽然内容是AI生成的,但发布和创作这些内容的仍然是真实的人类,而不是机器人。这保证了社区的真实性和人情味。

所以你可以把 Sora App 看成一个披着熟悉社交外衣,内里却是由人类创意驱动、AI生成内容构成的全新世界。

3.2 Sora 2模型的两大核心优势:惊人的真实感广泛的风格多样性

Sora 2彻底摆脱了以往模型风格单一的弊病,能够驾驭各种风格,比如新闻、艺术片、动漫等。

同时,其最强大的Cameo功能不仅能用于人类,还能无缝地将宠物(比如一只真狗)植入到完全不同风格的场景(如动漫)中,模型的通用性和潜力非常大。

3.3 Sora App创作界面介绍

点击屏幕下方的「+」号按钮,就会进入一个简单的编辑器。

编辑器的核心功能:用户只需要用自然语言进行描述,就可以获得一个视频。

你可以描述任何:

想法、风格、场景、剧本【gzh:和平本记】

img

点击之后你就可以用自然语言去描述你想要生成的视频。

img

4、Cameo功能

4.1 介绍

Cameo(客串)功能是什么?

Cameo(客串)功能是Sora 2模型独有的一项革命性新功能。

它允许用户通过一段简短的视频,将一个特定的人物、宠物甚至物体教给AI模型,然后就能像使用文本指令一样,将这个对象无缝地植入(或称客串出演)到任何由AI生成的全新场景中。

Cameo(客串)功能技术原理:

Cameo功能它的工作方式是,模型通过观察一小段视频片段,能够深度理解视频中的对象(无论是人、宠物还是物体)。

在完成学习后,这个被理解的对象在系统中就变成了一个如同「文本指令」一样的元素。

写提示词时,可以直接调用这个人物指令,模型就能理解并将其注入到你描述的任何新场景中。

Cameo(客串)功能的通用性:

Cameo功能的适用对象非常广泛,不止用于人,用于宠物,用于物体都可以。

  • 人类:你可以将自己或获得授权的朋友植入视频中,甚至可以实现多个Cameo形象在同一个场景中互动。
  • 宠物:你可以将自己的宠物制作成Cameo,并将其渲染成动漫等完全不同的风格。
  • 物体:该功能同样适用于无生命的物体

4.2 Cameo功能的使用

编辑器界面中有一个 Cameo托盘这个托盘里不仅可以有你自己的Cameo形象还会有一些已经授权给你使用的朋友的形象。

Cameo功能的一个核心原则:必须获得本人明确的许可,才能使用他人的形象,这保证了用户的肖像权

img

例如,我们可以选择OpenAI的 CEO,让他来帮我们录制一个视频

提示词:

@sama 帮我用中文录一个口播视频。视频的内容是祝大家节日快乐,身体健康,财源滚滚。事业美满,爱情顺利。

4.3 如何安全地创建属于你自己的Cameo数字形象?

进入个人资料页面,点击, Create Cameo

img

创建流程中的两大核心安全验证步骤:

1)动态音频提示

系统会给你一个随机的音频挑战,要求你朗读出来。【gzh:和平本记】

这比单纯录制一段固定内容的视频要安全得多,因为动态和随机的特性大大增加了仿冒者提前准备材料进行欺骗的难度。

img

2) 活体检测(人脸)

在录制过程中,系统会要求你按指令移动你的头部(比如向左转、向上看等)。

这是一个在金融、安防领域常见的活体检测技术,目的是确认摄像头前的是一个真实的、活着的人,而不是一张照片或一段预先录制好的视频。

最后,你录制的视频会被发送到Sora的后台系统,进行大量的验证,确保没有人能够冒充你,保证网络上代表你的这个数字形象确实是你本人创建的。

4.4 Cameo(客串)功能的用户控制权和个性化设置。

一旦你通过了严格的安全验证并成功创建了自己的Cameo,你就成了自己数字肖像的绝对主宰

你可以精细地控制谁能使用你的形象,并且还能通过设置「偏好」来引导AI如何更好地呈现你,避免出现一些尴尬或不希望看到的细节

1)用户对肖像权的完全控制

在完成动态音频和活体检测等安全验证流程后,你的Cameo形象就会被批准。从这一刻起,控制权就完全交到了你的手上。

你可以根据自己的意愿,选择谁有权在视频创作中使用你的形象:

  • 仅自己 (Only I):最严格的设置,只有你自己能用。
  • 我批准的人 (People I approve):你可以建立一个白名单,只允许特定好友使用。
  • 互相关注的人 (Mutuals):仅限于和你互相关注的朋友。
  • 所有人 (Everyone):最开放的选项,允许网络上任何人使用你的形象进行创作。

img

Sora团队的一个非常重要的原则就是,在这个平台上,你对自己的肖像拥有完全的控制权。

绝对没有任何办法可以让别人在未经你明确授权的情况下,生成关于你的视频。【gzh:和平本记】

2)个性化偏好设置

用户不仅能控制谁能用,还能在一定程度上控制怎么用。

除了权限管理,Sora App还提供了一个更高级的功能:你可以引导模型如何描绘你的形象。这相当于给AI一些关于你个人风格的提示。

因为当前 AI 不可避免地会存在幻觉,有时候出现一些奇怪或用户不喜欢的细节。比如:

  • 不喜欢的衣着,你喜欢穿运动裤,但是 AI 非让你穿牛仔裤。
  • 奇怪的口音,你本来是中国人,但说出来的却是英语。

解决方案就是进入 Cameo偏好设置,在这里,你可以通过文字或其他方式设定一些规则,对AI的生成进行微调,比如,不要让我穿牛仔裤或请让我说中文。

img

强烈建议所有设置Cameo的用户都去使用这个功能,以获得最佳体验。

所以 OpenAI 通过严格且多层次的权限系统,确保了你肖像权的绝对安全和控制权。其次,通过人性化的偏好设置,让你能够对自己的数字形象进行个性化管理,使其更贴近你的真实意愿。

4.5 Cameo(客串)功能的两大核心方面:创造性玩法和用户对自己身份的所有权

Cameo偏好设置不仅可以用来避免AI犯错,更可以反过来主动引导AI进行有趣的创作(比如给自己加根金链子)。

此外,Sora团队还郑重承诺,用户拥有对自己身份的绝对拥有权,任何包含你Cameo形象的视频,你都有权删除,

1)Cameo偏好设置的创造性玩法

偏好设置的另一个用途:不只是防御性地避免AI犯错,更是主动地引导AI进行有趣的创作

你可以利用这个功能给自己添加各种好玩的东西,比如有趣的帽子或奇怪的道具。

举例:

利用偏好设置,给自己设定了一个标志性特征,总是戴着一条金链子这意味着,之后任何包含你形象的视频,AI都会自动给你加上金链子。

2)个人身份的所有权

Sora团队的核心理念之一就是保障用户对自己数字身份的所有权。即使是你授权所有的权利,你有权随时删除这个包含了你形象的视频。

在这个机制下,就算别人用了你的形象去创作视频,你也会被视为该视频的共同所有者。这从根本上保障了用户对自己数字形象的最终控制力。

5、独特的社交互动功能Remix(再创作)

Sora App不仅仅是一个让你从零开始创作的工具,它更是一个鼓励用户在他人创意的基础上进行二次创作和互动的社交平台。

Remix功能让你可以一键跳入任何你感兴趣的视频故事中,轻松创作出属于你自己的版本,从而实现一种前所未有的即时参与感和社区共创体验。

5.1 Remix功能的价值

它解决了一个传统社交媒体难以解决的问题:即时参与感

当你在其他社交平台刷到一个好玩的视频的时候,你通常只能点赞、评论或模仿拍摄,参与门槛较高。

而Sora2的 Remix 功能则让你能够立即参与到别人创造的世界观或传说中,成为故事的一部分。

5.2 Remix 功能的操作流程

当你刷视频看到一个自己非常感兴趣的视频的时候,想要创作一个属于自己的版本,那你就可以直接点击 Remix 按钮。【gzh:和平本记】

点击Remix按钮后,你就可以用简单的自然语言下达新的指令。它保留了原视频的核心创意框架,但允许用户轻松替换掉其中的关键元素。

img

Remix功能如何极大地降低了创意参与的门槛。它将观看者和创作者之间的界限变得模糊,让每一个用户都能轻松地在社区的创意潮流中贡献自己的想法,从而构建起一个真正意义上的互动和共创生态系统。

Remix 功能实际操作演示:

刷到一个你感兴趣的视频之后,点击 Remix 按钮,然后用自然语言去描述你的创作。

原视频是从窗户往下面撒卡片

img

Remix 后的视频:

5.3 Sora 2模型案例演示

1)Remix功能的创意发散性

案例一:香水广告变成牙膏广告

原视频:

Remix 后视频:

Remix功能可以将原作的核心元素(广告风格和台词模板)保留,同时替换掉主题(从香水变为牙膏)

案例二:改变说话语言

这个例子,展示一下改变语言和文化背景。

如果你在现实生活中只会说英语,不会说中文,不用担心,在Sora的世界里,一切皆有可能 。

Sora 2有强大的多语言能力和帮助用户实现不可能的幻想的潜力。【gzh:和平本记】

原视频:

Remix 后的视频:

2)模型对物理世界的精准模拟

我们让奥特曼来展示一个高难度的滑板动作。

其他的视频生成模型没有办法做到如此精准的物理模拟,确实 Sora 2在运动物理学和身体力学方面有了巨大飞跃。

3)Cameo的个性化娱乐应用

我们让奥特曼赢下整个 NBA 比赛的总冠军。

用户可以将自己植入到任何梦想中的场景,无论是成为超级英雄还是赢得世界冠军。

这也说明了Sora App的核心理念,它不仅是生产力工具,更是为了创造力与欢乐。

6、Sora团队的产品理念

刚开始 Sora团队也曾怀疑和犹豫,担心做一个完全由AI生成内容的社交平台,会削弱真实的人际连接。

然而,在亲身体验了Cameo(客串)全新的、更具互动性和创造性的社交方式,感觉就像发明了一种新媒介。

6.1 产品历程

1)项目初期疑虑与挣扎

在项目初期,整个公司对是否要全力投入开发Sora App这件事是不确定的。因为他们担心与真实的人际连接脱节

2)心态转变

当团队成员开始实际使用 Cameo(客串)功能后,他们发现体验真的感觉不一样了。Cameo功能成为了消除他们疑虑的转折点。

Cameo功能带来的不仅仅是技术上的新奇,更是一种全新的社交连接方式,这种体验甚至让开发者自己都感到惊讶它。

不只是观看内容,而是参与内容。它感觉像一种新媒介,其重要性堪比文字、图片或传统视频的出现。

3)全新的互动模式

当你在Sora App里刷视频时,你的心态不再是被动的消费者,而是主动的创作者:

1️⃣ 即兴再创作

你会思考我能在这个创意的基础上即兴发挥点什么呢?这直接对应了上面我们说的Remix功能。

2️⃣ 即时参与

你会想,我能不能把自己也放进这个视频里去?这正是Cameo功能的核心魅力

6.2 产品理念

Sora App的核心产品理念和具体功能设计,旨在解决当前社交媒体普遍存在的一个问题:社交疏离感。

Sora App的目标是重新加强朋友和家人之间的真实连接。【gzh:和平本记】

与许多越来越媒体化、充斥着陌生人内容的平台不同,Sora App希望通过极低的创作门槛和一系列以连接为中心的功能设计,让用户可以轻松地为彼此创作有趣的内容,从而回归社交的本源

1)Sora App的社交使命,回归连接

现在的社交平台已经逐渐偏离了其初衷,不再是朋友和家人之间紧密交流的圈子,而是变成了更偏向媒体、消费内容的平台。

现在Sora可以重新强化熟人社交,因为它极大地降低了创作的门槛。

过去,创作一个有趣的视频需要很多技能和时间,但现在,只需要一句话就能为朋友创作一个专属的、充满乐趣的视频。这种前所未有的简便性,是促进熟人之间互动和连接的关键。

2)实现连接的具体功能设计

为了将回归连接的理念落地,Sora App在信息流(feed)和功能上进行了一系列专门的设计。

1️⃣ 优先推荐「有连接」的内容

这是算法层面的设计。

Sora App的信息流会重点优先推荐那些来自你朋友、家人等已有社交连接的内容。这意味着你打开App,首先看到的会是你关心的人的创作,而不是算法推荐的陌生网红。

2️⃣提供纯粹的「关注」信息流

为了给用户更多选择,Sora App还提供了一个独立的、永远可用的「关注」信息流。在这个页面里,你只会看到你所关注的人发布的内容,没有任何算法推荐的干扰,保证了信息来源的纯粹性。

img

3️⃣ 赋予用户对内容的控制权

Sora App希望赋予用户对自己信息流内容的主动控制权。

他们目前在测试一个新功能:用户可以根据自己当下的心情或兴趣,主动选择想看的内容类型,比如:

  • 放松模式,如果你想放松,可以选择只看令人舒缓的内容
  • 动物主题,如果你只想看可爱的动物,也可以进行筛选

这个功能让用户从被动接受推荐,变为了主动引导内容,让App更贴合个人的即时需求

Sora App信息流(Feed)的最终理念,赋予用户的主动控制权。

用户可以根据自己当下的心情(如想放松)或兴趣(如只想看可爱的动物),主动引导模型,让信息流展示的内容与个人即时需求完全一致。这是一种更人性化、个性化的内容消费体验。

img

7、Sora App在产品设计上如何短视频平台常见的负面问题

短视频平台有一个很严重的问题,就是沉迷问题。

因此,OpenAI 主动设计了一系列反沉迷机制,旨在放大平台的优点(创造与连接),同时抑制其缺点(无尽的刷视频),特别是对未成年用户采取了更严格的保护措施。

7.1 Sora App 防沉迷

1)设计理念,扬长避短

短视频信息流是展示Sora能力的最佳形式,但他们也清醒地认识到这种形式的潜在危害。【gzh:和平本记】

因此,他们的目标是:

  • 放大优点,鼓励能带来欢乐与创造力的人际连接和互动。
  • 减轻弊端,主动对抗短视频平台常见的负面问题,如用户沉迷、信息茧房等

2)具体的防沉迷和用户保护措施

1️⃣ 针对未成年用户的特别保护

Sora App为18岁以下的用户设立了一套独立的、更严格的政策。对未成年用户,默认关闭无限滚动。

这意味着他们不会陷入无休止的信息流中。

在使用一段时间后,系统会强制出现带有冷却期的暂停时段,提醒和帮助未成年用户休息,防止过度使用。

2️⃣ 针对成年用户的健康引导

对于成年用户,Sora App也设置了干预机制。

如果系统检测到你可能陷入了末日滚动(长时间被动地刷负面或无意义内容)的状态,它会主动介入。

这种介入的方式不是简单的提醒你刷太久了,而是更积极的引导你去创作。

它希望将用户从被动的内容消费者,转变为主动的内容创作者。

7.2 Sora App 安全策略

Sora App为确保平台安全、负责任地运营,有两大核心安全策略:内容溯源和内容审核

一方面,他们通过多种技术手段(如视觉水印)明确标记为AI生成,以防滥用。

另一方面,他们在平台内部署了强大的审核系统,旨在从源头上阻止用户创建有害、不当的内容,特别是针对Cameo功能有极其严格的保护措施。

1)内容溯源

当Sora生成的内容被分享到平台之外(比如其他社交网络)时,能够被清晰地识别出是AI生成的。为了防止这些高度逼真的视频被误认为是真实录像,从而被用于恶意目的。

1️⃣ 视觉水印

这是最直接的方法。当你从Sora App导出视频时,视频会被自动添加一个可见的水印(比如一个Sora的动画标志),让任何观看者都能一眼看出其来源。

2️⃣ 内部追踪技术

除了可见的水印,Sora还有内部的、可能不为外界所见的技术手段。如果团队在互联网上发现疑似由Sora生成的视频,他们有办法追溯并确认其来源。

3️⃣ C2PA标准

这是一个行业联盟及其制定的技术标准。旨在为数字内容附加安全的、可验证的来源和历史信息(元数据)。采用C2PA意味着Sora生成的内容会带有一种数字出生证明,可以通过技术手段验证其真伪和来源。

2)内容审核

审核系统不仅仅是依赖关键词过滤,而是能够更智能地理解用户输入的意图和上下文,从而让用户极难在该平台上创建有害内容。

针对Cameo功能的特别强化保护:

对于Cameo(客串)功能,审核机制是极其重要且严格的,系统会确保没有人能利用他人的Cameo形象来创建色情或暴力不当内容。

最后

这个App的最佳体验是社交性的,需要和朋友们一起玩才能体会到其真正的乐趣。

官方不希望用户下载后发现自己的朋友圈里空无一人。这也是,为什么会采用邀请制。

邀请制的具体操作方式:

当你从候补名单中获得资格后,系统会自动发放4个邀请码给你。这样设计的目的就是为了确保你一进入这个平台,就能立刻邀请你的朋友加入,从而快速建立起属于你的社交圈,获得最佳的初始体验

Sora项目的起源和初衷:

早在2023年初启动时,其目标就不仅仅是生成视频,而是要构建一个能够深刻理解物理世界的AI系统。

Sora 2模型在物理交互、运动力学等方面的巨大进步,正是这一目标的体现。【gzh:和平本记】

让AI理解并模拟物理世界,是实现通用人工智能(AGI)至关重要的能力Sora不仅仅是一个视频工具,它更是通往AGI道路上的一块重要基石。

http://www.hskmm.com/?act=detail&tid=22592

相关文章:

  • 基于python资料挖据的教学监控系统的设计与应用
  • 2025防腐木厂家权威推荐榜:实力品牌与定制服务深度解析
  • 中间件详解与自定义 - 实践
  • 格林达姆 花——季护航2006年-2017年天朝纸媒资料备份(不全)
  • 【Groovy】变量和基本数据类型
  • 2026届模拟/射频IC设计方向保研经验分享
  • 2021 ICPC 沈阳 BEFHJLM(待补
  • Docker容器完全操控指南
  • 【Groovy】Groovy环境搭建
  • 2025年TAB拉链制造商权威推荐榜:创新设计与耐用品质口碑
  • 变量类型
  • 10.1
  • VMware Cloud Foundation 9.0.1.0 发布 - 领先的多云平台
  • velero 备份及使用方法
  • 洛谷月赛T1 P14081 「CZOI-R7」炸弹游戏
  • VMware NSX 4.2.3.1 发布,新增功能概览
  • Claude Code V2集成KAT-Coder
  • Ubuntu 软件源
  • Ceph 分布式存储学习笔记(一):介绍、部署与集群设置(上)
  • 数学学习总结
  • VMware Aria Suite Lifecycle 8.18 Patch 5 发布,新增功能概览
  • P3977 [TJOI2015] 棋盘题解
  • 03. 基本元素
  • 基础整理01:Bode图、PM、GM、极点零点 - 教程
  • [已解决]CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling cublasSgemmStridedBatched
  • VMware vCenter Server 7.0U3w 发布 - 集中管理 vSphere 环境
  • VMware Aria Operations 8.18.5 发布,新增功能概览
  • VMware Aria Operations for Logs 8.18.5 发布,新增功能概览
  • 专题:2025医药行业数智赋能与AI应用全景研究报告|附200+份报告PDF、数据仪表盘汇总下载
  • 喵之勇者败北录