OpenAI在上周推出了最新一代视频生成模型 Sora 2,并同步上线了一款名为 Sora的iOS社交应用。萨姆·奥尔特曼称其为“ChatGPT for Creativity时刻”。
他在X平台的长文中写道:“这感觉既有趣又新鲜,从想法到结果的过程变得快速而轻松,同时也会产生新的社交动力。”这句话揭示了OpenAI的野心——不仅要在技术上推动视频生成模型的前进,还要直接杀入以TikTok所代表的短视频社交领域。
奥尔特曼可能认为,依托Sora 2 强大的 AI 视频生成能力能够强化其社交属性,使用户在创作、分享和互动中形成完整的社交生态。毕竟,与早期的 Sora 相比,Sora2能够生成更高质量的片段,支持动作和物理规律的真实模拟,避免了以往模型中常见的物体变形和时序不一致问题。
同时,Sora2的多模形态支持的内容范围也更广,可以在真实、写实和动画风格之间切换,还能生成包含对白、背景音效和音乐的多镜头视频。在发布的宣传视频中,我们可以看到Sora 2 在动作、物理智能和身体机制方面的确实现了巨大飞跃,呈现出“好莱坞大片般的高成本制作效果”。在演示中,奥尔特曼和团队成员甚至出现在月球、北极摩托艇以及骑乘巨龙的场景中,均由 AI 自动生成。
但是,这种技术优势能否转化为对TikTok的平台竞争力?与 TikTok 拥有数十亿级别的活跃用户群体和完善的推荐算法不同,OpenAI的Sora是从零起步,缺乏明确的算法指引,也没有任何现成的内容和社群基础。
更为关键的是,Sora 的定位是“纯 AI 视频”,用户不能直接上传相册或拍摄的视频,所有内容必须由模型生成。这一选择本意是为了降低深伪和版权风险,但同时也可能限制用户的参与度度与内容的多样性。对于习惯于用真实生活片段记录和分享的用户来说,一个完全由 AI 构造的内容平台是否能长期留住他们,是一个巨大的疑问。
此外,Sora 的版权争议由来已久。一直以来,经纪人和电影公司因担心其版权作品将可能被用于生成内容,纷纷要求OpenAI下架其作品。
虽然 OpenAI 强调不会在未经允许的情况下生成公众人物的肖像,以避免政治深伪和名人肖像侵权,但这种“默认使用+主动下架”的政策依旧可能引发好莱坞和大型版权方的反弹。事实上,迪士尼已经明确选择退出,不允许其内容在该平台出现。对于一个需要依赖丰富影视文化素材吸引用户的社交平台而言,Sora2的内容生态极其受限。
用户安全与内容审核也是另一道难题。奥尔特曼一直认为社交平台存在沉迷和霸凌的风险,并警告 AI 视频生成可能会通过学习和模仿生成一大堆“垃圾视频”。
为此,OpenAI 声称采取了保守的策略,包括在强制添加水印和提示标注、在推荐系统中优先显示用户社交关系的内容,避免无用的内容无限滚动,并为青少年用户设置每日使用上限和家长控制功能。这些措施无疑展现了与 TikTok “算法上瘾”逻辑不同的设计初衷,但如此的保护机制似乎难以转化为平台流量。
同时,技术的边界也限制了 Sora 2 的竞争力。虽然官方演示令人眼前一亮,但目前视频时长上限仍为 10 秒,并且偶尔会出现“幻觉”,例如角色口音错误或场景逻辑不合。
而目前包括 TikTok和抖音的AI生成式视频可以长达数分钟,而且视频创作的风格已经从技术派转向故事流,始终强化的是AI视频的社交与娱乐属性。
而技术派的奥尔特曼仍坚称Sora2的视频是“从文字、表情符号再到语言的自然演进”,这种非娱乐化的沟通方式和运营理念似乎难以能支撑一个大规模的社交平台。
与此同时,竞争对手并未停下脚步。Google 已经将Veo 3视频生成器整合进YouTube Shorts,Meta 刚刚推出了名为“Vibes”的AI视频动态,TikTok 很早就已经可以提供将图片与文字提示转化为视频的功能。在这种情况下,Sora2或许可以证明自己能提供更高质量的生成,但却难以说服用户放弃熟悉的平台而转向一个尚未成型的新生态。
换句话说,Sora 2是否会成为真正意义上的“ChatGPT for creativity”,将取决于它能否跨越从“炫技视频”到“用户日常”的使用鸿沟。在短视频这一全球竞争最激烈的赛道上,OpenAI 需要的不只是一个强大的生成模型,更需要一个能改变用户行为的完整生态。