OpenAI又一次引爆朋友圈

我们春节假期还没结束,OpenAI发布的一个新的消息就引爆了我的朋友圈和微信群。在2月16日,OpenAI发布了他们的文字生成视频的AI模型-Sora。

OpenAI又一次引爆朋友圈

过去两年无疑是生成式AI日新月异地发展的两年,先是ChatGPT的火热出圈让生成式AI从实验室和普通商业场景直接进入到普通人的视野。而MidJourney和DALLE等文字生成图片的产品又带火了一波图片生成浪潮。紧接着就是Runway和Pika让文字生成视频开始变得火热,尤其是Pika因为是上市公司二代加上学霸属性更是在国内一时间变成了热门话题。

而在我们还在春节假期的时候,先是谷歌发布了自己新的一代生成式AI模型Gemini 1.5 Pro,紧接着OpenAI就不甘落后的发布了自己的文生视频模型Sora。而Sora的发布,直接把热度拉满,也让Google的发布变得有些个灰头土脸。因此有人就说OpenAI显然是故意在砸谷歌的场子。

作为利用AI生成内容创业的从业者,我也一直在关注相关的技术的进步和发展。在Runway和Pika发布的时候,公众号作者卡兹克都专门写过文章去介绍他如何用Runway和Pika制作视频。不过这两个视频生成产品目前还仅仅是能生成三秒左右的视频,完全还不具备在生产中当做效率工具使用的基础。但是Sora则直接把生成长度提高到了60秒,而且生成的视频结果非常的稳定。

比如:

这个视频的prompt是:

The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.

大家有兴趣可以去https://openai.com/sora去查看官方生成的一些其他视频。因此有人就感慨,OpenAI又要拍死一众文本生成视频的公司了。

不过Sora现在还没有开放使用,有兴趣的可以在X上给Sam Altman发Prompt。Sam Altman现在正在接单接地不亦乐乎。在他的X下边已经看到了非常有意思的一些生成视频的内容。比如:

OpenAI又一次引爆朋友圈

估计不久的将来,我们就有机会可以去真正亲身体验Sora带来的效果了。

最近几年生成式AI的发展,对于相当一部分的知识劳动者都带来了新的挑战。正向的影响是这些生成式AI产品能够大幅度提高内容生成的效率,同时让更多普通人具备了相对专业的内容生成的能力。而负面影响则是专业工作中普通的一群人就会面临工作被替代的风险。

文本生成视频的发展,会让视频制作的门槛显著降低,大家只需要有想象力,可能就能生成一部效果还不错的视频短片。曾经制作视频所需要的很多专业技能可能就变得不那么重要了。

不过按照目前AI的水平,AI还是不能替换人类。就我们自己创业做的这个产品来讲,文本生成文字内容无疑是生成式AI中最成熟的应用场景了。但是真正要把它和业务结合,对业务有价值,还是有很长的路要走。比如我们不得不引入搜索内容增强来克服生成式AI的幻觉问题,而就算有了这些基础,在一些互联网知识相对缺乏的场景中,生成的博客内容仍旧远远不能令人满意。比如有一个客户利用我们产品写癌症相关的一些内容,就发现写出来的内容与他想要的目标差距甚远。最终不得不去做很多的人工修正。

回到这次Sora的发布,无疑是AI生成内容的一个新的里程碑。从更广泛的意义来讲,人类之所以成为人类是因为人类有交流的语言,而文本则是语言的信息载体。在生成领域,我们先是有了文本生成文字内容的突破,然后就是文本生成图片,现在有了文本生成视频的突破。对于生成式AI来讲,这基本上在几个核心领域都有了突破式的进展。让我们拭目以待未来内容创作领域的翻天覆地的变化吧。

来源公众号: 老阎杂货铺(ID:gh_59d2a9b32af1)分享一些个人的技术的研究。

本文由 @老阎杂货铺 原创发布于奇赞平台,未经许可,禁止转载、采集。

该文观点仅代表作者本人,奇赞平台仅提供信息存储空间服务。

(0)

为你推荐

发表回复

登录后才能评论
李坤锦
公众号
视频号
小程序