桂工网
gxworker.org.cn
广西职工的网上家园
AI文生视频效果“炸裂” 未来扔一部小说出一部大片?
来源:    作者:吴涛 吴家驹    发表时间:2024-02-26 17:33:53
摘要:扔进去一段文字,分分钟生成“大片”级别的视频内容?近日,OpenAI发布首个视频生成模型Sora,随即引发关注。

  扔进去一段文字,分分钟生成“大片”级别的视频内容?近日,OpenAI发布首个视频生成模型Sora,随即引发关注。

  在短视频流行的今天,这意味着什么?又将带来哪些影响?

  AI生成视频效果“炸裂”

  几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走近,一个毛茸茸的小怪物跪在融化的红蜡烛旁边,女子在街头漫步……OpenAI称,这些几乎可以乱真视频均由Sora直接生成,未经修改。

  根据OpenAI的官方简介,Sora可以制作长达60秒的视频,视频包括高清晰度的场景、复杂的镜头动作,并可支持多个角色的创作。

  OpenAI称,该模型不仅能理解用户在提示中提出的要求,还能理解这些事物在物理世界中是如何存在的。

  Sora目前暂未对外开放使用,但是对于已公开视频的“炸裂”效果,不少网友给出好评,同时不忘模仿一些“大厂”的口吻进行调侃:我们早就布局,希望Sora赶紧开源。

  很多网友也充满期待:“我想看一下什么才是真正的万剑归宗!”“我想看微观的蚂蚁洞穴到底长什么样!”

  扔一部小说出一部大片?

  除了生成的画面更接近现实物理世界,OpenAI介绍,Sora可以实现视频中的主题始终保持一致,即使暂时离开视野也不会发生变化,并可以一次性生成多机位视频。

  基于这样的技术,已有网友设想,用多个1分钟视频连接起来生产一部微短剧甚至电影,同时保证其主题不变。“扔一部小说出一部大片”将成为现实。

  国盛证券17日发布的研报显示,Sora相比此前其他文生视频模型,已经跨越到实用生产力工具,1分钟长度有望大规模应用在短视频领域,扩展视频的能力也有望制作长视频。

  360创始人、董事长周鸿祎近日公开对此表示,这意味着AGI(人工通用智能)实现将从10年缩短到1年。

  当然,Sora也并非毫无弱点。OpenAI称,它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。例如,一个人咬了一口饼干,但之后饼干可能没有咬痕。

  此外,该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

  一夜“干翻”影视拍摄和剪辑?

  但另一方面,担忧的声音也在网络占有一席之地。

  分分钟生成媲美“大片”的视觉质量,视频拍摄者和剪辑人员是否已显得“多余”?以后演员会不会消失?是不是可以喜欢谁让谁来当主演?

  类似“开脑洞”的想法,或许已经离现实不远。

  有观点认为,Sora有可能一夜“干翻”视频剪辑和拍摄人员,以后要比拼谁的创意好。有证券公司研报就称,这是文生视频的里程碑事件,有可能带来内容创作产业革命。

  清华大学新闻与传播学院教授沈阳接受记者采访时称,Sora对影视相关的产业影响比较大,它能大幅拉低制作成本,如果普遍使用的话,成本至少可以是原来的十分之一,所以Sora对视频、游戏、教育等行业都会带来比较明显的影响。

  DCCI互联网研究院院长刘兴亮认为,传统影视制作流程和商业模式,也可能被迫转型。但他同时指出,这是一个与AI携手共舞的机会,探索新的艺术形式和表达方式,续写影视行业的辉煌。

  刘兴亮表示,Sora是给内容创作者的超级大礼包,不仅可以降低成本、加速创作,还能让观众的视觉体验丰富到爆表。AI未来的画卷,将比我们想象的还要精彩。

  周鸿祎则认为,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。

  如何应对AI可能带来的风险?

  此外,也有声音认为,这一新技术可能会带来一系列风险乃至社会问题。

  刘兴亮指出,AI内容制作,让现实与虚拟的界线变得模糊。内容真实性、版权、隐私、数据、安全等问题纷至沓来。社会需要一套完善的政策、法律和伦理规范来应对,确保技术发展不脱轨,保护每个人的利益。

  对此,OpenAI称,在将Sora应用于OpenAI的产品之前,将采取几个重要的安全措施。相关领域专家将对模型进行对抗性测试。公司还在开发一些工具来帮助检测误导性内容,例如检测分类器,它可以分辨出视频是不是由Sora生成的。

  OpenAI还称,将与世界各地的政策制定者、教育工作者和艺术家接触,以了解他们的担忧,并确定这项新技术的积极应用案例。尽管进行了广泛的研究和测试,但公司无法预测所有人使用公司技术的有益方式,也无法预测所有人滥用技术的方式。

  值得注意的是,OpenAI去年就曾发布公告,宣布启动全球招募“红队”网络成员,旨在引入外部力量,提前挖掘出AI系统存在的缺陷和风险。

  而在此之前,已有相关领域专家呼吁,国际社会应共同推进人工智能监管,以确保其安全性。

  2023年11月,包括中国、美国、英国和欧盟成员国在内的28个国家和地区,在首届人工智能安全峰会上签署《布莱奇利宣言》,同意协力打造一个“具有国际包容性”的前沿人工智能安全科学研究网络,以对尚未被完全了解的人工智能风险和能力加深理解。

  延伸阅读:AI入局动画行业会替代人类吗?

  □童笑雨

  2月19日,AI生成的《西游记》动画短片在网上热传,其通过AI生动呈现了《西游记》中从石猴降生到拜师学艺的故事。从天庭到花果山,视频展现的场景,细致入微。

  据该动画短片的制作者介绍,用AI生成视频仅需四步:构思、用文字生成静态图片、让图片动起来、整理剪辑。在网友为视频的精致、AI的高效所震惊的同时,一个问题也随之而来,AI入局动画行业,未来会取代人类吗?

  “AI的发展速度超乎我的想象,真的是一日千里。”浙江传媒学院动画与数字艺术学院院长、教授丁海祥坦言,从目前来看,取代还谈不上,但它会“解放”大量创意,给传统简单人力的创作工作带来巨大威胁。“缺乏系统性的原创力,是目前AI的致命弱点。作为大模型工具,它需要提示和组织,如果创作者没有足够创造力,只会简单技术,就一定会被AI淘汰。”

  杭州若鸿文化股份有限公司总经理吴俊从事动漫工作已近10年,他所在的公司前几年就已将AI引入到动漫制作中。“其实整个行业都有用到AI,我们只能拥抱它,况且AI对工作效率的提升很明显。”

  他举了个例子,起初一部动漫的美术设定需要由20多人的团队耗时2个多月才能完成,现在有了AI,5人团队用2至3周时间就能解决,绘画水平超越有10年画龄的画手。但缺陷也较为明显,画风风格有限,且只是简单的形象设计,未达到作品的地步。

  事实上,这个缺陷正在被攻破。2月16日,全球明星AI创业公司OpenAI发布了文生视频模型Sora。通过简单的文本指令,AI便能生成长达1分钟的多镜头长视频。记者看到,在Sora生成的视频中,不仅场景真实,角色毛发飘动都极其顺畅自然。

  “这是‘核爆’级别的作品,震撼程度远超想象。”吴俊说,相信Sora在不断融合人类作品后,风格会越来越多样,且它输出的不再是一个简单的形象,而是完整的作品,实现了美术、演绎、剧本、视效“一条龙”服务,就像有一整个团队制作一样。

  制作快、品质不低、制作成本低,AI入局动画、影视行业是大势所趋。作为影视大省,2020年起,浙产动画片产量和推优数量多次居全国第一。在AI冲击下,浙江动画行业如何应对?该如何培养人才?

  吴俊认为,在算法感知的这个陷阱下,虽然AI介入了,但创意仍是重中之重。“AI就是学习工具。什么东西它是学不会的?那就是没有被创造过的东西。”

  这也倒逼动画、影视行业的人员变革。他说,在未来,复合型的跨专业人才在行业内会更具竞争力。若只会画画,没有创作能力,不理解剧本的要点,可能就会被淘汰。

  丁海祥认为,AI入局,并不意味着高校不需要培养动画人才了。密集技术劳动、简单重复制作是目前AI的优势,动画的内容方向选择、核心创意立意、关键美术风格以及审美选择还是要靠人的思考。以前高校更注重学生专业技能的培养,教他们的是如何把想象的内容付诸实践,未来,要教授学生更宽广的素养知识和审美能力。

  “好比是同样几件衣服,不同审美有不同搭配,搭配能力强、审美能力强的人,效果越出彩。”他说,当前该校已将AI引入教学中,但在未来本科人才的培养过程中,一方面要引导学生积极使用新技术,一方面要控制学生不动脑子地投机使用AI,要教授学生“下限”知识,即审美能力和使用工具强化自身创意的方式、方法,这既是AI目前的短板,也是学生目前接触AI容易进入的陷阱。

  目前,最先进的文本生成视频工具Sora,已经具备了线性思考和构建模拟世界的能力,性能远超早期的文本生成视频工具。丁海祥说,这已不是简单的文本生成视频大模型工具,而是元宇宙到来的先决条件。作为高校相关专业教育者,未来一定要积极拥抱和关注最新技术的应用和进展。同时,将高校专业学习紧密融入到新技术发展的进程当中,以期培养的人才能第一时间和新技术无缝衔接,在变革到来之时,真正培养出有AI时代特征的复合人才。

  (来源:中国新闻网)


用手机扫二维码分享