05′21″
新闻透视

视频 | 新闻透视:Sora爆火 国产大模型如何迎头赶上?

新闻透视

看看新闻Knews记者金普庆 汤捷

2024-02-26 15:05

继聊天机器人ChatGPT之后,近日,由美国人工智能团队OpenAI发布的“文字生成视频”大模型Sora,再度引发热议。进阶的人工智能,展现了哪些新技能,又会如何影响传统行业?Sora爆火的背后,国内的大模型企业,如何缩小差距、迎头赶上?



冰雪中徒步的大象、神秘莫测的海底世界、活泼可爱的萌宠……这些场景逼真、形象栩栩如生的视频,都出自人工智能的创作。由美国人工智能团队OpenAI推出的首款“文字生成视频”大模型Sora,在发布了第一波视频后,就让不少网友惊呼:“眼见为虚”的时代来了。“让我觉得比较惊讶的一点是,它对一些细节的真实度,已经到了我觉得是可用的地步。”“特别符合物理的世界,这个是让我特别惊艳的,它对真实世界描绘的这块工作,真的做得非常细致。”



大模型Sora带给人的震撼,一方面在于它可以把文本生成为一段60秒的视频,还能分切镜头,而在此之前,全球能实现文本生成视频的20多个大模型产品,能生成的视频长度一般都仅在十秒以内,且运镜也相对单一。另一方面则在于,它生成的视频,还能模拟物体的移动和相互作用等真实物理世界的运动,这也被视为距离实现通用人工智能更近了一步。


据上海人工智能研究院总监皇甫秉京介绍:“这次又额外加入了虚幻引擎的这些资产,虚幻引擎其实可就像是对于整个世界的具体的建模,包括一些物理的特性,但是依然像就是属于生成式的,它并不是真正理解里边的物理规律,而是说通过概率的方式然后去预测,下一帧画面应该是什么。”



不过,即便是Sora生成的视频也并不完美,仍会有些不符合物理学规律的内容。要真正实现文生视频内容的商业化落地,也还要克服生成内容不可控等多项挑战。但是在可见的未来,日益聪慧的人工智能显然会让不少行业发生一些根本性的改变。


智象未来公司创始人兼首席执行官梅涛称:“商拍环节完全用人工智能来取代了,比方说原来如果一个商家想上线一款产品,基本上我们要请一个专业的摄影师,来搭一个摄影棚来拍摄的话,这个周期是很长的,成本也是挺高的,而现在通过人工智能的赋能,效率提高100倍,那成本就应该降低100倍。”



事实上,不少国内的科技企业,也早就开始在这一赛道做出探索。今年1月,字节跳动就发布了其超高清文生视频模型。在上海,位于徐汇“模速空间”大模型创新生态空间内的智象未来,自研的通用视觉多模态大模型,也能根据用户输入的文字生成图片、再选择图片生成出一段15秒的视频。


但业内人士也坦言,对标国际头部企业,国内的大模型仍存在不小的技术差距。国内企业要迎头赶上,既要集聚人才、集中资源,加大对关键技术的研发投入;也要加快行业生态建设,推动产品和应用创新。



上海市人工智能行业协会秘书长钟俊浩表示:“要根据现在长三角、上海所具有的完善的整个产业链、完善的整个产业组织、在这个基础上,是结合各项垂类应用去做好。”


技术加速创新的同时,人工智能的发展还面临哪些挑战?作为国内人工智能产业重镇,上海要如何继续发力和突破?来听记者的观察。


AI聊天、AI绘画、AI创作视频等,近年来,一系列人工智能生成内容的相继问世,让人们领略到人工智能技术的迅猛发展和广阔应用前景。作为上海着力发展的三大先导产业之一,围绕着人工智能产业的创新和治理,上海也在积极探索。



比如,在徐汇,上海已经建立起全国首个以大模型、产业生态集聚发展为功能定位的产业生态空间,集聚了全国近25%的大模型企业和项目。


当然,人工智能技术带来许多新机遇的同时,也不可避免带来了一些前所未有的挑战。其中,人工智能生成的内容可能带有欺骗性,被认为是全球共性的问题。也许就会有一些不法分子利用AI 深度伪造新工具实施电信诈骗、散布虚假视频等,带来诸多风险,"真假难辨"的问题将更加凸显。另一方面,数据获取的方式如何确保其合理合法,也是另一大挑战。



也因此,在推动产业高速发展的同时,上海也已经在同步推动大模型相关治理的研究,探索大模型评测,试点沙盒监管,在健全法规体系、标准体系、监管体系等方面,努力形成有上海特色的上海方案,为构建全国人工智能治理模式先行先试。


不管怎么说,现阶段,Sora的出现,已经让世界看到了人工智能的无限可能,很多科幻电影中的未来,正在渐渐成为现实,人工智能产业的发展依旧未来可期,上海,准备好了吗?

编辑: 尤颖慧
责编: 李吟涛
相关推荐 更多精彩内容

暂无列表

APP 内打开
打开看看新闻参与讨论