暖风文章网 手机版
您的位置: 首页 > 实时讯息 >

AI生成视频用文字难以描述需求,如何破?

0次浏览     发布时间:2025-04-15 19:49:00    

中新经纬4月15日电 (常涛)用户在用AI工具生成图片尤其是视频时,普遍会遇到用文字难以描述的情况。

快手高级副总裁、社区科学线负责人盖坤15日在北京表示,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性以及用户复杂创意的精确传达上仍有“很多挑战”。

“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤说。

当日,快手发布可灵AI全新2.0模型,包括可灵2.0视频生成模型及可图2.0图像生成模型。其中,在本次2.0模型的迭代中,可灵AI发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。

盖坤介绍,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,精准实现AI创作者们的创意表达。

基于MVL理念,可灵AI推出多模态编辑功能。“用户可以在可灵AI的平台上体验多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW将不只局限于图片和视频,也可以引入其他模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

快手副总裁、可灵AI负责人张迪介绍,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。

据快手方面介绍,截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自2024年6月上线至今的10个月时间里,可灵AI已累计完成超20次迭代,月活用户数量增长25倍。

(更多报道线索,请联系本文作者常涛:changtao@chinanews.com.cn)(中新经纬APP)

中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其他方式使用。

责任编辑:魏薇 李中元

相关文章
金木土石布齐聚 文博会创意昆明馆非遗美学空间体验展邀你玩转非遗 捏一个瓦猫或制作一件陶器、描绘一幅掐丝珐琅彩画,制作一艘小船摆件、一个风筝、一个香囊或一个葫芦包,体验一回刺绣、植物染或扎染,参与互动集章活动,欣赏精美的云南斑铜和古船船模,这些体验都将在2025创意云南文化产业博览会创意昆明馆新型非遗美学空间体验展区真实呈现。9月17日至21日,以“智汇云南 创意
2025-09-15 19:15:00
“于朦胧坠楼身故”,微博最新通报:60余个账号被禁言或关闭 9月13日晚,@微博管理员 通报关于演员于朦胧坠楼身故一事后,多账号违规行为。近日,演员于朦胧坠楼身故一事引发社会各界广泛关注,悲剧的发生令人痛心疾首,广大网友也纷纷用自己的方式哀悼逝者愿其安息。但站方发现,在警方已排除刑事嫌疑后,有个别用户为博流量、蹭热度,刻意发布无事实根据信息、炮制阴谋论,甚至
2025-09-14 00:13:00
微视频|“福尔摩斯”带你追踪监测污水中看不见的病毒 视频以“福尔摩斯”式的洞察疑点证据的视角探究如何捕获污水中看不见的病毒,包括污水厂中污水采集和实验室检测等全流程工作,使公众了解和学习其中的实验理论、科学方法以及防护技能,以实现提升公众科学素养的目的。关注河北新闻网,了解河北最新新闻。
2025-09-10 14:01:00
第四代逸动7.29万元起售 杨大勇:把油电选择权交给用户 “也许有人会问,老杨前天晚上就在这个舞台发布了启源A06,夸电动车有多好,启源A06有多哇塞和不可思议;今天还是在这块场地发布长安第四代逸动,又给油车做营销,到底选油车好还是选电车好?”履新长安汽车执行副总裁的杨大勇对此给出了答案,把油电选择权交给用户。9月7日,在第五届长安科技生态大会期间,长安第
2025-09-08 10:33:00
盒马NB今起升级成“超盒算NB”,门店数已近300家 8月29日,盒马旗下平价社区超市盒马NB正式更名为“超盒算NB”,其中NB代表Neighbor Business,意为“邻里商业”。品牌升级之后的新店在苏浙沪10个城市集体亮相,一共开出17家新店,并新进入了宁波等城市,在多地掀起一股硬折扣的消费热潮。截至8月底,超盒算NB(含陆续更名的原盒马NB门
2025-08-29 10:16:00