快手可灵1.6正式上线,他们又一次超越了自己。

2024-12-20 0 304
哈喽,各位小伙伴们!我是山海创业网的小海呀🤩。今天要给大家分享超酷的 AI 视频领域的最新情报哦。临近年末,AI 视频公司们那可是像赶春运似的疯狂更新模型,简直让人眼花缭乱,这测试的速度都快跟不上它们更新的节奏啦,真的是测不完,根本测不完😫。

快手可灵1.6正式上线,他们又一次超越了自己。

就说周二我刚发了谷歌 Veo2 的文章,当时内部测评里除了它亲儿子,可灵 1.5 在盲测中评价最高。结果文章热度还没降呢,昨天登录可灵一看,好家伙,全新的 1.6 版本就跟变魔术似的闪亮登场了。这商业竞争的速度,就像一阵旋风,真实的商战,果然朴实无华(狗头保命🐶)。我二话不说,直接开启疯狂测试模式。

 

可灵网址就在这哦:https://klingai.kuaishou.com/ 。我可是花了好几个小时,按照我的独家测试维度把 1.6 版本仔仔细细地跑了一遍。别看它就涨了 0.1 的版本号,这里面的门道可深了,真的一点都不水哦。而且价格还超良心,5s 的高品质视频跟 1.5 一样,只要 35 灵感一条,这性价比,简直绝绝子👏。

 

这次更新的重点在图生视频方面,那可是有了质的飞跃。我把能力提升点总结成三点,就像是游戏里的升级技能树一样:物理规律真实感大幅提升,人物运动表演更强,语义理解大幅提升。尤其是物理规律和人物动作这两块,真的是让我惊掉下巴,仿佛发现了 AI 视频界的宝藏。这回文生视频、运动笔刷之类的没有特别大的更新,所以测试内容很简单明了:纯测模型的图生视频能力,纯底模无添加无修改,就像一场纯粹的实力大比拼。话不多说,下面就一个个案例给大家展示。

 

🎬一。更真实的物理规律
这一波,可灵 1.6 的物理规律像是开了超级进化挂。以前它可能还在厨房 “炸厨房”,现在都能化身大厨切食物,还能玩虚空倒茶的魔术,甚至能在舞台上翩翩起舞了。前几天谷歌 Veo2 切西红柿的视频在 X 上那可是大火特火,这次可灵 1.6 也不甘示弱,成功接招。我先找了一张图,然后丢到可灵 1.6 的图生视频里,Prompt 是:厨师正在把西红柿切成片。咱先来看看 1.5 版本的切西红柿,那场面,第一刀还凑合,第二刀就开始 “翻车”,出现重影和变形,就像一个新手厨师突然手忙脚乱。但是 1.6 的稳定性,简直强到离谱。1.6 版在切东西的表现上几乎是把 1.5 按在地上摩擦,刀具、食材、切片的物理反馈都精准得像个专业大厨。刀和西红柿的物理反馈堪称完美,刀压下去的力度、西红柿被切开的质感,这物理呈现,我都想给它颁发个 “最佳物理效果奖” 了。对比三个月前的 1.5 还在 “炸厨房”,现在这水平都能去米其林应聘高级厨师了,这进步速度,就像坐火箭一样🚀。

快手可灵1.6正式上线,他们又一次超越了自己。

倒水的效果进步也超明显,比如拿一张水壶的图,然后写一段 Prompt:水壶往水杯里倒茶。1.5 的时候,可灵还像个迷糊的小助手,不能准确识别杯子和茶壶的关系,居然凭空出现第二个壶往盖子上倒茶,那画面,也是让人哭笑不得。但是 1.6 完全不一样,虚空倒茶那叫一个秀,流体的运动表现、杯子跟茶壶口的角度关系上,已经基本符合常理了,就像一个经验丰富的茶艺师在优雅地表演茶艺。

 

还有这两个超可爱的小猫和小狗的案例:猫主子走过沙发,沙发垫就像真的被压下去一样凹了下去;金毛狗撒欢,毛发跟着哗啦啦地飘动,这细节,这物理真实感,简直无敌了。还有这个我超喜欢的小精灵蹦跳,真的有那种跳跃的物理质感了,帽子的甩动也是随着重力飘荡,就像一个灵动的小精灵在魔法世界里欢快地跳跃,帅炸了。

 

再看看人与物理的交互,比如我超爱的电影《楚门的世界》经典的结尾画面。这张图的运动趋势很明显,就是让人走上台阶。但是墙壁上的影子,以及在电影剧情中楚门略带试探的动作,对 AI 视频来说都是超级大难题。我用的 prompt 是:男人有些犹豫和试探地伸出手扶着墙壁,然后一步一步走上台阶,抬头张望。可灵的答卷,简直太完美了。一致性没得说,稳稳当当。走上台阶时膝盖部分的物理规律,以及墙壁上跟着变化的影子,可灵都处理得恰到好处。说真的,这一段稍微后期修一下,感觉真能用在电影里,说不定还能拿个最佳特效奖呢。还有这个蝙蝠侠飙车的 case,压弯那叫一个帅,披风随风飘动完美无瑕。可灵自己补的街景和角度也超棒,这就是可灵 1.6,在当今图生视频领域,可能真的就是那个无敌的 No.1。

 

👯二。人物运动表演加强
可灵之前人物演技不够强的弱点,这次也被狠狠地打上了补丁。首先就是表情这一块,人物的神态细节变化在 1.6 版本里进步超大。比如这个案例:Prompt:女人看到什么,表情不耐烦地皱了皱眉。她无语地翻了一个白眼后走下楼梯。人物的动作变化完全按照 prompt 的顺序来,稳稳当当。而且我感觉 1.6 在表情这块的突破真的有点东西,角色的面部细节、呼吸时颈部肌肉的变化都栩栩如生。我真的是头一次见到 AI 把无语的神态做得这么逼真,还有那一下封神的叹气,这演技,别说内娱了,我感觉去美剧里都能混个角色当当,说不定还能成为下一个美剧巨星呢🌟。

 

还有这个案例:Prompt:火车行驶中。老人低头读报纸,看到某一段文字表情变得很惊讶。两个版本放一块儿对比,那差距简直一目了然。1.6 版本这段眼神变化、情绪表演、环境光照和运动都相当到位,没有一点闪烁。连窗外的内容都稳稳当当。同样的图和 prompt 在 1.5 版本虽然火车和窗外的环境运动速度更快,但报纸的闪烁真的很难忽略,老人表情也完全没跟上剧情,就像一个演员忘记了台词。新版本这波完胜,简直是实力碾压。

 

当然,表演除了面部,肢体动作的表演也超重要。最牛的是:可灵,能跳舞了。我第一个测的是人物肢体比较清晰的芭蕾舞。Prompt:芭蕾舞者优雅地表演旋转舞步。写 prompt 的时候我其实是纯想刁难可灵的,结果第一个测试就被打脸了,它不仅能 “旋转”,居然还给我换了个腿,这操作,太秀了。两个版本直接对比,没啥好说的。1.6 这个物理逻辑、肢体肌肉的表现、画面稳定性都太吓人了,就像一个真正的芭蕾舞大师在舞台上翩翩起舞。肢体表现一上来就这么稳,我就更想上点难度考验一下它,比如测试 AI 舞蹈里的高难度内容:中国古典舞。这个 case 我用来图生视频的是河南卫视《洛神》水下舞的截图。原版的表演当年可是刷爆社交媒体,水下舞和飘带的结合把壁画里的飞天神女在现实里完美呈现。中国古典舞对 AI 视频来说难点超多,不仅要实现肢体上 “跳舞” 的大幅度动作,还得按照物理逻辑,展现水下飘带的运动、环境光照质感等等。这个 Case 对 AI,绝对是一个超级大挑战。先看 1.5 版本的:1.5 其实也很稳了,飘带的表现很出色。可惜还是没有实现真正的 “舞蹈动作”,肢体到后面几秒也没绷住,就像一个舞蹈新手在努力表演但还是有点力不从心。所以在 1.6 版 roll 出来的时候,不夸张地说,我真被吓了一跳:看到舞者手臂扭的第一下,我就懵了。然后,还不止挥手臂一次,真能跳舞啊?这个肢体的动作幅度、这个物理、这个光照表现…… 可灵你确定只更新了 0.1 版本?虽然只有短短几秒,但人物肢体动作幅度很大,而且几乎没有太大的错误,连衣服的一致性都很好。除了飘带确实有点不稳,其他都做得像模像样。别问我觉得牛不牛,问就是牛炸了。说真的,这个 case 跑出来,我感觉可灵还能在国产 AI 视频的王座上,稳稳坐江山,其他竞争对手想要撼动它的地位,可得好好努力了。

 

💬三。语义理解加强
可灵自己在 1.6 的标注上写的第一个就是 “提示词响应大幅提升”。所以基于语义,那必须先来个连续动作测试:Prompt:女孩摘下眼镜,拥抱一只朝她跑来的小鹿。小鹿是完全在画面外的,摘下眼镜、拥抱小鹿。这个稳定性,太强了,整个主体都很稳,唯一的小瑕疵是后面的背景的鹿,因为太多,有一点扭曲,但是也已经很棒了。还有这个语义理解完成度很高的 case:Prompt:右边的男人后退一步,举起枪,枪口对着左边男人的额头。镜头迅速拉远,拍摄他们站在天台上。这次可灵测下来,我感觉不仅是语义理解,它对上传图片的画面理解进步也很大。基本每次都能准确识别我说的 “左边” 和 “右边” 的主体具体是哪个,真的是听得懂人话。比如这个 case 里,识别人物站位正确,并且让右边的角色 “后退一步,举起枪,枪口对着左边男人的额头”。这一连串的动作实现的顺序、动作自然程度也完全 OK,非常炸。除了最后大幅度的运镜有点遗憾,但是等上线控制运镜的功能,我觉得也就不是问题了。再比如这个风暴兵和小坐骑的 case,prompt 是:主人公骑着坐骑前行,然后跳下来自己在地面上走路。从坐骑背上跳下来的动作逻辑非常 OK,除了跳起来那一下脚有一点点没绷住,其他都很好。整体来看,可灵 1.6 的进步,真的是无需多言,就像一个学霸又在考试中拿了满分,让人不得不佩服。

 

好啦,今天关于可灵 1.6 的分享就到这里啦,小伙伴们是不是也被它的强大功能惊艳到了呢?咱们下期再见咯,记得持续关注山海创业网,更多精彩资讯等你来哦😘。

山海创业网 资讯分享 快手可灵1.6正式上线,他们又一次超越了自己。 https://www.shanhaichuang.com/2024/12/20/2786.html

常见问题

相关文章