生数科技联合清华团队推出了视频模型 Vidu 1.5,拥有以下能力:
- 上传多张图片生成视频
- 保证复杂的元素不会变形,例如角色、物体和地点
使用方法
打开 Vidu 的官方网站,你可以直接上手试试看。不过,现在只有三次的免费机会,后面每次试用就会需要消耗 4 个积分。
世超体验
我上传了两张火锅戴头盔的照片,又上传了一张抹茶绿的雅迪电动车,输入提示词:"金毛犬在骑雅迪电动车"。
火锅戴着黑色防风镜,骑上了小电驴,胸前蓝色的挂饰和雅迪的橙色车标都完整的保留了下来。这个一致性效果还是挺惊艳的。
我还换了张乔布斯的大头照,效果也很不错。我让他也和马斯克一样,穿上了军大衣。
硬朗五官配上笔挺大衣,效果还是非常板正的。乔布斯应该也没想到,自己有一天会坐上雅迪的橘色雅座吧。虽然只有正脸照,但是镜头转到侧方的时候,人物的特征还是还原得挺精准。
上面这些都还是单一的人物主体,外加一个场景或者物品。抓取起来还是比较简单。一般来说,我们加入的主体越多,大模型就可能抓取错误。
于是我试了一下上传一张《唐伯虎点秋香》里的经典图,然后要求把脸部替换成我给的另一张图。
它从一堆人的背影里,精准地找到秋香,让她把脸缓缓转过来,微微露出侧脸。虽然没有全脸示人,但眉眼就足够一眼丁真。
我又加上了难度,不仅要替换服装,还要加上动作。让语文课本上的李白和蔡徐坤来个对换:李白穿着背带裤在打篮球。
这次,Vidu 给的效果就相当抽象了。它直接给坤换了个画风,整出了一个动画版。虽说保留的格子裤花纹小细节,足以体现用心。但这个李白 260° 水调大转头,画面实在过于诡异了。也没有完成我输入的【打篮球】的指令。
总结
Vidu 1.5 虽然能抠主体,但是如果动作比较大,或者画面变化比较多,它就容易抓取错误。总体来说,这个模型还是很有潜力的,未来可能会在视频创作领域发挥更大的作用。
发表评论