让李白换装背带裤这个清华大佬脑洞大开

科技资讯 2024-11-15 19:36:17 浏览次

生数科技联合清华团队推出了视频模型 Vidu 1.5，拥有以下能力：

使用方法

打开 Vidu 的官方网站，你可以直接上手试试看。不过，现在只有三次的免费机会，后面每次试用就会需要消耗 4 个积分。

我上传了两张火锅戴头盔的照片，又上传了一张抹茶绿的雅迪电动车，输入提示词："金毛犬在骑雅迪电动车"。

火锅戴着黑色防风镜，骑上了小电驴，胸前蓝色的挂饰和雅迪的橙色车标都完整的保留了下来。这个一致性效果还是挺惊艳的。

我还换了张乔布斯的大头照，效果也很不错。我让他也和马斯克一样，穿上了军大衣。

硬朗五官配上笔挺大衣，效果还是非常板正的。乔布斯应该也没想到，自己有一天会坐上雅迪的橘色雅座吧。虽然只有正脸照，但是镜头转到侧方的时候，人物的特征还是还原得挺精准。

上面这些都还是单一的人物主体，外加一个场景或者物品。抓取起来还是比较简单。一般来说，我们加入的主体越多，大模型就可能抓取错误。

于是我试了一下上传一张《唐伯虎点秋香》里的经典图，然后要求把脸部替换成我给的另一张图。

它从一堆人的背影里，精准地找到秋香，让她把脸缓缓转过来，微微露出侧脸。虽然没有全脸示人，但眉眼就足够一眼丁真。

我又加上了难度，不仅要替换服装，还要加上动作。让语文课本上的李白和蔡徐坤来个对换：李白穿着背带裤在打篮球。

这次，Vidu 给的效果就相当抽象了。它直接给坤换了个画风，整出了一个动画版。虽说保留的格子裤花纹小细节，足以体现用心。但这个李白 260° 水调大转头，画面实在过于诡异了。也没有完成我输入的【打篮球】的指令。

Vidu 1.5 虽然能抠主体，但是如果动作比较大，或者画面变化比较多，它就容易抓取错误。总体来说，这个模型还是很有潜力的，未来可能会在视频创作领域发挥更大的作用。