GAN把裤子变成裙子？这波操作骚不骚？

2024-01-09 15:01:40

早在去年 12 月，Google AI 研究人员就已经开发出一种模型，该模型通过预测对象的大小和位置，把一张输入图像转换为另一张图像，也就是说，它可以把裤子变成裙子。

当然，它也能把短发变成长发、把白天变成黑夜。

无论你喜爱与否，它确确实实做到了，并且它还被评价为当前最前沿的成像系统之一。如果你现在想要测试一下它能否实现任意两个图像之间的转换，那么访问这里即可体验。

谷歌将其称之为“图像到图像翻译”，这个短语源自于机器翻译，它使用计算机程序把信息从一种语言转换为另一种语言。乍听起来，图像到图像翻译系统似乎只是另一种机器学习算法，对图像执行某种形式的预设变换，本质上还是一个没有自我理解能力的黑匣子。

然而，对于像“把裤子变成裙子”这样原本不可能的操作来说，通常需要人类设计师耗费大量时间才能完成，因为他们需要使用 Photoshop 之类图像编辑软件进行逐像素调整，才能从根本上改变图像的内容。而该系统只需几秒钟就能完成这项操作。这表明该系统并非简单地对图像执行预设变换，而是理解图像并根据变换规则，生成一个新的图像，这个新的图像与原始图像的风格相似。也就是说，该系统可以“理解”所看到的内容，并利用这种理解来改变图像。

该系统的神经网络模型接受了来自网络的数百万张图像的训练。Google 研究人员发现，把图像分割成若干小块，然后让模型学习如何将图像块转换为不同类型的块（例如，把男人变成女人、白昼变成黑夜等），就能很好地完成训练。有趣的是，这个模型从未被告知它必须把裤子变成裙子，也没有被告知如何把裤子变成裙子。然而，它设法学会了如何把裤子变成裙子，这显然是由于它获得了对图像的理解。

这种计算机对图像的理解能力意味着，无论其未来发展如何，必然都会对世界产生重大影响。例如，在医学领域，它有可能通过改变身体扫描结果来辅助医生诊断疾病。在时尚界，它有可能帮助设计师快速创建新服装。在新闻界，它有望让记者通过修改图像来说明事实，而不必担心产生错误信息。

当然，这种技术也存在一些风险。其中一个风险是图像处理软件的专业用户可能会失去饭碗。另一个风险则是这种技术很可能会被用来创建虚假信息，可能给我们的社会带来重大影响。

因此，在研究开发这种技术的未来应用时，我们必须同时解决这些技术所带来的潜在风险。也正是因为这些原因，Google 尚未发布该软件的源代码，而只是在自己的在线演示页面中演示该系统。

虽然这项技术的未来仍然充满了不确定性，但毫无疑问，这种技术正在迅速发展，很可能对我们的世界产生深远的影响。