返回

GAN把裤子变成裙子?这波操作骚不骚?

人工智能

早在去年 12 月,Google AI 研究人员就已经开发出一种模型,该模型通过预测对象的大小和位置,把一张输入图像转换为另一张图像,也就是说,它可以把裤子变成裙子。

当然,它也能把短发变成长发、把白天变成黑夜。

无论你喜爱与否,它确确实实做到了,并且它还被评价为当前最前沿的成像系统之一。如果你现在想要测试一下它能否实现任意两个图像之间的转换,那么访问 这里即可体验。

谷歌将其称之为“图像到图像翻译”,这个短语源自于机器翻译,它使用计算机程序把信息从一种语言转换为另一种语言。乍听起来,图像到图像翻译系统似乎只是另一种机器学习算法,对图像执行某种形式的预设变换,本质上还是一个没有自我理解能力的黑匣子。

然而,对于像“把裤子变成裙子”这样原本不可能的操作来说,通常需要人类设计师耗费大量时间才能完成,因为他们需要使用 Photoshop 之类图像编辑软件进行逐像素调整,才能从根本上改变图像的内容。而该系统只需几秒钟就能完成这项操作。这表明该系统并非简单地对图像执行预设变换,而是理解图像并根据变换规则,生成一个新的图像,这个新的图像与原始图像的风格相似。也就是说,该系统可以“理解”所看到的内容,并利用这种理解来改变图像。

该系统的神经网络模型接受了来自网络的数百万张图像的训练。Google 研究人员发现,把图像分割成若干小块,然后让模型学习如何将图像块转换为不同类型的块(例如,把男人变成女人、白昼变成黑夜等),就能很好地完成训练。有趣的是,这个模型从未被告知它必须把裤子变成裙子,也没有被告知如何把裤子变成裙子。然而,它设法学会了如何把裤子变成裙子,这显然是由于它获得了对图像的理解。

这种计算机对图像的理解能力意味着,无论其未来发展如何,必然都会对世界产生重大影响。例如,在医学领域,它有可能通过改变身体扫描结果来辅助医生诊断疾病。在时尚界,它有可能帮助设计师快速创建新服装。在新闻界,它有望让记者通过修改图像来说明事实,而不必担心产生错误信息。

当然,这种技术也存在一些风险。其中一个风险是图像处理软件的专业用户可能会失去饭碗。另一个风险则是这种技术很可能会被用来创建虚假信息,可能给我们的社会带来重大影响。

因此,在研究开发这种技术的未来应用时,我们必须同时解决这些技术所带来的潜在风险。也正是因为这些原因,Google 尚未发布该软件的源代码,而只是在自己的在线演示页面中演示该系统。

虽然这项技术的未来仍然充满了不确定性,但毫无疑问,这种技术正在迅速发展,很可能对我们的世界产生深远的影响。