达摩院视觉AI能力大揭秘,网友:这波抠图玩儿大发了!
2023-12-17 18:21:44
从达摩院成立起,外界一直对这个阿里“神秘机构”十分好奇。造福人类、世界第一、高端、神秘……这些令人惊叹不已的元素也让我们对达摩院的技术专家产生了浓厚的兴趣。
在世人眼中,达摩院人才济济,多是奇人异士,他们进行着神秘且高端的科研。谁曾想到,这群像扫地僧一般的专家居然做出了一个百宝箱——阿里云视觉……
对于达摩院视觉AI能力,普通人或多或少有些了解。近日,其发布的一段AI抠图视频让很多网友直呼“这波抠图玩儿大发了”。
在这个视频中,达摩院专家运用视觉AI能力,对影视作品《大话西游》进行了一段无厘头的换脸,唐僧由吴孟达来演,八戒竟由李玉婷饰演,种种经典名场面令人忍俊不禁,还不禁对达摩院AI抠图能力赞叹有加。
很多人疑惑,这种看起来十分低级的换脸操作,是如何俘获网友心?其背后技术原理究竟藏着什么秘密?
达摩院技术专这样解释:AI换脸本质是一种图像融合技术,由图像融合中的A和B两幅图像进行特定的融合,进而合成出一张新的图像。
而它目前广泛应用在影视、游戏等领域,除了换脸还能进行其它丰富有趣的视频编辑、图像编辑。譬如视频美妆、视频修复、摄影换肤,甚至还能对图像进行故事延申,使其从单张平面照进化成短视频……
在达摩院视觉AI技术加持下,图像融合竟从难到易、从繁到简、从高端到低端。
此外,达摩院还发布了一些颇具实用意义的资料,如《视觉AI技术支撑虚拟形象真实感塑造》以及《视觉 AI 数字世界交互形态解析》等文章。
其中,“视觉 AI技术支撑虚拟形象真实感塑造”,深刻阐释了视觉AI如何塑造具备真人虚拟形象,使其在虚拟世界栩栩如生。
“视觉 AI 数字世界交互形态解析”則重点解析了视觉AI技术是如何构建一个沉浸式、人性化的交互界面的。
除了这些,达摩院还发布了一系列视觉 AI 技术产品。据公开资料显示,其中就有阿里云视频AI,还有阿里云视觉 AI 锐眼。
达摩院为何能如此牛?这得益于其长期深耕底层技术探索以及国家大力支持。
先讲一下视觉 AI 技术,此技术主要划分为三类:
一是视觉感知
视觉感知是视觉 AI 最基本的能力,它涉及图像识别、图像分类、图像检测等。它可被广泛应用在图像理解、图像检测、图像分割等领域。
二是视觉理解
视觉理解是视觉 AI 的核心能力,它涉及图像语义、视频语义、物体检测、场景检测、人脸检测等,它已被广泛应用在图像理解、图像检测、图像分割等领域。
三是视觉交互
视觉交互是视觉 AI 的最高级能力,涉及人脸识别、人脸检测、图像分割、手势识别、物体检测、人脸识别等,它可广泛应用在图像理解、图像检测、图像分割等领域。
达摩院视觉 AI 能力的优势是全面且强大的。从视觉感知到视觉理解,再到视觉交互,达摩院全面覆盖了视觉 AI 的各个方面。同时,达摩院还致力于视觉 AI 技术的创新和突破。
达摩院已经发表了多篇关于视觉 AI 技术的论文。其中,“视觉 AI 技术支撑虚拟形象真实感塑造”一文,首次提出了虚拟形象真实感支撑的可行性,并基于视觉 AI 技术构建了虚拟形象真实感塑造方法论,实现了虚拟形象真实感的塑造。
“视觉 AI 数字世界交互形态解析”一文,则首次提出了构建沉浸式、人性化交互界面的可行性,并基于视觉 AI 技术构建了沉浸式、人性化交互界面构建方法论,实现了交互界面的构建。
它还在视觉 AI 技术的应用方面也做了很多探索。在视频 AI 方面,达摩院已经推出了阿里云视频 AI、阿里云视觉 AI 锐眼等产品。
在图像 AI 方面,达摩院也已经推出了阿里云视觉 AI 美妆、阿里云视觉 AI 修复等产品。
总之,达摩院视觉 AI 技术强势且能打,已全面覆盖了视觉 AI 的各个方面。它还在视觉 AI 技术的创新和突破方面,做了很多研究和探索,形成了自己的独特优势。