上海交大招生办解读最新高招StyleGAN3问世如同变幻奇迹完美再现人脸细节皮肤光滑毛发自然不仅不粘
上海交大招生办解读最新高招,StyleGAN3的魅力如同魔法师之手,完美再现人脸细节!皮肤光滑、毛发自然,不仅不粘滞屏幕,还能在三六零度空间中自由旋转,让人仿佛置身其中。其开源之举,如同一扇窗户,将科技的魅力向世界开放。
这项研究出自英伟达最新论文《Alias-Free Generative Adversarial Networks》,论文中表明,它从根本上解决了StyleGAN2图像坐标与特征粘连的问题,实现了真正的图像平移、旋转等不变性,大幅提高了图像合成质量。
我们知道,尽管生成式对抗网络具有层级卷积的性质,但由于过度依赖绝对像素坐标往往会出现图像细节“粘”在坐标上的现象,原因多出自”粗糙“的信号处理过程和神经网络混叠上。在这项研究中,英伟达将网络中的所有信号解释为连续的,并对架构进行轻微调整保证不需要的信息不会泄漏到分层合成过程,最终得到了StyleGAN3。
项目主页:https://nvlabs.github.io/stylegan3/
虽然生成式对抗网络(generative adversarial networks, GAN)已被广泛用于各种应用,包括图像编辑、图像翻译以及视频生成,但总体而言,在合成过程的基础层面仍有极大的改善空间。在现实世界中,图像是由无数个细节组成,这些细节往往是层次变化的。例如,在头部移动时,不仅头发和鼻子会随之改变,而且甚至皮肤上的毛孔也会发生变化。
所形成的问题就是如何创建更自然地转换层次结构,使每个特征都可以精确地获得亚像素位置,从底层粗特征中获得。这项研究就是为了解决这个问题。通过使用高质量重采样滤波器并且采用低通滤波技术,我们可以实现真正意义上的平移等变性,即使在亚像素尺度上也能保持不变。
下文将详述 StyleGAN3 的技术创新,以及它如何克服过去版本中的不足,比如点态非线性的混叠问题,以及如何通过抑制混叠来迫使模型实现更自然的地位分布。此外,该技术还能够产生强旋转等变生成器,一旦适当地抑制了混叠,它们就会发现显著变化:坐标系统等内部表示允许细节准确地附加到底层表面。这将显著改进用于生成视频和动画等领域的一般方法。