潜在图像动画师通过潜在空间导航学习动画图像

导读深度生成模型的最新进展使得能够通过从驾驶视频中学习到的运动表示来为图像制作动画。然而,目前这项任务的方法需要明确的结构表示作为运动

深度生成模型的最新进展使得能够通过从驾驶视频中学习到的运动表示来为图像制作动画。然而,目前这项任务的方法需要明确的结构表示作为运动引导,这使得网络过于复杂。

arXiv.org最近的一篇论文提出了一种方法来消除对这些显式表示的需求。

研究人员介绍了一种潜在图像动画器(LIA),它通过直接操纵深度生成模型的潜在空间来为静止图像制作动画。此外,LIA旨在在单个编码器-生成器架构中解开运动和外观,以简化训练。

对TED-talk等数据集的评估证实,LIA在保留面部结构方面优于最先进的技术。它还表明,生成的结果是可解释的,并且包含有关基本视觉转换的方向,例如缩放和旋转。

由于深度生成模型的显着进步,动画图像变得越来越高效,而相关的结果也越来越逼真。当前的动画方法通常利用从驾驶视频中提取的结构表示。这种结构表示有助于将运动从驾驶视频转换为静止图像。然而,如果源图像和驱动视频包含大的外观变化,这种方法就会失败。此外,结构信息的提取需要额外的模块来增加动画模型的复杂性。与此类模型不同,我们在此介绍潜在图像动画器(LIA),这是一种避免结构表示需要的自我监督自动编码器。LIA被简化以通过潜在空间中的线性导航来动画图像。具体来说,生成的视频中的运动是由潜在空间中代码的线性位移构成的。为此,我们同时学习一组正交运动方向,并使用它们的线性组合来表示潜在空间中的任何位移。广泛的定量和定性分析表明,我们的模型系统地和显着优于VoxCeleb、Taichi和TED-talk数据集上的最新方法,其生成质量。

Realme现在已经透露了其GTNeo系列的最新成员的发布日期。OEM现在还将第三代智能手机作为具有自己的协处理器的新兴移动设备类别之一。除了新的Dimensity8100芯片外,它现在还计划拥有一个独立的“图形”芯片组。

更新:Realme现在透露,作为这种双芯片解决方案重点的显示器将具有120Hz的刷新率和1,000Hz的触摸采样率。至于GTNeo3的电源升级,OEM现在还取笑了其150W版本的双芯电池,以及在1,600次充电循环后显然额定保持其初始容量的80%的事实。

原创文章:2022年似乎是真正意义上的协处理器智能手机之年,因为OPPO现在跟随小米发布了其内部专用的MariSiliconX,它支持或增强了其Snapdragon8Gen1处理器高通在FindX5Pro中。

现在,Realme声称已经对其GTNeo3做了同样的事情。这款即将面世的智能手机现在也被吹捧为具有“双芯片”解决方案。再说一次,在这种情况下,似乎第二个芯片组主要是为了帮助Neo2继任者最近推出的联发科处理器驱动其显示器。

考虑到Neo3的“主要”SoC,Dimensity8100的额定规格,这似乎有点多余。再说一次,根据泄密者WHYLAB的说法,它提供了一种MEMC帧外推或“插入”形式,可以确保GTNeo3在和平精英等游戏中获得120fps,或在GenshinImpact等其他游戏中获得90fps。

Realme新推出的“独显芯片”的这一功能,显然可以用高速摄影来观察。也许其中一些镜头将在现在定于2022年3月22日举行的GTNeo3产品活动中展出。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢