文学起点网
当前位置: 首页 文学百科

什么是cva模型(这篇综述系统回顾了CV中的扩散模型)

时间:2023-07-11 作者: 小编 阅读量: 1 栏目名: 文学百科

DDPMs是潜变量模型,采用潜变量来估计概率分布。从这个角度来看,DDPMs可以被看作是一种特殊的变分自编码器,其中正向扩散阶段对应于VAE内部的编码过程,而反向扩散阶段对应于解码过程。随机微分方程代表了另一种建立扩散模型的方式,形成了扩散模型的第三个子类别。通过正向和反向SDEs对扩散进行建模,可以得到有效的生成策略以及强有力的理论结果。

机器之心报道

编辑:赵阳

在这篇论文中,来自布加勒斯特大学、中佛罗里达大学的 Mubarak Shah(IEEE Fellow)等几位研究者对计算机视觉中的 100 多篇去噪扩散模型论文进行了全面回顾。

扩散模型在深度生成模型中自成一派,最近成为计算机视觉领域最热门的话题之一(见图 1)。扩散模型展示了强大的生成能力,无论是生成高水平的细节还是其生成的多样性,都让人印象深刻。

我们甚至可以说,这些生成式模型将生成式建模领域的标准提高到了一个全新的水平,尤其是 Imagen 和 Latent Diffusion Models(LDM)等模型。迄今为止,扩散模型已被应用于各种生成式建模任务,如图像生成(image generation)、图像超分(mage super-resolution)、图像修复( image inpainting)、图像编辑(image editing)、图像转换(image-to-image translation)等等。此外,人们发现扩散模型学习到的潜在表征在鉴别性任务中也很有用,例如,图像分割、分类和异常检测。这证实了去噪扩散模型具有广泛的适用性,还有待发现进一步的应用场景。此外,强大的潜在表征学习能力还创造了与表征学习的联系,表征学习是一个研究学习强大数据表征方法的综合领域,涵盖了从新型神经结构的设计到学习策略的发展等多种算法领域。

根据图 1 所示的图表,关于扩散模型的论文数量正在以非常快的速度增长。为了概述这个快速发展的主题从过去到现在的成就,本文作者对计算机视觉中去噪扩散模型的文章进行了全面回顾。

论文链接:https://arxiv.org/pdf/2209.04747.pdf

更准确地说,本文关注的文章满足以下定义:具有(1)前向扩散阶段,在这个过程中对输入数据添加高斯噪声,来逐步实现扰动;(2)反向 / 后向扩散阶段的一类深度生成模型,在这个过程中,生成模型的任务是通过学习逐步反转扩散过程,从扩散(噪声)数据恢复原始输入数据。

根据研究者的说法,至少有三个子类别的扩散模型符合上述定义。

第一个子类别包括去噪扩散概率模型(DDPMs),其灵感来自非平衡热力学理论。DDPMs 是潜变量模型,采用潜变量来估计概率分布。从这个角度来看,DDPMs 可以被看作是一种特殊的变分自编码器(VAEs),其中正向扩散阶段对应于 VAE 内部的编码过程,而反向扩散阶段对应于解码过程。

第二个子类别的代表是噪声条件下的分数网络(NCSN),基于分数匹配机制训练得到一个共享的神经网络,用来估计不同噪声水平下扰动数据分布的分数函数(定义为对数密度的梯度)。

随机微分方程(SDEs)代表了另一种建立扩散模型的方式,形成了扩散模型的第三个子类别。通过正向和反向 SDEs 对扩散进行建模,可以得到有效的生成策略以及强有力的理论结果。第三种(基于 SDEs)可以被看作是对 DDPMs 和 NCSNs 的概括。

研究者确定了几个模型设计方案的决定要素,并将它们综合为三个通用的扩散建模框架,对应于上面介绍的三个子类别。为了把通用的扩散建模框架放在背景中,研究者还进一步讨论了扩散模型和其他深度生成模型之间的关系。更具体地说,本文描述了与变分自编码器(VAE)、生成对抗网络(GAN)、基于能量的模型(EBM)、自回归模型和归一化流的关系。然后,本文还介绍了应用于计算机视觉的扩散模型的多视角分类任务,并根据一些标准对现有模型进行了分类,如基础框架、目标任务或去噪条件。

最后,本文说明了目前扩散模型的局限性,并设想了一些有趣的未来研究方向。例如,最棘手的限制之一可能是推理过程中的时间效率低下问题,这是由于存在非常多的评价步骤。就算是生成一个样本也需要成千上万的评估步骤。所以,在不影响生成样本质量的前提下克服这一局限性,是未来研究的一个重要方向。

扩散模型的三种表述

扩散模型是一类概率生成模型,它可以学习逆转一个通过添加不同尺度的噪声来逐渐降低训练数据结构的过程。在第二章的 3 个小节中,本文介绍了扩散模型的三种表述,即去噪扩散概率模型、噪声条件下的得分网络,以及基于随机微分方程的方法,该方法是对前两种方法的概括。对于每一种表述,作者都描述了向数据添加噪声的过程、学习逆转这一过程的方法、以及在推理时如何产生新的样本。在图 2 中,所有这三种提法都被作为一个通用框架来说明。本文在最后一个小节中专门讨论了与其他深度生成模型的联系。

扩散模型的分类

研究者考虑到不同的分类标准,将扩散模型归入一个多角度的分类法。也许区分模型的最重要标准是由(i)它们所应用的任务和(ii)它们所需要的输入信号来定义的。此外,由于在制定扩散模型时有多种方法,(iii) 基础架构是对扩散模型进行分类的另一个关键因素。最后,训练和评估过程中使用的数据集也非常重要,因为这有助于在同一任务上比较不同的 baseline。研究者根据前面列举的标准对扩散模型进行了分类,见表 1。

在第三章的其余部分,作者选择目标任务作为区分方法的主要标准,并介绍了几个关于扩散模型的贡献。作者表示,选择这个分类标准是因为它对扩散模型的研究具有相当的平衡性和代表性,便于从事特定任务的读者快速掌握相关工作。尽管主要任务通常与图像生成有关,但在其他主题上,如超分辨率、绘画、图像编辑、图像到图像的翻译或分割,已经进行了相当多的工作来鼓励甚至超越 GANs 的性能。

感兴趣的读者可以阅读论文原文,了解更多研究细节。

    推荐阅读
  • 荷塘月色简笔画彩图(荷塘的场景图简笔画)

    今日份简笔画荷塘月色.感恩日记1.,我来为整理几张简单漂亮的荷塘月色简笔画彩图?以下简笔画图片总有一款是你喜欢的,希望对你有帮助来看看吧!荷塘月色简笔画彩图今日份简笔画荷塘月色.感恩日记1.荷塘月色好看的儿童画图片儿童简笔画大全荷塘月色简笔画儿童画

  • 直硬头发软化前后效果图(头发软化前后效果图)

    可以使头发变软,变柔顺,变贴服,且价格也很便宜,普通的美发沙龙价格为50到80元左右,软化比较自然。头发软化后几天可以洗刚做完软化2至3天不要洗头,刚做完软化不要用力拉头发,会有损发质和效果。软化也是伤头发的,不过比不停地做一次性夹头发而言小很多,如果是短发做软化还是不错的。如果想让头发蓬蓬的,最好不要全头做软化,甚至不建议做软化。具体情况,建议咨询理发师。用药水要用好一点的,对头发伤害才不会很大。

  • 赞美运动员的话(赞美运动员的话有什么)

    年轻的我们自信飞扬,青春的气息如同出生的朝阳,蓬勃的力量如同阳光的挥洒此时此刻,跑道便是我们精彩的舞台,声声加油便是我们最高的奖项论何成功,谈何荣辱,心中的信念只有一个:拼搏,我来为大家科普一下关于赞美运动员的话?赞美运动员的话年轻的我们自信飞扬,青春的气息如同出生的朝阳,蓬勃的力量如同阳光的挥洒。所有的努力都是为了迎接这一刹那,所有的拼搏都是为了这一声令下。

  • 长安uni-k车主反映这款车怎么样(新车长安UNI-K登场)

    据长安汽车最新消息,中大型SUVUNI-K官图曝光,这是长安UNI系列的第二款车型。新车将搭载蓝鲸系列2.0T发动机并匹配8AT变速箱,将于广州车展首发亮相。新车亮点1.采用了全新的“V”型面设计和无边界格栅。新车概况新车前脸依然采用无边界设计并融入了V型面概念,不同于UNI-T,UNI-K的大灯位置设计在了最上方。车尾方面采用了时下流行的贯穿式尾灯设计,与UNI-T的V型后导流造型不同,UNI-K采用了新的航天器式造型,立式尾灯十分显眼。

  • 渡劫经典语录(关于渡劫的语录精选)

    情到深处人孤独,爱至穷时尽沧桑堕落的天使啊,你无知的游走着。我将于茫茫人海中访我唯一灵魂之伴侣;得之,我幸;不得,我命。玲珑骰子安红豆,入骨相思君知否。于千万人之中遇见你所遇见的人,于千万年时间无涯的荒野里,没有早一步,也没有晚一步,刚巧赶上了。生命是一朵千瓣莲花,我拒绝了绽放的同时,我也拒绝了枯萎和零落。就算哭泣也要皱眉优雅,就算失败也要转身潇洒。之后我也学会了阳奉阴违,发生了什么与我再无所谓。

  • 孤城闭什么时候上映(谁是主演)

    以下内容大家不妨参考一二希望能帮到您!孤城闭什么时候上映《孤城闭》将于2020年起在湖南卫视上映播出。该剧主要由王凯、江疏影、任敏、杨玏、边程、叶祖新、喻恩泰、王楚然、刘钧、孙坚等主演。《孤城闭》改编自米兰lady同名小说,以北宋为背景,在风起云涌的朝堂之事与剪不断理还乱的儿女情长之间,还原了一个复杂而真实的宋仁宗。

  • 大众朗逸所有灯图解(认识汽车灯图解)

    大众朗逸所有灯图解作为新手,汽车灯光就是一道难题,下面我们一起通过图解来认识一下汽车各种灯光吧。双闪灯的作用是当车辆发生意外情况后,引起其他车辆警惕,防止发生追尾事故。当踩下制动踏板后,制动灯立即亮起,并发出红色灯光,提醒后方车辆。倒车灯是白色,作用是为了照亮车尾的路面,减少倒车时盲区,另外也是对后方的提醒。

  • 雪里红的腌制方法(做雪里红腌菜的步骤)

    下面更多详细答案一起来看看吧!雪里红的腌制方法雪里红摘干净,根部用刀劈开,正一层反一层放入盆中,取盐均匀地洒在雪里红上,腌制1-2天。烧开水放凉,加盐,搅拌均匀,盐水倒入雪里红中泡制一天。泡好的雪里红捆成一小捆放入密封罐,倒入泡雪里红的盐水,盖好密封罐,即吃即取。

  • 郑州婚纱照推荐哪家好(郑州拍婚纱照团购)

    中国红喜嫁秀爆朋友圈的婚纱照中式婚纱照新中式婚纱照婚纱照风格高级感婚纱照婚纱照秀禾服的中式嫁衣,是完美诠释了东方女性温婉古典美。让人完全移不开目光~每一个女孩子都应该拥有这样华丽的喜嫁风太精致完全属于中式婚纱照的浪漫感~

  • 胎梦最准的位置(从胎梦看看你腹中的孩子给你暗示了吗)

    估计生完孩子和正在孕期的妈妈都会经历过这种事情,就是我们会经常做梦,而且会梦见一些动物植物什么的,这在老人眼里属于“胎梦”。你梦见的什么会预示着即将出生的宝宝是男孩还是女孩。你的胎梦准不准,来看看一下别人的胎梦。哈哈,看来有些胎梦还是挺准的,或许都是巧合吧,总之,宝宝来了就是我们的命中注定。