文学起点网
当前位置: 首页 文学百科

最新的抠图卡点(秒实现自动抠图)

时间:2023-05-21 作者: 小编 阅读量: 3 栏目名: 文学百科

令人惊喜的是,右边人物的抠图效果不俗,虽然部分背景被视作人体的一部分。4)渣像素图像的识别效果选用照片像素为105x186,「与人体相连面积较大的物体视作人体一部分」定律再次被验证,此外,「人体与人体之间的缝隙被视作人体一部分」问题再次出现。对此,AI科技评论在使用remove.bg的过程中未发现类似情况。小结目前看来,remove.bg需要加强优化的是人体与人体之间缝隙容易被视作前景图的问题。

雷锋网 AI 科技评论按:是否为了简单的抠图功能,还在苦苦修炼 Photoshop 大法?即使修炼成功了,是否觉得在抠图这件事情上花费的时间依然太多?如今一个名叫 remove.bg 的工具可以免除你的这种烦恼,只要上传照片后点击确认,5 秒钟后即可获得一张透明无背景的主体照,而且在使用上完全免费。

由 byteq 开发人员 Benjamin Groessing 所开发的 remove.bg是一款基于 Python、Ruby 和深度学习的抠图工具,它通过 AI 技术自动识别前景层,然后将之与背景层分离开来。为了改善分离的细节效果和防止「串色」,团队还专门增加了相关算法。

不过 Benjamin Groessing 也在个人推特上强调了,remove.bg 目前只能针对含有人像的照片,其他更复杂的主体识别功能,未来将根据用户的反馈持续完善。

网站目前免费开放,无论你是专业设计师还是刚入行的运营小白,都可以上传照片实现自动抠图,免去选择、标记等一系列繁琐的常规操作。不过雷锋网 AI 科技评论在此提醒各位,该网站对于上传照片的大小以及输出照片的像素是有限制的,其中上传的照片大小不能超过 8 M,输出的照片像素也只有 500px。如果对最后的成图质量有较高要求,建议各位还是选择使用 Photoshop。

在展示网站的试用效果以前,雷锋网 AI 科技评论先简单介绍本次的考核标准:

  1. 如何处置人物手中持有的物体

  2. 会否把过暗/过亮的衣服当成背景

  3. 光照不足下的识别效果

  4. 渣像素图像的识别效果

  5. 会否出现无解的「破洞」

这些考核标准主要参考了 AI 科技评论去年介绍过的一项由 Gidi Sheperber 在 greenScreen.AI 所做的一项同性质工作,我们想知道,这一年来我们的技术在面对同样的问题时是否已经有了进步:

1)如何处置人物手持的物体

我们可以看出,系统在面对大面积与人体相连的物体时,会将物体视作人体的一部分,当成前景图处理;

而面对与人手相连程度较低的物体时,则会当做背景图剔除掉。

2)会否把过暗/过亮的衣服当成背景

由于背景颜色与人物衣服颜色较相近,导致系统将其视作人体的一部分,如右边小哥的背包;另外还有部分人物的衣物被视作背景的一部分,如右边小哥的帽子。

由于背景颜色与人物穿着颜色有所区隔,所以最终出来的识别结果较出色,然而依然出现小范围背景与人体粘连一块的现象,主要集中在人体与人体之间的缝隙间。

3)光照不足下的识别效果

最终识别效果不俗,不过又一次出现大面积与人体相连物体被视作前景图的情况(枕头),看来与团队背后的算法设置有一定关系;

由于左边光线不足导致人物被视作背景图。令人惊喜的是,右边人物的抠图效果不俗,虽然部分背景被视作人体的一部分。

4)渣像素图像的识别效果

选用照片像素为 105 x 186,「与人体相连面积较大的物体视作人体一部分」定律再次被验证,此外,「人体与人体之间的缝隙被视作人体一部分」问题再次出现。

选用的照片像素为 185 x 185,暂时没有可以挑剔的。

5)会否出现无解的「破洞」

在去年 Gidi Sheperber 的同性质工作中,她发现有些本应该不错的抠图结果,最终却出现类似于被挖了一个洞的情况。对此,AI 科技评论在使用 remove.bg 的过程中未发现类似情况。

小结

目前看来,remove.bg 需要加强优化的是人体与人体之间缝隙容易被视作前景图的问题。另外 remove.bg 默认图中的物品只要与人体的相连面积较大,一律视作前景图处理,这点在未来可以考虑开放选择项,让用户自行选择,毕竟有些时候就只是纯粹要抠的人物。

优点方面,图像的背景颜色只要不与人体颜色过分相近,remove.bg 在光线不足与低像素的抠图表现还是让人比较满意的。重点称赞 remove.bg 的响应速度,每一张照片从上传到生成最终结果,AI 科技评论的体验是每张基本都不会超过 5 秒。最终出来的描边效果虽然不算十分优秀,但对一般用户的使用而言完全绰绰有余。

Gidi Sheperber 的相关工作

Gidi Sheperber 的工作与 remove.bg 相比只能说是朋友之间的趣味实验,她和朋友 Alon Burg 花了几个月时间,基于 COCO 数据集采用语义分割技术和 Tiramisu 模型试图打造一个抠图模型。最后他们基于这项工作总结了许多关于数据选择和模型训练上的问题,并提出相应的改进方式,对我们来说有一定的启发作用。

比如在模型的训练上,她们将范围锁定在肖像与自拍图像,是因为肖像与自拍图像有较突出和集中的前景,并且能保持相对稳定的角度,这将有利于最终的图像切割效果。因此不难理解为何 remove.bg 目前只能提供人像抠图服务。

在模型的选择上,她们采用了拥有极深编码-解码架构 Tiramisu,这是因为该模型紧凑且计算快速,同时兼备 Unet 在实现方面的强项,最终的结果也没让她们失望,尤其是在图像尖锐边缘的捕获上让人非常惊艳。

Tiramisu 的通用架构

数据集的选择上也是经过一番抉择,他们最终才敲定包含最多「人」这一类别图像的 COCO 数据集。基于时间和模型集中程度的考量,她们决定选择与任务最相关的那一部分数据集,而舍弃了更一般性的数据集。这么做的好处是最终训练的模型会非常集中,然而面对更多场景和更具挑战性的图像时模型的表现可能会受影响。

以下为 Gidi Sheperber 和朋友的部分工作成果。

最终切割结果。从左到右分别是:图像,真实数据,输出结果(来自测试集)

他们在过程中发现,除了可能的代码错误的正常调试之外,模型的错误是「可预测的」。如「切割」身体部分超出了正常的躯干范围,没必要的躯干延伸,光照不足,照片质量低和照片中细节过多等。其中一些在添加不同数据集中特定图像时被处理掉了,但是其它的一些则依然是一项还有待处理的挑战。这些都被雷锋网AI 科技评论总结成了上文中用于测试 remove.bg 抠图效果的 5 条标准。

最后,Gidi Sheperber 也针对自身的工作提供了改进建议,比如在训练数据上采用更大分辨率的图像、利用 CRF 改进图像边缘噪点问题、持续关注抠图(Matting)技术的最新进展等。

最后强调一点,由于不同的实验之间涉及的技术、模型、数据类型、数据数量和训练方式都不尽相同,本篇文章借用 Gidi Sheperber 的工作成果作为 remove.bg 的考核标准,肯定有失之偏颇的地方,毕竟 remove.bg 尚未对外公开背后的算法逻辑。无论如何,我们相信同性质的工作互相都有可以借鉴的地方,感兴趣的同学可以自行点击《自拍抠图抠到手软?详解如何用深度学习消除背景》查看 Gidi Sheperber 去年所做的这项工作的更多细节。

,
    推荐阅读
  • 云南省的气候特点(云南省的气候特点是什么)

    云南省的气候特点云南气候基本属于亚热带高原季风型,立体气候特点显著,类型众多、年温差小、日温差大、干湿季节分明、气温随地势高低垂直变化异常明显。滇西北属寒带型气候,长冬无夏,春秋较短;滇东、滇中属温带型气候,四季如春,遇雨成冬;滇南、滇西南属低热河谷区,有一部分在北回归线以南,进入热带范围,长夏无冬,一雨成秋。同日早晚较凉,中午较热,尤其是冬、春两季,日温差可达12℃~20℃。

  • 济南2022中小学教师资格面试退费申请截止什么时候?

    答:退费申请截止时间为5月20日24:00。接教育部教育考试院通知,受新冠肺炎疫情影响或因居住在有中高风险区的地区无法参加2022年5月中小学教师资格考试(面试)的考生,可申请退费。经教育部教育考试院核准退费的考生,其报名费将按原渠道全额退回,其通过的笔试科目合格成绩有效期同时自动延长半年,退费时间约为1-2个月,请务必保持原支付渠道畅通。

  • 前端javascript基础(干货前端开发中)

    前端开发中会遇到很多JS插件,在此为大家举例了一些,也是经常在项目中所应用到的,希望对大家有所帮助吧!也欢迎大家在下方热烈的留言。一.弹出层二.音频视频三.表单四.动画切版qieban(.cn)

  • 用星星纸自制手帐胶带(豆瓣日记:DIY)

    本文作者“peachbaby”,现居北京,目前已发表了65篇原创文字,至今活跃在豆瓣社区。下载豆瓣App搜索用户“peachbaby”关注Ta。这种方法做出的烫金是不会掉的哦黑色胶带、背景印章、离型纸、浮水印台、凸粉、热熔枪我试了好几种颜色的凸粉,效果都不错~各种图案的胶带、车票印章、油性速干印台、白色不干胶纸、剪刀可以尝试各种不同的花纹~我和朋友的手帐书上架啦~欢迎关注!

  • 兔肝煲粥(兔肝煲粥应该怎么做)

    我们一起去了解并探讨一下这个问题吧!兔肝煲粥兔肝煲粥是兔肝为主料制作的药膳。每次用兔肝洗净,大米适量。做法:大米洗净,浸泡30分钟。将足够量的水倒入锅中,加入大米煮沸,加入兔肝和食用油煮沸。再改小火熬煮成粥。食用时加盐调味即可。适用于肝肾虚之视力减退,肝虚头晕目眩,小儿角膜软化症等。

  • 上班族饮食应注意什么(上班族饮食应注意啥)

    上班族饮食应注意什么三餐定时研究显示,过了晚上8点之后,身体分泌的醣类物质越来越少,以至于消化系统分解食物的速度和效率也会逐渐降低。水果和纤维含量高的食物能帮助肠胃蠕动,有助于消化,可以在晚上食用。饭后适量运动饭后半小时适量运动能避免脂肪的囤积,尤其对于办公室女性来说,长时间伏案工作,腰腹部脂肪特别容易存积,所以午饭之后不能马上坐下来工作。

  • 顶流可以维持几年(怎么糊成了这样)

    继仝卓高考作弊翻车之后。2008年8月开播的《天天向上》,很快就冲进全国收视前三,被评为年度最佳节目。在周五晚七点半这个黄金时段播放,也足以证明了它在湖南台的地位。都是该话题范畴里的重量级人物,或者有着国民热度的典型代表。大量涌现的新形式节目虽然火爆,但始终没法撼动其内地综艺第一的位置。欧弟则是第二主持,负责助攻。这就是团队优先于个人的体现。例如采访机组人员的这一集,机长提醒大家坐飞机要注意保管财物。

  • 石菖蒲的功效与作用(石菖蒲的好处有哪些)

    石菖蒲的功效与作用祛痰开窍:石菖蒲可以化湿浊,它的气味芳香,也具有窍祛痰湿的功效,适用于清阳不升而引起的神识不清、耳聋目昏和精神迟钝等症状。临床上对于精神病患者有镇静和催眠的作用。

  • 早上去江边跑步好吗 早上在江边跑步好不好

    小贴士注意不要在空腹或者刚吃完饭后进行运动,容易导致肠胃不适。早上什么时候去跑步好一般是在7-9点左右较好。而一般到七点左右,太阳已经出来,植物进行了光合作用,空气质量会比较高,运动效果也会比较好。

  • 初音未来是哪个动漫的(初音未来哪首歌好听)

    初音未来是哪个动漫的初音未来并不是出自动漫,初音未来是CRYPTONFUTUREMEDIA以Yamaha的VOCALOID2语音合成引擎为基础开发贩售的虚拟女性歌手软件。由声优藤田咲提供原声。初音未来3首比较好听的歌:①《恋爱裁判》是主要由40mP制作的VOCALOID歌曲,发表在日本niconico动画网。目前已经是传说级歌曲。②《深海少女》是比较前早的歌了,也是不少人的入坑曲。③《胧月》是一首平和恬静的曲子。适合在一个月色朦胧的晚上出去散步听。歌词很美,很有诗意,旋律更是没的说。