文学起点网
当前位置: 首页 文学百科

最新的抠图卡点(秒实现自动抠图)

时间:2023-05-21 作者: 小编 阅读量: 3 栏目名: 文学百科

令人惊喜的是,右边人物的抠图效果不俗,虽然部分背景被视作人体的一部分。4)渣像素图像的识别效果选用照片像素为105x186,「与人体相连面积较大的物体视作人体一部分」定律再次被验证,此外,「人体与人体之间的缝隙被视作人体一部分」问题再次出现。对此,AI科技评论在使用remove.bg的过程中未发现类似情况。小结目前看来,remove.bg需要加强优化的是人体与人体之间缝隙容易被视作前景图的问题。

雷锋网 AI 科技评论按:是否为了简单的抠图功能,还在苦苦修炼 Photoshop 大法?即使修炼成功了,是否觉得在抠图这件事情上花费的时间依然太多?如今一个名叫 remove.bg 的工具可以免除你的这种烦恼,只要上传照片后点击确认,5 秒钟后即可获得一张透明无背景的主体照,而且在使用上完全免费。

由 byteq 开发人员 Benjamin Groessing 所开发的 remove.bg是一款基于 Python、Ruby 和深度学习的抠图工具,它通过 AI 技术自动识别前景层,然后将之与背景层分离开来。为了改善分离的细节效果和防止「串色」,团队还专门增加了相关算法。

不过 Benjamin Groessing 也在个人推特上强调了,remove.bg 目前只能针对含有人像的照片,其他更复杂的主体识别功能,未来将根据用户的反馈持续完善。

网站目前免费开放,无论你是专业设计师还是刚入行的运营小白,都可以上传照片实现自动抠图,免去选择、标记等一系列繁琐的常规操作。不过雷锋网 AI 科技评论在此提醒各位,该网站对于上传照片的大小以及输出照片的像素是有限制的,其中上传的照片大小不能超过 8 M,输出的照片像素也只有 500px。如果对最后的成图质量有较高要求,建议各位还是选择使用 Photoshop。

在展示网站的试用效果以前,雷锋网 AI 科技评论先简单介绍本次的考核标准:

  1. 如何处置人物手中持有的物体

  2. 会否把过暗/过亮的衣服当成背景

  3. 光照不足下的识别效果

  4. 渣像素图像的识别效果

  5. 会否出现无解的「破洞」

这些考核标准主要参考了 AI 科技评论去年介绍过的一项由 Gidi Sheperber 在 greenScreen.AI 所做的一项同性质工作,我们想知道,这一年来我们的技术在面对同样的问题时是否已经有了进步:

1)如何处置人物手持的物体

我们可以看出,系统在面对大面积与人体相连的物体时,会将物体视作人体的一部分,当成前景图处理;

而面对与人手相连程度较低的物体时,则会当做背景图剔除掉。

2)会否把过暗/过亮的衣服当成背景

由于背景颜色与人物衣服颜色较相近,导致系统将其视作人体的一部分,如右边小哥的背包;另外还有部分人物的衣物被视作背景的一部分,如右边小哥的帽子。

由于背景颜色与人物穿着颜色有所区隔,所以最终出来的识别结果较出色,然而依然出现小范围背景与人体粘连一块的现象,主要集中在人体与人体之间的缝隙间。

3)光照不足下的识别效果

最终识别效果不俗,不过又一次出现大面积与人体相连物体被视作前景图的情况(枕头),看来与团队背后的算法设置有一定关系;

由于左边光线不足导致人物被视作背景图。令人惊喜的是,右边人物的抠图效果不俗,虽然部分背景被视作人体的一部分。

4)渣像素图像的识别效果

选用照片像素为 105 x 186,「与人体相连面积较大的物体视作人体一部分」定律再次被验证,此外,「人体与人体之间的缝隙被视作人体一部分」问题再次出现。

选用的照片像素为 185 x 185,暂时没有可以挑剔的。

5)会否出现无解的「破洞」

在去年 Gidi Sheperber 的同性质工作中,她发现有些本应该不错的抠图结果,最终却出现类似于被挖了一个洞的情况。对此,AI 科技评论在使用 remove.bg 的过程中未发现类似情况。

小结

目前看来,remove.bg 需要加强优化的是人体与人体之间缝隙容易被视作前景图的问题。另外 remove.bg 默认图中的物品只要与人体的相连面积较大,一律视作前景图处理,这点在未来可以考虑开放选择项,让用户自行选择,毕竟有些时候就只是纯粹要抠的人物。

优点方面,图像的背景颜色只要不与人体颜色过分相近,remove.bg 在光线不足与低像素的抠图表现还是让人比较满意的。重点称赞 remove.bg 的响应速度,每一张照片从上传到生成最终结果,AI 科技评论的体验是每张基本都不会超过 5 秒。最终出来的描边效果虽然不算十分优秀,但对一般用户的使用而言完全绰绰有余。

Gidi Sheperber 的相关工作

Gidi Sheperber 的工作与 remove.bg 相比只能说是朋友之间的趣味实验,她和朋友 Alon Burg 花了几个月时间,基于 COCO 数据集采用语义分割技术和 Tiramisu 模型试图打造一个抠图模型。最后他们基于这项工作总结了许多关于数据选择和模型训练上的问题,并提出相应的改进方式,对我们来说有一定的启发作用。

比如在模型的训练上,她们将范围锁定在肖像与自拍图像,是因为肖像与自拍图像有较突出和集中的前景,并且能保持相对稳定的角度,这将有利于最终的图像切割效果。因此不难理解为何 remove.bg 目前只能提供人像抠图服务。

在模型的选择上,她们采用了拥有极深编码-解码架构 Tiramisu,这是因为该模型紧凑且计算快速,同时兼备 Unet 在实现方面的强项,最终的结果也没让她们失望,尤其是在图像尖锐边缘的捕获上让人非常惊艳。

Tiramisu 的通用架构

数据集的选择上也是经过一番抉择,他们最终才敲定包含最多「人」这一类别图像的 COCO 数据集。基于时间和模型集中程度的考量,她们决定选择与任务最相关的那一部分数据集,而舍弃了更一般性的数据集。这么做的好处是最终训练的模型会非常集中,然而面对更多场景和更具挑战性的图像时模型的表现可能会受影响。

以下为 Gidi Sheperber 和朋友的部分工作成果。

最终切割结果。从左到右分别是:图像,真实数据,输出结果(来自测试集)

他们在过程中发现,除了可能的代码错误的正常调试之外,模型的错误是「可预测的」。如「切割」身体部分超出了正常的躯干范围,没必要的躯干延伸,光照不足,照片质量低和照片中细节过多等。其中一些在添加不同数据集中特定图像时被处理掉了,但是其它的一些则依然是一项还有待处理的挑战。这些都被雷锋网AI 科技评论总结成了上文中用于测试 remove.bg 抠图效果的 5 条标准。

最后,Gidi Sheperber 也针对自身的工作提供了改进建议,比如在训练数据上采用更大分辨率的图像、利用 CRF 改进图像边缘噪点问题、持续关注抠图(Matting)技术的最新进展等。

最后强调一点,由于不同的实验之间涉及的技术、模型、数据类型、数据数量和训练方式都不尽相同,本篇文章借用 Gidi Sheperber 的工作成果作为 remove.bg 的考核标准,肯定有失之偏颇的地方,毕竟 remove.bg 尚未对外公开背后的算法逻辑。无论如何,我们相信同性质的工作互相都有可以借鉴的地方,感兴趣的同学可以自行点击《自拍抠图抠到手软?详解如何用深度学习消除背景》查看 Gidi Sheperber 去年所做的这项工作的更多细节。

,
    推荐阅读
  • 苏州旅游攻略景点必去(苏州旅游必去景点有哪些)

    位于苏州市东北街一百七十八号,始建于明朝正德年间。虎丘是AAAAA级景区及全国文明单位,首批十佳文明风景旅游区示范点。中午,周庄最为欢闹,游人穿梭熙熙攘攘,船儿来回摇摇荡荡,各地的游客与热情的商铺融为一体,热闹非凡,安静的古镇着实多了些欢闹的气息。狮子林为苏州四大名园之一,位于苏州市市城东北园林路。

  • 买的玉米种子是瘪的(去年买的玉米种子剩了很多)

    去年买的陈玉米种子建议不要用针对去年的陈玉米种子,大多情况下不建议再次使用,会影响到玉米后期的生长和产量情况。陈年的因为保管的问题,可能会出现很多因素影响玉米的出苗率或者后期的生长。陈玉米种子隔了一年后再种植,种子自身水分含量降低,水分降低严重的情况下,影响播种的效率和玉米的后期生长,由于活性降低,即使能出芽,也不一定能出苗。

  • 173.2亿!国庆消费火爆 国庆消费市场

    今年国庆、重阳两节叠加,全省消费市场呈现平衡较快增长态势,服装、家电、汽车等商品消费亮点突出,大众餐饮、旅行休闲、文体娱乐等主要服务消费备受青睐。根据商务部业务统一平台生存必需品监测系统显示,国庆黄金周期间,全省生存必需品市场供应充沛,价格总体平衡。除了买买买,国庆还是婚庆、团圆、会友高峰,各地亲友聚餐、婚寿宴等大众化餐饮生意兴隆。

  • 吴承恩是怎么写出的西游记(吴承恩怎么写出的西游记)

    吴承恩怎么写出的西游记诸葛长青:吴承恩写西游记诸葛长青:吴承恩怎么写出的《西游记》西游记,广泛流传西游记,作者吴承恩西游记,包含了儒释道大智慧那么,吴承恩是怎么写出的《西游记》呢?诸葛长青把自己对吴承恩写《西游记》,研究成。

  • 李逵扮演者(大家一起来看看吧)

    我们一起去了解并探讨一下这个问题吧!李逵扮演者赵小锐的李逵应该算是很多人印象当中的经典所在了,他的李逵也是很粗犷,但是这种粗犷当中却带着细腻,也是因为这个角色,他开始受到了不少的观众的关注和喜爱。其实之前的他也有出演过一些电视剧的,但是可惜的是一直都没能够真正的红起来,是李逵这个角色,让他一夜成名爆火了。

  • 汽车空间大小怎么看轴距(什么因素会影响车内空间)

    大众速腾,长度4655mm,轴距2651mm。看外观就明白了,因为宝马320i是后驱车,发动机采用纵置布局;而大众速腾是前驱车,发动机采用横置布局。而且由于发动机纵置,后驱设计,对于车内空间侵占较为严重,所以宝马320的长轴距实际上对于空间的帮助是“虚高”的。前面我们就提到了,宝马3系采用了后驱,大众速腾采用了前驱。回到我们的主题,通常来说,麦弗逊与扭力梁对于车辆空间的侵占是最小的,而多连杆和双叉臂对于车辆空间侵占是要更大的。

  • 湖南省医保局2015年工作思路与安排 湖南省医疗保障局领导班子组成人员

    督促指导各统筹地区核实提高缴费基数,强化保险费足额征收。继续加强工伤认定参与,把好工伤入口关。认真核实、积极处理群众举报问题,始终保持高压态势。加强生育医疗服务管理,规范生育津贴发放。二是启动实施工伤保险信息系统改造升级,改进工伤职工异地就医联网结算,方便工伤职工救治。三是加强财务、业务数据清理,提高数据质量;通报全省“三险”基金运行分析,指导市州加强基金运行风险管控。

  • 民国最渣四大渣男(民国著名4大渣男)

    当时很多文人在接受自由恋爱的思想时,家中已经有了父母为之安排的妻子。郁达夫一生有过三位妻子,一位同居情人。郁达夫后来还是和王映霞离婚,1940年在新加坡认识了比他小20岁的播音员李莜英,两人很快就同居了。第二任妻子佐藤富子,是个日本女人,为了和郭沫若在一起,不仅改名为“郭安娜”,还和父母断绝了关系。1937年,郭沫若抛弃妻子回国,和女明星于立群同居,两人于2年后再重庆结婚。

  • 电脑怎么连打印机教程(教会你快速学会电脑如何连接打印机的安装使用方法)

    最近很多网友都在私信给小编,小编也无法一一回复,有些问题也无法简约介绍,所以只能在头条文章内与大家共享。

  • 爱吃鸡蛋的注意了这3种鸡蛋不能买(这些鸡蛋没你想的那么好)

    营养均衡的孩子没必要补这种元素;真正缺乏硒,靠富硒蛋补,根本起不了多大作用。这类蛋再好,也别给孩子吃那就是全生或半熟的蛋,比如溏心蛋。一般溏心蛋的加热时间短,不能完全杀死细菌,生蛋液根本没有处理细菌,对于抵抗力低、易感染的宝宝来说,非常容易被细菌感染。