文学起点网
当前位置: 首页 文学百科

谷歌ai人工智能(网络运行时间提高100倍)

时间:2023-07-28 作者: 小编 阅读量: 3 栏目名: 文学百科

由于视频包含时空数据,因此图像的特征表示需要同时提取图像和运动信息。EvaNet是一个模块化的体系结构,重点是寻找时空卷积层的类型,以及它们的最佳序列或者平行轮廓。实验结果证实了这种视频cnn架构通过演化异构模块的优点。目的是通过视频中的外观和运动视觉线索学习更好的特征表示。下图显示了TinyVideoNet研究出的两种简单且非常有效的体系结构。此外,TinyVideoNet能够共同优化参数和运行时间,以提供可用于未来网络探索的高效网络。

谷歌ai人工智能?译者 | 刘畅出品 | AI科技大本营(ID:rgznai100),现在小编就来说说关于谷歌ai人工智能?下面内容希望能帮助到你,我们来一起看看吧!

谷歌ai人工智能

译者 | 刘畅

出品 | AI科技大本营(ID:rgznai100)

视频理解是一个很有挑战性的问题。由于视频包含时空数据,因此图像的特征表示需要同时提取图像和运动信息。这不仅对自动理解视频语义内容有重要性,还对机器人的感知和学习也至关重要,比如网络视频分类或体育活动识别。就和人类一样,机器人相机的输入很少是静态的快照,而是以连续视频的形式出现。

当今深层学习模型的能力在很大程度上依赖于其神经结构。视频的卷积神经网络(CNN)通常是通过将已知的2D架构(例如Inception和ResNet)人工扩展到3D来构建的,或者是通过精心设计将外观和运动信息融合在一起的双流CNN架构来构建的。然而,设计一个最佳的视频架构并充分利用视频中的时空信息仍然是一个有待解决的问题。

虽然为了发现更好的体系结构而进行的神经体系结构搜索(如Zoph等)已经被广泛地探索到了,但是用于视频的机器优化的神经体系结构还没有被开发出来。另外,视频CNN通常需要大量的计算和内存,因此设计一种在捕获其独特属性的同时又进行有效搜索是非常困难的。

为了应对这些挑战,本文作者对自动搜索进行了一系列研究,以寻求更理想的网络架构来进行视频理解。本文展示了三种不同的神经体系结构演化算法:学习层及其模块配置(EvaNet); 学习多流连接(AssembleNet); 和建立计算效率高且紧凑的网络(TinyVideoNet)。本文开发的视频架构在多个公共数据集上的性能明显优于现有的人工制作模型,并证明网络运行时间可提高10倍至100倍。

Evanet:第一个进化的视频架构

本文作者在ICCV 2019的“Evolving Space-Time Neural Architectures for Videos”中介绍过EvaNet,它是对视频体系结构设计神经体系结构研究的首次尝试。EvaNet是一个模块化的体系结构,重点是寻找时空卷积层的类型,以及它们的最佳序列或者平行轮廓。一个用于搜索并带有变异算子的进化算法,迭代更新一组体系结构。这样可以并行,更有效地进行空间搜索,对于视频体系结构研究来说,必须考虑各种时空层及其组合。EvaNet演化了多个模块(在网络中的不同位置)以生成不同的体系结构。

实验结果证实了这种视频cnn架构通过演化异构模块的优点。该方法经常发现,由多个平行层组成的非平凡模块最有效,因为它们速度更快,表现出比人工设计的模块更优的性能。另一个有趣的方面是,通过进化获得了许多类似的性能良好且多样的体系结构,并且没有额外的计算量。由于它们的并行性质,即使是一组模型在计算上也比其他标准的视频网络更有效率,例如(2 1)d EvaNet。作者已经开源了代码,若有兴趣大家可以去网上下载。

AssembleNet:构建更强、更好的(多流)模型

在“ AssembleNet:Evolving Space-Time Neural Architectures for Videos”中,作者研究了一种新的方法,该方法可以将不同的子网络融合到不同输入模式(例如rgb和光流)和时间分辨率中去。AssembleNet中也提供了一种通用方法来学习特征表示之间的“连通性”,同时也针对目标任务进行了优化。另外,作者也介绍了一种通用格式,该格式允许将多种形式的多流CNN表示为有向图,并结合一种有效的进化算法来探索高级网络连接。目的是通过视频中的外观和运动视觉线索学习更好的特征表示。与先前人工设计的两流模型不同,AssembleNet在连接权重学习指导其变异的同时,进化出了过度连接的多流多分辨率架构。

下图显示了一个AssembleNet架构的示例,该示例是通过对50到150轮回合中的随机初始多流架构进行演变而发现的。 作者在两个非常流行的视频识别数据集上测试了AssembleNet:Charades和Moments-in-Time(MiT)。 它在MiT上的表现是34%以上的第一位。 Charades的性能更是令人印象深刻,平均精度(mAP)为58.6%,而之前最著名的结果是42.5和45.2。

Tiny Video Networks:最快的视频理解网络

在现实环境的设备中(例如机器人需要的环境),为了使视频CNN模型更好的使用,考虑实时、高效的计算是非常有必要的。然而,要在视频理解任务上取得最新成果,目前还需要非常大的网络,通常有数十到数百层的卷积层,这些层通常适用于许多输入帧。因此,这些网络经常受到运行速度的影响,需要在现在的gpu和cpu上每1秒钟至少有500 MS片段。在Tiny Video Networks中,我们通过自动设计网络来解决这个问题,这些网络以很小的计算成本提供了可比较的性能。Tiny Video Networks达到了竞争精度,并且在大约1秒钟的视频剪辑中,在CPU上运行37至100 ms,在GPU上运行10 ms时,能够以实时或更高的速度高效运行,比以前快了数百倍。

通过在架构演进过程中明确考虑了模型运行时间并利用算法去探索搜索空间。同时,为了以减少计算量,也考虑了空间和时间分辨率以及通道大小,这些都可以实现性能提升。 下图显示了TinyVideoNet研究出的两种简单且非常有效的体系结构。有趣的是,学习的模型体系结构比典型的视频体系结构具有更少的卷积层:Tiny Video Networks更喜欢轻量级的元素,比如2D池,门控层和挤压激发层。 此外,TinyVideoNet能够共同优化参数和运行时间,以提供可用于未来网络探索的高效网络。

总结

这是关于神经体系结构研究视频理解的第一项工作。本文使用新的进化算法生成的视频架构在相当大的程度上优于公共数据集上最著名的人工设计的CNN架构。另外,随着架构的发展,学习计算效率高的视频模型TinyVideoNets是一定可能性的。 这项研究开辟了新的方向,展示了机器进化CNN用于视频理解的前景。

原文链接:

http://ai.googleblog.com/2019/10/video-architecture-search.htm

(*本文为 AI科技大本营编译文章,载请微信联系 1092722531

2019 中国大数据技术大会(BDTC)再度来袭!豪华主席阵容及百位技术专家齐聚,15 场精选专题技术和行业论坛,超强干货 技术剖析 行业实践立体解读,深入解析热门技术在行业中的实践落地。

    推荐阅读
  • 苏州旅游攻略景点必去(苏州旅游必去景点有哪些)

    位于苏州市东北街一百七十八号,始建于明朝正德年间。虎丘是AAAAA级景区及全国文明单位,首批十佳文明风景旅游区示范点。中午,周庄最为欢闹,游人穿梭熙熙攘攘,船儿来回摇摇荡荡,各地的游客与热情的商铺融为一体,热闹非凡,安静的古镇着实多了些欢闹的气息。狮子林为苏州四大名园之一,位于苏州市市城东北园林路。

  • 买的玉米种子是瘪的(去年买的玉米种子剩了很多)

    去年买的陈玉米种子建议不要用针对去年的陈玉米种子,大多情况下不建议再次使用,会影响到玉米后期的生长和产量情况。陈年的因为保管的问题,可能会出现很多因素影响玉米的出苗率或者后期的生长。陈玉米种子隔了一年后再种植,种子自身水分含量降低,水分降低严重的情况下,影响播种的效率和玉米的后期生长,由于活性降低,即使能出芽,也不一定能出苗。

  • 173.2亿!国庆消费火爆 国庆消费市场

    今年国庆、重阳两节叠加,全省消费市场呈现平衡较快增长态势,服装、家电、汽车等商品消费亮点突出,大众餐饮、旅行休闲、文体娱乐等主要服务消费备受青睐。根据商务部业务统一平台生存必需品监测系统显示,国庆黄金周期间,全省生存必需品市场供应充沛,价格总体平衡。除了买买买,国庆还是婚庆、团圆、会友高峰,各地亲友聚餐、婚寿宴等大众化餐饮生意兴隆。

  • 吴承恩是怎么写出的西游记(吴承恩怎么写出的西游记)

    吴承恩怎么写出的西游记诸葛长青:吴承恩写西游记诸葛长青:吴承恩怎么写出的《西游记》西游记,广泛流传西游记,作者吴承恩西游记,包含了儒释道大智慧那么,吴承恩是怎么写出的《西游记》呢?诸葛长青把自己对吴承恩写《西游记》,研究成。

  • 李逵扮演者(大家一起来看看吧)

    我们一起去了解并探讨一下这个问题吧!李逵扮演者赵小锐的李逵应该算是很多人印象当中的经典所在了,他的李逵也是很粗犷,但是这种粗犷当中却带着细腻,也是因为这个角色,他开始受到了不少的观众的关注和喜爱。其实之前的他也有出演过一些电视剧的,但是可惜的是一直都没能够真正的红起来,是李逵这个角色,让他一夜成名爆火了。

  • 汽车空间大小怎么看轴距(什么因素会影响车内空间)

    大众速腾,长度4655mm,轴距2651mm。看外观就明白了,因为宝马320i是后驱车,发动机采用纵置布局;而大众速腾是前驱车,发动机采用横置布局。而且由于发动机纵置,后驱设计,对于车内空间侵占较为严重,所以宝马320的长轴距实际上对于空间的帮助是“虚高”的。前面我们就提到了,宝马3系采用了后驱,大众速腾采用了前驱。回到我们的主题,通常来说,麦弗逊与扭力梁对于车辆空间的侵占是最小的,而多连杆和双叉臂对于车辆空间侵占是要更大的。

  • 湖南省医保局2015年工作思路与安排 湖南省医疗保障局领导班子组成人员

    督促指导各统筹地区核实提高缴费基数,强化保险费足额征收。继续加强工伤认定参与,把好工伤入口关。认真核实、积极处理群众举报问题,始终保持高压态势。加强生育医疗服务管理,规范生育津贴发放。二是启动实施工伤保险信息系统改造升级,改进工伤职工异地就医联网结算,方便工伤职工救治。三是加强财务、业务数据清理,提高数据质量;通报全省“三险”基金运行分析,指导市州加强基金运行风险管控。

  • 民国最渣四大渣男(民国著名4大渣男)

    当时很多文人在接受自由恋爱的思想时,家中已经有了父母为之安排的妻子。郁达夫一生有过三位妻子,一位同居情人。郁达夫后来还是和王映霞离婚,1940年在新加坡认识了比他小20岁的播音员李莜英,两人很快就同居了。第二任妻子佐藤富子,是个日本女人,为了和郭沫若在一起,不仅改名为“郭安娜”,还和父母断绝了关系。1937年,郭沫若抛弃妻子回国,和女明星于立群同居,两人于2年后再重庆结婚。

  • 电脑怎么连打印机教程(教会你快速学会电脑如何连接打印机的安装使用方法)

    最近很多网友都在私信给小编,小编也无法一一回复,有些问题也无法简约介绍,所以只能在头条文章内与大家共享。

  • 爱吃鸡蛋的注意了这3种鸡蛋不能买(这些鸡蛋没你想的那么好)

    营养均衡的孩子没必要补这种元素;真正缺乏硒,靠富硒蛋补,根本起不了多大作用。这类蛋再好,也别给孩子吃那就是全生或半熟的蛋,比如溏心蛋。一般溏心蛋的加热时间短,不能完全杀死细菌,生蛋液根本没有处理细菌,对于抵抗力低、易感染的宝宝来说,非常容易被细菌感染。