文学起点网
当前位置: 首页 文学百科

pytorch提速方法(LeCun转推PyTorchGPU内存分配有了火焰图可视化工具)

时间:2023-05-21 作者: 小编 阅读量: 3 栏目名: 文学百科

生成快照首先,我们必须记录每次分配的堆栈帧信息。而启用之后,我们可以分配一些内存并拍摄快照。因此,我们可以只使用这些segments中的一部分,缓存分配器将它们分为一个或更多个Block。为了避免出现大量的历史记录,我们只保留不与任何更新块重合的块的历史记录。memory视图很好地展现了内存的使用方式。例如,我们可以使用更大的输入重新运行模型,并查看分配器如何为更大的临时对象请求更多内存。

机器之心报道

编辑:杜伟

想要了解自己的 PyTorch 项目在哪些地方分配 GPU 内存以及为什么用完吗?不妨试试这个可视化工具。

近日,PyTorch 核心开发者和 FAIR 研究者 Zachary DeVito 创建了一个新工具(添加实验性 API),通过生成和可视化内存快照(memory snapshot)来可视化 GPU 内存的分配状态。这些内存快照记录了内存分配的堆栈跟踪以及内存在缓存分配器状态中的位置。

接下来,通过将这些内存快照可视化为火焰图(flamegraphs),内存的使用位置也就能一目了然地看到了。

图灵奖得主 Yann Lecun 也转推了这个工具。

Twitter@Zachary DeVito

下面我们来看这个工具的实现原理(以第一人称「我们」描述)。

生成快照

首先,我们必须记录每次分配的堆栈帧信息。

记录这些堆栈跟踪的速度非常快(每次分配约 1 us,正常的 PyTorch 内核调用需要至少 8 us),但我们默认将其关闭。而启用之后,我们可以分配一些内存并拍摄快照。

快照记录了整个分配器的状态,如下所示。

快照是具有以下结构的 Segment 字典列表。

Segments 是直接从 cudaMalloc 请求并由分配器缓存的内存。因此,我们可以只使用这些 segments 中的一部分,缓存分配器将它们分为一个或更多个 Block。所有的块始终保持相同的分配状态。同时,使用_record_memory_history,每个块还将记录一个 History 对象,该对象会记住块中最后一次分配的位置,包括作为 Frames 列表的堆栈跟踪。

对于 active_allocated 块,它其中存在的内容和当前分配的内容将有一个历史记录。对于 inactive 块,可能会有多个条目来记录块内存中最后存在的内容。可能不止一个条目的原因在于分配器在空闲时会合并分割块,并记录下两次拆分的历史。为了避免出现大量的历史记录,我们只保留不与任何更新块重合的块的历史记录。

保存快照

快照因自身设计而可以之后离线查看。

文件_memory_viz.py 可以直接用作交互式命令来处理保存的快照。

可视化快照

_memory_viz.py 工具也可以生成内存的可视化火焰图。

可视化图将分配器中所有的字节(byte)按不同的类来分割成段,如下图所示(原文为可交互视图)。

火焰图可视化是一种将资源(如内存)使用划分为不同类的方法,然后可以进一步细分为更细粒度的类别。

memory 视图很好地展现了内存的使用方式。但对于具体地调试分配器问题,首先将内存分类为不同的 Segment 对象是有用的,而这些对象是分配轨迹的单个 cudaMalloc 段。

比较快照

该可视化器还可以生成显示在两个快照之间添加和删除的段的可视化。例如,我们可以使用更大的输入重新运行模型,并查看分配器如何为更大的临时对象请求更多内存。

比较视图仅显示新段,这有助于找出哪些代码路径提示分配更多内存。

$ python _memory_viz.py compare snapshot.pickle snapshot2.pickle-o compare.svgonly_before = []only_after = [140636932014080, 140636827156480, 140634912456704, 140634839056384, 140634843250688, 140634841153536, 140634866319360, 140634811793408, 140634845347840, $ 140636806184960, 140636778921984, 140634878902272]

原文链接:https://zdevito.github.io/2022/08/16/memory-snapshots.html

,
    推荐阅读
  • 卖火柴的小女孩主要讲了什么(卖火柴的小女孩讲述的是什么)

    卖火柴的小女孩主要讲了什么它讲述的是一个在圣诞夜卖火柴的小女孩的悲惨命运。因为没有卖掉一根火柴,小女孩一天没有吃东西。创作背景:1845年10月,安徒生再次访问意大利。在圣诞节即将到来的时候,格洛斯顿城的朋友们再三邀请安徒生去那里过圣诞节。安徒生兴冲冲地坐上了去格洛斯顿的马车。安徒生的马车在格洛斯顿的街道上缓缓前进,他要体会一下城市里的圣诞节气氛。安徒生回去以后就写了《卖火柴的小女孩》。

  • 芹菜炒木耳大白菜(钙含量是牛奶的3倍)

    韭菜炒豆芽的做法,就是这么简单,掌握好技巧,口感能提升不少,如果你认为韭菜炒豆芽的做法还不错,欢迎收藏起来学着做,或者是分享给更多的人学习!

  • 雅典为什么会繁华(同属希腊地区的雅典和斯巴达)

    古希腊城邦奴隶制得到如此广泛推行为日后城邦时代社会经济的发展以及各行各业的繁荣提供了重要条件。这也使得希腊城邦的奴隶制经济得到了空前规模的发展,尤其是在以雅典和斯巴达两大城邦的代表下,古希腊城邦时代迎来了其奴隶制社会经济发展的黄金时代。雅典型的奴隶制经济代表着古希腊城邦时代奴隶制社会发展的整体面貌,而斯巴达型的奴隶制经济只是局限于那些经济较为落后的城邦当中。

  • 电饭锅腊肠饭做法(电饭锅腊肠饭最简单的做法介绍)

    下面希望有你要的答案,我们一起来看看吧!电饭锅腊肠饭做法主料是腊肠、米,辅料是胡萝卜、玉米、葱、盐、鸡粉。先把材料准备好,大米洗净,腊肠切丁,玉米粒胡萝卜切丁,备用。电饭锅内放少许油,依照顺序放入胡萝卜,玉米腊肠,加入盐,鸡粉,酱油翻炒片刻,接着放入米,水量和平常一样,按下开关煮饭就可以了。开关跳了后,撒上些香葱,加入些酱油调味拌匀即可出锅。

  • 地笼放什么饵料(地笼的介绍)

    下面内容希望能帮助到你,我们来一起看看吧!地笼放什么饵料地笼里面放的饵料比较好的:大骨头稍微有一点点肉屑。还有红虫但数量要多一些。还可以鸡鸭骨头等等腥味越大越好。地笼是中原地区的业余或专业捕鳝或泥鳅,河虾小鱼等的工具。地笼的长度可依据养殖水面的长度、宽度而定,一般为15节左右,总长约7~8米。材质为塑料纤维。地笼有很多入口,但内部构造比较复杂,鱼类进去后就很难出来。

  • 卡路里最低的食物排行(卡路里最低的食物有哪些)

    卡路里最低的食物排行芝麻菜。芝麻菜在日常生活中是比较常见,不仅含有低热量低脂肪和低胆固醇,而且高纤维和大量的维生素A,K,C以及其它丰富的营养。西兰花低热量、丰富维生素、大量矿物质及抗氧化剂,可降低各种癌变的发生率。绿豆芽热量较低,水分和膳食纤维较高。西红柿果实营养丰富,具特殊风味。

  • 新买的内衣有很大的味道怎么回事 新买的内衣有很大的味道怎么回事呀

    不少女性朋友可能有这样的困扰,新买的内衣挂在内衣店里没有异味,可是拿回家洗一遍之后却散发出很大的味道。内衣长期挤压产生味道新买的内衣从生产到购买经过了较长的时间,而在此期间内衣被长时间闷在包装袋里面或者是长时间受到挤压,这也容易使内衣在包装袋中产生很大的味道。

  • 修车最容易被更换的零件(更换下来的旧件哪些可以卖掉)

    可以最大程度上降低我们的损失呢?第4个零部件就是发动机以及空调压缩机了,相信我们都应该知道,车辆当中最为贵重的零部件就是发电机,所以如果我们的车辆出现问题时,发电机也能够卖到一个非常好的价钱。但前提是一定要经过维修之后还可以再次使用的,才能够进行售卖,如果没有维修价值了的话,也只能够是当废铁卖掉。

  • 孕妇晚期腰痛可以按摩吗(孕妇腰酸可以按摩缓解吗)

    孕妇腰酸可以按摩缓解吗孕期随着腹中胎儿越长越大,身体会变得笨重,由于重心前移,增大的子宫压迫脊柱导致背部肌肉紧张,可能就会引起腰酸背痛,这主要是一个生理性的表现怀孕期间运动量太少,体重明显的增加,怀孕的时候身体里面的激素水。

  • qq隐藏图标的方法(操作步骤)

    qq隐藏图标的方法我们打开QQ软件,输入账号密码登录,进入主界面后,点击个人头像,鼠标移到头像上,会出现浮动框,能看到当前使用的应用图标。确定上述操作后,重新查看自己的个人资料,图标已经隐藏成功,操作完以上步骤后,你的QQ好友就看不到你的手机QQ图标了。我们还可以打开QQ,点击最左侧的选项之后选择设置选项,在系统设置中点击登录选项,在主面板中选择在任务栏通知区域显示QQ图标的对勾去掉即可。