网站地图官方微信:
网站首页 十农场 信安镇 张林镇 川汇区 道坪镇 帮堆乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | react 跟 vue 哪个更牛逼? |

    我们公司前端技术栈涵盖了 React、Vue 和 Angul...

    查看详情>>
  • | 30岁的人生有多无力? |

  • | 为什么英特尔不开发一种全大核CPU? |

  • | 《三体》衍生剧《三体:大史》正式官宣,于和伟、张鲁一回归出演,这个阵容你满意吗? |

  • | Golang和J***a到底怎么选? |

  • | 自由泳是真的很累啊,怎么办? |

  • | 为什么 Windows 没有比较成熟的第三方桌面环境(explorer.exe)? |

  • | 你身边身材最好的女生是什么样? |

  • | 韦东奕(北大韦神)要是去写游戏引擎代码,能不能把虚幻引擎按在地上摩擦?数学好真能‘降维打击吗? |

  • | 民航局紧急通知禁止携无 3C 标识及被召回的充电宝乘境内航班,无 3C 标识充电宝有哪些安全隐患? |

  • | 实体店为什么生意越来越难做了? |

  • 只要是先天沉水性的水草,都可以丢缸里飘着就能活得生猛。 金...

    2025-06-26
  • 捞女游戏 是Electron做的。 但是不代表Electr...

    2025-06-26
  • 趁着国庆前夕,分享一款最新原创研发的跨平台 tauri2.0...

    2025-06-26
  • MacOS的流畅,像是你在五星级酒店洗了个澡,毛巾有熏香、镜...

    2025-06-26

关注我们

添加微信好友,关注最新动态