网站地图官方微信:
网站首页 枣岭乡 建湖县 游河乡 姚渡镇 屏山县 朴头乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 中年夫妻有多少是生活和谐的? |

    没想到我有一天也想回答这个问题,我们家情况其实还好,我们都是...

    查看详情>>
  • | 今年7.5日的预言是真的吗? |

  • | 二氧化碳人工合成淀粉技术现在怎么没动静了? |

  • | 和女生合租,都会发生什么事情? |

  • | postgresql也很强大,为何在中国大陆,mysql成为主流,postgresql屈居二线呢? |

  • | 为什么感觉淘宝现在不如拼多多了? |

  • | 上海女子称吃完冷饮后脑子抽筋了,医生诊断为「脑结冰」,脑结冰危害有多大?夏季吃冷饮有哪些注意事项? |

  • | 我听说Windows12微软就直接重头构建Windows了,就直接重构Win内核了,到底是不是真的? |

  • | 为什么抖音直播大半都是女主播在擦边? |

  • | 为什么很多人在1panel推出之后,还坚持用宝塔面板? |

  • | 能否对比一下Claude Code和Gemini CLI,你的选择建议是? |

  • 作为普通小市民我说一下自己的感受: 小时候我一直这么觉得的,...

    2025-06-29
  • 我之前给博客备案,然后接到电话说名字不可以叫“xx博客”,我...

    2025-06-29
  • 攻击长相是最没意义的。 这个姑娘无论如何也是高于平均水平。 ...

    2025-06-29
  • 因为傻,因为侥幸心理,因为连condom这个伟大的发明都懒得...

    2025-06-29

关注我们

添加微信好友,关注最新动态