1。
$美国超微公司 (AMD.US)$ 对 $NVDA 的 CUDA 的答案是 ROcM。但他认为这两者之间有很大的区别。CUDA 是一个成熟的生态系统,大多数开发人员对 CUDA 的了解与其自 2006 年以来的存在一样。CUDA 的优化和稳定性也要高得多。
2。$AMD 在优化 ROCm 方面取得了长足的进步,但它仍需要赶上 CUDA。他还认为,ROCm 的缺点是其支持 $AMD 和其他硬件的异构性质,这增加了复杂性。另一方面,CUDA仅针对$NVDA硬件进行了优化。
3.CUDA 拥有大量库,而 ROCm 的库仍在不断发展。他还指出,与与超大规模公司建立合作伙伴关系的CUDA相比,ROCm在合作伙伴关系方面的表现不佳。
4。他认为
$亚马逊 (AMZN.US)$ AWS 的 Trainium 芯片的性能介于 NVDA H100 美元和 NVDA A100 美元之间。他真的很喜欢LLM的H100;随着P5实例的推出,他们将培训成本降低了40%。
5。他认为该行业存在一些瓶颈,包括$NVDA:
-存在与产量、缺陷密度和整体过程稳定性相关的问题的高级节点
-材料限制,硅现在已达到物理极限。
-散热挑战。他指出,$NVDA很难平衡功耗和性能。
-互连延迟。尽管$NVDA开发了NVLink和Infinity Fabric,但围绕这个话题仍然存在问题。
6。在他看来,该行业最令人兴奋的发展是光互连,人们正在探索光学互连以取代传统的铜基互连,从而提供更高的带宽和更低的延迟。
FumooFu : 这位前 nvidia 员工现在在哪里工作?