個人中心
登出
中文繁體
返回
登入後諮詢在線客服
回到頂部

Meta,H100每3小時報告一次故障。

$英偉達 (NVDA.US)$Meta在進行Llama 3大型語言模型訓練時,H100 GPU的頻繁故障問題變得顯而易見。在16384個H100 80GB GPU進行訓練期間,平均每3小時就發生意外的組件故障,超過一半的故障是由GPU或內存引起的。
免責聲明:社區由Moomoo Technologies Inc.提供,僅用於教育目的。 更多信息
5
2
3
+0
2
原文
舉報
瀏覽 1.5萬
評論
登錄發表評論
83粉絲
1關注
122來訪
關注