中文简体
返回
下载
登录后咨询在线客服
回到顶部
特斯拉一日暴涨10%: 特斯拉估值或激增5000亿
浏览 66.2万 内容 112

揭示道场的秘密

avatar
Noah Johnson 参与了话题 · 2023/09/12 17:09
1. 什么是道场?
Dojo是由特斯拉内部设计的专用超级计算机,用于训练安装在每辆特斯拉车辆中的全自动驾驶(FSD)系统。
Dojo可以取代特斯拉目前基于A100的数据中心,该数据中心拥有14,000个A100芯片,是世界第七大数据中心。
埃隆·马斯克在2019年的AI Day首次提到了Dojo。Dojo旨在解决训练大量视频数据的问题。作为一种名为ExaPOD的数据中心形式,它拥有3000个D1芯片和1.1EFlops的单精度计算能力。
预计在2023财年将发布4万至5万个D1芯片。第一个ExaPOD于2023年7月投入运营,预计在短时间内将在帕洛奥图数据中心部署六个ExaPOD(总共7.7EFlops)。截至2024年第四季度,Dojo的目标是实现1EFlops的计算能力,相当于约91个计算集群。
揭示道场的秘密
2. Dojo和现有计算集群的比较
D1已经专门设计用于支持FSD的视觉神经网络,特斯拉还开发了包括低层软件和编译器在内的全套软件包。因此:
A. Dojo的训练效率比DGX A100高,并且由25个D1芯片组成的一片瓦片的推理速度比24个A100快30倍。FSD的训练时间可以从一个月缩短到一周内。
b. 与Nvidia的A100相比,Dojo在相同成本下性能提升了四倍,功耗降低了1.3倍,体积减小了五倍,并且网络训练速度提高了4倍,自动标注速度提高了3.2倍。
C.Dojo的成本仅为A100的1/6。要实现100 EFlops,大约需要30万个A100芯片,成本约为75亿美元。另一方面,如果部署了91个Exapods,成本只需约125亿美元,可以节省50亿美元。
揭示道场的秘密
揭示道场的秘密
3. 特斯拉为什么要内部开发Dojo?
特斯拉的自动驾驶技术主要依赖于"摄像头+传感器"视觉技术路线,这需要大量数据来训练FSD系统。所需数据越多,所需的计算能力就越大。如果要实现完全自动驾驶,就需要更多的计算能力来支持大规模数据训练。然而,特斯拉在计算能力方面遇到了困难:
A. 买入受阻。人工智能热潮过后,所有科技公司都争相购买英伟达的gpu芯片-云计算。由于台积电的产能限制,英伟达的gpu芯片-云计算供应不足,难以满足特斯拉的计算需求。
b. 由于需求旺盛和供应不足,英伟达的gpu芯片的价格飞涨,使采购成本增加。
C. 不具成本效益。与英伟达的通用芯片相比,使用专用芯片D1进行FSD视频数据训练会更有效率和更快速。特斯拉目前的需求很明确,那么为什么要花钱购买未使用的功能呢?
4. 部署Dojo会有什么影响?
A. 降低成本并提高效率,但目前没有准确的数据来验证。
b. 有助于加速自动驾驶技术的发展,大大加快特斯拉实现全面自动驾驶的时间表,并显著提高软件业务(如FSD订阅和授权)和共享出行业务(如Robotaxi)的付费率和arpu。
C. 马斯克的其他公司也将受益于Dojo(如X, spacex(临时代码)等)。
D. 未来,特斯拉可能推出类似于亚马逊的云租赁服务,为非特斯拉客户开放并向他们收取Dojo费用。
其他获得FSD授权的汽车制造商将自然需要部署Dojo以提高培训效率。如果Dojo系统的模型训练效率随后被证实优于包括英伟达在内的其他计算系统,那么特斯拉可能成为市场上最好的机器视觉训练系统提供商。
其他涉及复杂视觉感知任务的场景也可以使用Dojo(如机器人,航空,安防等)。
揭示道场的秘密
免责声明:社区由Moomoo Technologies Inc.提供,仅用于教育目的。 更多信息
6
+0
原文
举报
浏览 3.9万
评论
登录发表评论