个人中心
登出
中文简体
返回
登录后咨询在线客服
回到顶部
特斯拉一日暴涨10%: 特斯拉估值或激增5000亿
浏览 65.9万 内容 113

揭开道场的秘密

avatar
Noah Johnson 参与了话题 · 2023/09/12 04:09
1。什么是 Dojo?
Dojo 是特斯拉内部设计的专用超级计算机,用于训练安装在每辆特斯拉车辆上的全自动驾驶 (FSD) 系统。
Dojo可以取代特斯拉目前基于A100的数据中心,该数据中心拥有14,000个A100芯片,是全球第七大数据中心。
埃隆·马斯克在2019年的人工智能日首次提到了道场。Dojo 旨在解决训练大量视频数据的问题。作为一种名为Exapod的数据中心,它拥有3,000个D1芯片和1.1 eFLOps的单精度计算能力。
预计在2023财年将出货4万至5万个D1芯片。第一台ExaPod于2023年7月投入运营,预计将在短时间内将六台ExaPods(配备7.7eFLOPS)部署到帕洛阿尔托数据中心。2024 年第四季度的目标是实现 Dojo 的 100 个 eFLOP 的计算能力,相当于大约 91 个集群。
揭开道场的秘密
2。Dojo 与现有计算集群的比较
D1 专为支持 FSD 的视觉神经网络而设计,特斯拉开发了一个包含低级软件和编译器的全栈软件包。结果:
A。 Dojo 的训练效率高于 DGX A100,由 25 个 D1 芯片组成的方块提供的推理速度比 24 个 A100 快 30 倍。FSD 培训时间可以从一个月缩短到一周内。
B。 与Nvidia的A100相比,Dojo在相同的成本下性能提高了四倍,功耗降低了1.3倍,尺寸小了五倍,网络训练速度提高了4倍,自动注释速度提高了3.2倍。
C。道场的成本仅为A100的成本的1/6。要实现 100 个 eFLOP,将需要大约 300,000 个 A100 芯片,耗资约 75 亿美元。另一方面,如果部署91 Exapods,成本将仅为12.5亿美元左右,从而节省50亿美元。
揭开道场的秘密
揭开道场的秘密
3.特斯拉为什么要在内部开发 Dojo?
特斯拉的自动驾驶技术主要依赖于 “摄像头+传感器” 的视觉技术路线,这需要大量的数据来训练FSD系统。需要的数据越多,所需的计算能力就越大。如果要实现完全自动驾驶,将需要更多的计算能力来支持海量数据训练。但是,特斯拉在计算能力方面遇到了困难:
答:无法购买。在人工智能繁荣之后,所有科技公司都在争先恐后地购买Nvidia GPU。由于台积电的容量限制,英伟达的GPU供应不足,难以满足特斯拉的计算能力需求。
B. 负担不起。由于需求和供应的高度限制,Nvidia GPU的价格飞涨,增加了采购成本。
C. 成本效益不高。与Nvidia的通用芯片相比,使用像D1这样的专用芯片进行FSD视频数据训练将更高效,更快。特斯拉目前的需求很明确,那么为什么要把钱花在未使用的功能上呢?
4。部署 Dojo 会产生什么影响?
答:降低成本和提高效率,但目前没有准确的数据可以证实这一点。
B. 它有利于加速自动驾驶技术的发展,大大加快特斯拉实现完全自动驾驶的时间表,并显著提高软件业务(例如FSD订阅和授权)和共享出行业务(例如Robotaxi)的支付率和ARPU。
C. Musk的其他公司将受益于Dojo(例如X、SpaceX等)。
D. 未来,特斯拉可能会推出类似于亚马逊的云租赁服务,向非特斯拉客户开放Dojo并向其收费。
E. 其他获准使用FSD的汽车制造商自然需要部署Dojo来提高培训效率。如果随后证实Dojo系统的模型训练效率优于包括NVDA在内的其他计算系统,那么特斯拉可能会成为市场上最好的机器视觉训练系统提供商。
F. 其他涉及复杂视觉感知任务的场景也可以使用 Dojo(例如机器人、航空、安全等)。
揭开道场的秘密
免责声明:社区由Moomoo Technologies Inc.提供,仅用于教育目的。 更多信息
6
+0
原文
举报
浏览 3.8万
评论
登录发表评论