紫影基地

 找回密码
 立即注册
查看: 123|回复: 0

特斯拉Dojo超级计算机:顶级算力平台加速爆发,国内布局龙头梳理

[复制链接]
阅读字号:

2002

主题

2117

帖子

21万

积分

超级版主

Rank: 8Rank: 8

积分
210307
发表于 2024-2-6 17:53:17 来自手机 | 显示全部楼层 |阅读模式


特斯拉正在美国德克萨斯州奥斯汀总部建设一个地堡式结构的建筑,以容纳其自主开发的Dojo超级计算机的一部分。Dojo超级计算机将帮助运行支持特斯拉电动车自动驾驶功能的人工智能软件。

特斯拉首席执行官埃隆·马斯克表示,特斯拉自研Dojo是为了实现FSD比人类安全10倍的目标,需要强大的算力支撑。目前英伟达GPU供应紧张并且价格高昂,因此特斯拉必须寻找其他解决方案。

特斯拉积极推进Dojo超算集群的研发及建设进程,旨在更好地推动FSD算法升级迭代等。特斯拉构建了一个真实世界的仿真系统来加速FSD算法的训练。

Dojo将赋能特斯拉多模态神经网络训练、自动标注技术、基于车队数据的三维场景重建等,以使车辆更好地适应周围的环境并做出正确的决策。#特斯拉#
此外,埃隆·马斯克表示,特斯拉最终会利用Dojo超级计算机为其他公司提供云服务,就像亚马逊的云服务AWS一样。未来,Dojo有望成为特斯拉的AI基础设施,为特斯拉的自动驾驶、人形机器人、X、SpaceX等领域提供全方位支持。

想了解更多精彩内容,快来关注乐晴智库

特斯拉超算平台Dojo概览梳理
特斯拉自研超级计算平台Dojo,其设计基于超大计算集群。Dojo是一套完全自主研发的系统,在服务器层采用自研芯片,并开创了全新的芯片互联模式,提升了芯片互联速率和存储规模,更高效地服务于内部应用的算力需求。

特斯拉完全定制了Dojo架构,包括计算、网络、输入/输出(I/O)芯片、指令集架构、电源传输、冷却等,具备高可扩展性和分布式系统。Dojo具备超高集成度,并非根据小系统拓展而来,旨在高效地处理海量视频数据并定制神经网络训练。

Dojo从底层开始由Core、D1、Tile、Tray、Cabinet、ExaPOD构成。其中Core内部为存算一体架构;D1芯片由354个Core构成,在BF16精度下算力达362TFLOPs,I/O带宽明显高于GPU等芯片;Tile由25个D1芯片打造,通过InFO_SoW封测技术实现低延迟、高带宽,4边对外传输带宽均为9TB/s;ExaPOD由3000个D1芯片构成,在BF16精度下算力高达1.1 EFLOPs。


特斯拉计划利用Dojo对海量的视频数据进行无监督学习,以加速特斯拉的Autopilot和完全自动驾驶(FSD)系统的迭代,同时为特斯拉的人形机器人Optimus提供算力支持。

在Dojo超算庞大规模的算力硬件支撑下,特斯拉将具备采集、训练和进化的能力,能够更理想地采集道路交通标识、生物形象、路面情况等信息,通过对数据的分析迭代更新以实现更加完善的自动驾驶模型。

同时,Dojo将加速人形机器人的开发,其能够为机器人的神经网络训练提供算力支持,更快速地处理海量数据,有望推动机器人加速落地。

软硬件层面归一化,带来的计算效率提升:


特斯拉算力规划明确
在2021年8月,特斯拉首次公开介绍了用于训练自动驾驶汽车人工智能(AI)模型的超级计算机Dojo,这是一种基于D1 Dojo芯片的晶圆上系统级方案。

Dojo的核心单元是由特斯拉自主研发的神经网络训练D1芯片,这款芯片采用了7纳米工艺制程,拥有500亿个晶体管和354个训练节点。每个Dojo由25颗D1芯片组成,可以提供高达36TB/s的带宽和9PetaFLOPS(9千万亿次)的算力。而由120个Tile组成的Dojo Pod,就构成了一个完整的超级计算机。

2022年9月30日的AIDay上,特斯拉展示了Dojo的未来路线图,并透露AI团队正在研发新版本的Dojo超级计算机组件,包括DojoD2芯片、DojoTrainingTileV2、DipV2以及DNICV2。

2023年7月,Dojo进入投产阶段,这标志着特斯拉进入算力集群快速建设的新阶段。

根据特斯拉在2023年6月份发布的算力发展规划,Dojo将在2024第一季度成为全球排名前五的超级计算机设施。

特斯拉预期在2024年10月份达到100 EFlops的超级算力,这相当于30万块英伟达A100显卡的算力总和。这将为特斯拉的自动驾驶、人形机器人、X、SpaceX等领域提供更加强大的支持。

2024年10月,特斯拉Dojo超算集群算力规模预计将达到100EFlops:


资料来源:特斯拉
结语
国内有众多厂商参与特斯拉Dojo超算平台的布局,其中世运电路已经在今年二季度开始供应Dojo项目的PCB产品,而胜宏科技则在去年就已经进入了特斯拉客户服务器Dojo的PCB供应链,为特斯拉自研AI服务器Dojo供应板卡PCB和接口PCB,单片价值量达到了70~90美元。

在先进封装环节,包括通富微电、文一科技、华天科技、长电科技、甬矽电子和华海诚科等公司都有参与其中。

而在高算力芯片方面,海光信息、寒武纪、龙芯中科、景嘉微、好利科技、航锦科技等公司是主要供应商。


中国作为全球自动驾驶发展最快的市场,其超算供应链也在积极把握新的发展机遇。特斯拉Dojo的推出也将刺激国内超算市场的发展,主要厂商包括紫光股份、浪潮信息、中科曙光、拓维信息积极布局。此外,鸿博股份、光环新网、云赛智联、青云科技、优刻得恒润股份等AI云厂商也在参与其中。

整体而言,特斯拉Dojo的愿景不仅仅局限于硬件架构和软件编译器的优化。它的目标是通过构建一个统一的加速器来推动计算范式的转变。这个加速器将超越传统的CPU和GPU架构,以更高效、更灵活的方式进行计算,满足未来更为复杂和多样化的计算需求。

未来,特斯拉Dojo的愿景可能将进一步扩展到边缘计算和物联网领域。借助高效的分布式计算网络,Dojo的加速器有可能在各种设备上实现实时AI处理、数据分析和高性能计算。这将对智能家居、自动驾驶等应用产生深远的影响。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|紫影基地

GMT+8, 2025-1-12 13:34 , Processed in 0.081563 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表