特斯拉DOJO+英伟达GPU+谷歌TPU+昇腾:趋势是带宽与扩展性!

发布日期:2024-10-06 20:22

来源类型:一起训练吧 | 作者:高雪儿

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【2024资料大全正版资料】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【澳门免费资料最新跑狗图】【2O24澳彩管家婆资料传真】
【494949澳门今晚开什么】 【2024新澳免费资料】 【澳门管家婆四肖选一肖期期准】

本期投资提示:

  特斯拉Dojo 芯片、华为服务器/AI 能力都是近期产业重要事件。本篇报告分析特斯拉Dojo/英伟达 GPU/谷歌TPU/华为昇腾等的异同,并做AI 产业计算和通信趋势的预测。

  Dojo 芯片与架构的特色至少包括存算一体/扩展性强/路由便捷/带宽高。在IEEE MICRO2020 上, 特斯拉发布FSD《Compute Solution for Tesla ’ s Full Self-DrivingComputer》。在2022 年8 月hotchips 34 大会上,特斯拉发布《The Microarchitectureof Dojo, Tesla’s Exa-Scale Computer》和《Dojo Super-Compute System Scaling forML Training》。Dojo 至少有存算一体/扩展性强/路由便捷/带宽高四个特色。

  英伟达GPU/谷歌TPU/昇腾AI/Tesla DSA,从架构解释异同。1)2010 年以来,英伟达GPU 主要架构至少包括八类,具备衍生关系。趋势:注重互联/注重带宽和扩展性/对AI 支持与时俱进(从Cuda Core 到Tensor Core,增加对INT/BF16 等AI 新趋势的支持,结构稀疏矩阵支持)。2)根据TPU 五代架构,趋势:注重互联/注重扩展性/对AI 支持与时俱进(如用脉动阵列的方法支持矩阵乘法)。3)根据华为官网和《机器之心》等,华为昇腾(达芬奇架构)应与谷歌TPU 有类似之处。4)共同点是扩展性/AI 甚至大模型下特殊操作,区别是Dojo 有特殊性(不同处理器设计是“架构向后兼容”,不需要颠覆架构)。

  计算部分的未来趋势:1)与时俱进,适应AI 数据精度/场景特殊运算。2)带宽最大化,延展性关键化。3)核心数可能减少。正文有详细论述。

  通信部分:DIP 和TTPoE 是Dojo 的网络核心。Dojo 系统的构架过程,以node 核心为最小单元,每1 个D1 包含354 个nodes、每1 个Tile 包含25 个D1、每1 个Tray 包含6 个Tiles,每个机柜包含2 组Tray。Dojo Interface Processor(DIP)用于HBM内存扩容、PCIe 扩展、以及对外的网络连接。Tesla Transport Protocol 可以对应于CXL、NVLink 等,基于以太网提供400Gb/s 的核心网络带宽。

  通信部分的未来趋势:Dojo 试图打破冯诺依曼约束,借助软件与网络,平衡系统中的时延、带宽、资源消耗量和传输距离。我们推算Dojo 的网络设备与器件使用情况,基础BasePOD 177 个机柜的规模下,假设fat-tree 的2 层交换架构组网且全部使用光通信系统,总共需要14160×2=28320 个光模块,对应177 个机柜中的53100 个D1 芯片,另外Host 系统预计也需要若干光模块。若Dojo 系统与Nvidia A100 系统对标,显著差异是网络带宽从200Gb 网络升级至400Gb、SRAM与DRAM容量与带宽提升、引入15kw的液冷封装方案,最终整体算力性能显著提升。

  流量环节:关注中际旭创、华工科技、新易盛、天孚通信、中兴通讯、紫光股份、锐捷网络等;计算环节:关注浪潮信息、胜宏科技(电子)、神州数码(tmt)等;华为产业链:

  关注华大九天(tmt,EDA)、软通动力(大模型+OS+数据库)、长电科技(电子,封测)、润达医疗 (医疗AI)、赛意信息(MetaERP) 、中软国际、广电运通、神州数码等;特斯拉和智能车产业链:关注德赛西威、立讯精密(电子)、双环传动(机械&汽车)等。

  风险:关注由于复工/宏观环境等扰动,2022-2023 年内存在业绩波动风险。GPU/DSA、智联汽车、机器人领域一向的风险依然是研究竞争、产业链地位与管理。若难以相对准确地把握,可能会选中了次好的公司,对投资产生不良的结果

李国豪:

4秒前:4)共同点是扩展性/AI 甚至大模型下特殊操作,区别是Dojo 有特殊性(不同处理器设计是“架构向后兼容”,不需要颠覆架构)。

Banton:

1秒前:若Dojo 系统与Nvidia A100 系统对标,显著差异是网络带宽从200Gb 网络升级至400Gb、SRAM与DRAM容量与带宽提升、引入15kw的液冷封装方案,最终整体算力性能显著提升。

文义帆:

9秒前:3)核心数可能减少。

Soric:

6秒前:通信部分:DIP 和TTPoE 是Dojo 的网络核心。