软件开发资讯 对垒英伟达,AMD还差在哪儿?
文 | 半导体产业纵横软件开发资讯
在科技赶紧发展的时期,半导体行业弥远是焦点场所。AI 芯片鸿沟更是犹如战场,各大厂商你争我夺。
近日,AMD 推出新款芯片 MI325X,并随之更新了 AI 芯片道路图,这一举措在业内激发了强烈反响。与此同期,东谈主们粗犷热议,AMD 是否能够向英伟达的联结地位发起有劲挑战?AMD 又能从这场强烈的竞争中劫夺些许得手的果实?除了 AMD,英伟达需要面对的挑战还有哪些?
在此之前,一齐了解一下 AMD 的新款芯片 MI325X 带来哪些亮点?以过火最新的 AI 芯片道路图又袒露了何种信息。
MI325X,能否与 B200 掰手腕?
AMD 最新推出的 Instinct MI325X AI 加快器,在大获取手的 MI300X 基础上再进一步,着重增强了 HBM 内存部分。
在 AMD 的表述中,主要将其与英伟达前代产物 H200 进行对比,而在本年 3 月,英伟达发布了其新款 AI 芯片 B200。至于 AMD 这款新品与英伟达的 H200 比较有哪些亮点,这款产物有莫得本事与英伟达的最新 GPU B200 掰掰手腕?
为了对比更为注重,本文再次将这几款产物进行对比。
AMD 最新推出的 Instinct MI325X AI 加快器接管了 AMD CDNA 3 GPU 架构,内置 1530 亿个晶体管,配备 256GB 下一代 HBM3E 高带宽内存,提供 6TB/s 的内存带宽。此外,MI325X 在 FP8 和 FP16 精度下隔离达到 2.6 PF 和 1.3 PF 的峰值表面性能。
行为对比,英伟达 3 月发布的基于 Blackwell 架构的 B200 GPU 基于台积电的 N4P 制程工艺,领有高达 2080 亿的晶体管数目和 192GB 的 HBM3e 内存容量,提供了 8TB/s 的内存带宽,以及 20PF 的 FP8 峰值性能。
英伟达 B200 GPU 的 AI 运算性能在 FP8 及新的 FP6 上皆可达 20 PF,是前一代 Hopper 构架的 H100 运算性能 8 PF 的 2.5 倍。在新的 FP4 智商上更可达到 40 PF,是前一代 Hopper 构架 GPU 运算性能 8 PF 的 5 倍。
从工艺制程上来看,MI325X 未作败露,而 B200 接管上文所述的台积电 N4P 制程工艺。
从晶体管数目来看,英伟达 B200 此数值两倍于 AMD MI325X。
从内存角度来看,AMD MI325X 有着更高的内存容量,这可能使其在某些 AI 模子的推感性能上发扬出色,但其带宽低于英伟达 B200 的 8 TB/s。
从 FP8 峰值性能来看,英伟达 B200 以 20 PF 的 FP8 峰值性能脱颖而出。天然在浮点运算本事上,B200 举座上要优于 MI325,但 MI325 的性能也足以得志大多数东谈主工智能和高性能揣度的需求。
从量产时候来看,两者的量产时候较为接近。AMD MI325X 展望在 2024 年第四季度郑重投产,2025 年一季度运行向客户委用。英伟达的 B200 芯片原谋划于本年晚些时候郑重出货,关联词由于 Blackwell 产能问题影响,其新款 Blackwell B200 芯片将蔓延发布三个月或更万古候,批量出货或蔓延至来岁第一季度。
总体而言,AMD MI325X 与英伟达 B200 比较,仍存在权贵差距。不外,与英伟达的前代产物 H200 比较,MI325X 的数据参数已有了大幅普及。
AMD 数据骄气,MI325X 与英伟达 H200 的集成平台 H200 HGX 对比,MI325X 平台提供 1.8 倍的内存量、1.3 倍的内存带宽和 1.3 倍的算力水平。苏姿丰还暗示,在运行 Meta 的 Llama 3.1 大模子时,MI325X 的推感性能比 H200 高出 40%。
改日 AI 芯片道路图,再度更新
除了芯片的发布,AMD 还公布了最新的 AI 芯片道路图。
AMD 的 AI 芯片布局
AMD Instinct MI350 系列首款产物即 Instinct MI355X,将引入新一代的 CDNA 4 架构,接管 3nm 工艺制造,搭配 HBM3E,总容量进一步普及到 288GB,对应带宽提高到 8TB/s,TDP 也高涨到 1000W,谋划 2025 年下半年运行发货。
按照 AMD 的说法,Instinct MI355X 提供了 2.3PF 的 FP16 和 4.6PF 的 FP8 揣度性能,比较前代产物的普及幅度约为 77%。此外,新产物还将接济新的数据类型,包括 FP4 和 FP6。
另外,基于下一代 AMD CDNA " Next "架构的 AMD Instinct MI400 系列展望将于 2026 年上市。
英伟达的 AI 芯片布局
沿着筹算的 AI 蓝图,英伟达加快前行,接下来将一年就更新一代产物,以往时时是两年更新一代。
本年 6 月,英伟达 CEO 黄仁勋带来了最新的 AI 芯片道路图。
脚下,Blackwell 架构的 GPU 产物正在坐褥中,将成为 2024、2025 年的蹙迫营收驱动。
接下来,英伟达谋划发布一个增强版 Blackwell Ultra GPU ( 8S HBM3e 12H ) ,展望将于 2025 年推出。这款芯片将领有 8 堆叠 HBM3e 内存,每叠有 12 个 die 高。B100 中的叠层或者是 8 堆叠,因此这应该代表 Blackwell Ultra 上的 HBM 内存容量至少加多 50%,以至可能更多,具体取决于所使用的 DRAM 容量。HBM3E 内存的时钟速率也可能更高。
下一代 Rubin GPU ( 8S HBM4 ) 和相应的平台将于 2026 年上市,这款芯片在此前的英伟达道路图中曾被称为 X100,Rubin GPU 将使用 HBM4 内存,并将有 8 个堆栈,或者每个堆栈皆有 12 个 DRAM。
随后于 2027 年的 Rubin Ultra GPU 将有 12 个 HBM4 内存堆栈,况且可能还有更高的堆栈。
小程序开发为了有更直不雅的对比,不错仔细查阅下图:
那么,从时期道路图的角度进行不雅察,AMD 与英伟达在发展程度上似乎并莫得太大的差距。关联词,在骨子应用场景当中,这两家企业之间的较量究竟呈现出怎么一番征象呢?当产物真的干与到各式应用场景中时,不管是在游戏体验、专科图形处理,如故在东谈主工智能等关连鸿沟,AMD 和英伟达的产物会各自愿挥出怎么的性能?
较量之下,英伟达依旧是最大赢家
夙昔数年间,英伟达在数据中心 GPU 市辘集占据了主导地位,险些组成了操纵,而 AMD 则耐久稳居次席。
财叔双色球:上期中一等奖861万,小单中4+1,076期中5+1,近期财叔中双色球大乐透一二等奖共获1575万元!上期财叔红胆06、14+偶数蓝球助攻一举拿下一等奖861万元[查看今日推荐]
号码四区分析:上期奖号四区比为5:6:7:2,其中第一区走温,开出奖号:03、04、12、16、17,第二区走热,开出号码:23、28、30、31、34、37,第三区走热,软件开发价格开出号码:46、48、50、51、56、58、59,第四区较冷,开出号码:65、66;最近10期奖号四区比为53:43:59:45,总体上第二区表现较冷,第三区表现活跃,本期号码四区比参考6:5:5:4。
字据本年纪首富国银行的统计,英伟达面前在数据中心 AI 市集领有 98% 的市集份额,而 AMD 仅有 1.2% 的市集份额,英特尔则惟有不到 1%。
近日,字据摩根士丹利分析师发布的讲演称,英伟达 Blackwell GPU 改日 12 个月的产能如故被预定一空。这意味着现不才订单的新买家必须比及来岁年底才能收到货。摩根士丹利的分析师 Joseph Moore 在给客户的一份讲演中指出,英伟达的传统客户(AWS、CoreWeave、Google、Meta、Microsoft 和 Oracle等)如故购买了英伟达过火合营伙伴台积电在改日几个季度将能够坐褥的整个 Blackwell GPU。
如斯压倒性的需求可能标明,尽管来自 AMD、Intel、云作事提供商(自研 AI 芯片)和各式袖珍公司的竞争加重,但英伟达来岁的 AI 芯片市集份额将会进一步增长。
不外,AMD 并莫得因此懊恼。AMD 在与英伟达的竞争中,耐久将自身看作"市集的多一种选拔"。苏姿丰此前暗示,AI 芯片市集实足大,容得下多家企业," AMD 不是必须要击败英伟达才能得手"。
市集商议机构 Moor Insights&Strategy 首席分析师帕特里克 · 莫尔黑德(Patrick Moorhead)暗示," AMD 面对的最大挑战是获取企业市集份额。AMD 需要在销售和营销方面干与更多资金,以加快其企业增长。"
从现时 AI 市集竞争神态来看,尽管 AMD 新款 GPU 较以往有所高出,但业界分析师觉得,AMD 的时期至少过期英伟达一年。
不外,字据好意思国投资银行和金融作事公司 KeyBanc 分析师约翰・温(John Vinh)的分析,他觉得本年AMD MI300X AI 加快卡的出货量将冲破 50 万张。该分析师觉得在数据中心鸿沟,英伟达天然一骑绝尘,AMD 难以望其肩背,然而 Instinct MI300X 凭借着不凡的实力,极高的性价比,成为行业客户的蹙迫备选决议,包括联念念在内的部分公司皆招供 MI300X,这最终为 AMD 带来了更多的业务。
在近日的芯片发布会上,AMD 还强调了与甲骨文、谷歌、微软、Meta 等厂商的合营关系,苏姿丰称,微软、OpenAI、Meta、Cohere 等多个厂商的生成式 AI 平台已接管 MI300 系列驱动。
至于英伟达究竟有何上风,以及基于哪些条目使其在 AI 盛行的时期脱颖而出,主要有以下几点。
两者对比,差距在那里?
第一,英伟达的 AI 芯片自身性能就十分强悍。从架构设想上来看,英伟达的 AI 芯片接管了高度优化的架构;在浮点运算本事方面,英伟达的 AI 芯片发扬不凡。浮点运算本事是揣度芯片处理本事的要害谋划之一;英伟达的芯片还具备出色的并行处理本事。AI 揣度任务时时具有高度并行化的特色,英伟达的 AI 芯片通过集成多数的揣度单位,能够同期处理多个数据块。这种并行处理本事不错让芯片在处理 AI 任务时充分期骗数据的并行性,进一步提高揣度成果;在内存带宽和蔼存设想上,英伟达也有独有的上风。
除了强悍的芯片性能,英伟达在以下几个方面的辛苦也多有裨益。
第二,在研发干与方面,英伟达向来不吝 "血本"。据悉,英伟达在达成七月份的季度中录得 30.90 亿好意思元的研发用度。将这一数字按年揣度,这家 GPU 制造商一年的累计研发用度约 123.6 亿好意思元。
比较之下,AMD 在其达成 6 月底的季度中录得 15.93 亿好意思元的研发用度。将这一数字按年揣度,该公司一年的累计研发用度为 63.72 亿好意思元。换句话说,字据面前的年化预测,英伟达面前的研发干与是 AMD 的 2 倍。
其着实发展初期,英伟达就尽头宠爱研发坐褥力。2005 年,AMD 的研发用度为 11 亿好意思元,是英伟达的 3.2 倍控制;而到了 2022 年,英伟达的研发用度就达到 73.4 亿好意思元,是 AMD 的 1.47 倍。达成整个这个词 2024 财年(2023 年天然年),英伟达研发用度高达 86.75 亿好意思元,是 AMD 同期研发用度的 1.48 倍。
夙昔 10 年(2014-2023 天然年),英伟达累计干与用度高达 364 亿好意思元,高于苹果公司、微软公司等科技巨头。跟着研发干与的不休增长,英伟达通过时期高出缩小资本和产物价钱,不休推出新的产物诱惑更多铺张者,上风天然也渐渐突显。
第三,在生态布局方面,英伟达下手也颇早。英伟达推出 CUDA 平台,使得期骗 GPU 来历练神经汇聚等高算力模子的难度大大缩小,将 GPU 的应用从 3D 游戏和图像处理拓展到科学揣度、大数据处理、机器学习等鸿沟,这一世态系统的配置让好多设备者依赖于 CUDA,进一步加多了英伟达的竞争壁垒。
如今 AMD 在霸占市集份额时遭受的最浩劫题,就在于英伟达期骗自家 CUDA 平台,已在 AI 软件设备鸿沟配置起一条护城河,把不少设备东谈主员紧紧绑定在了英伟达的生态系统里。行为应付,AMD 一直在不休优假名为 ROCm 的软件,方针便是让 AI 设备东谈主员能更猖厥地把更多 AI 模子"搬"到 AMD 的芯片上。面前,ROCm 的最新版块 6.2,相较于旧版在推理和历练上皆有了卓越 2 倍的普及。
第四,英伟达凭借早期与台积电的缜密合营,得以在先进制程的获取上霸占先机。在芯片制造中,先进制程工艺能够权贵普及芯片的性能发扬。英伟达与台积电耐久踏实的合营关系,使其在芯片坐褥的供应链处罚上愈加熟识。这种熟识体当今坐褥谋划的精准安排、坐褥周期的灵验限度以及产物良率的保险上。英伟达不错字据市集需求预测,合理安排芯片的坐褥谋划,确保产物能够实时供应市集,得志客户需求。同期,在坐褥进程中,较高的产物良率意味着更低的坐褥资本和更高的坐褥成果。
比较之下,AMD 在争取台积电先进制程产能时,相通受到英伟达订单的挤压,在坐褥谋划和良率限度方面可能面对更多的概略情味,这在一定程度上影响了 AMD 产物的市集竞争力和供货踏实性,进而导致其在 AI 芯片市集份额争夺中处于弱势。
结语
说七说八,英伟达在研发干与、生态布局、坐褥制造以及芯片性能等方面皆展现出雄壮的实力,这使其在现时的 AI 芯片市辘集占据了完全的主导地位。关联词,AMD 并非毫无契机。尽管面前 AMD 在这些要害鸿沟相较于英伟达处于弱势,但它正在积极地作念出改造和追逐。
跟着 AI 市集的不休扩大和时期的捏续迭代,改日充满了变数。十年之后的 AI 芯片市集将呈现何种竞争神态软件开发资讯,还未始可知。