您当前的位置：首页 >> 家居优品

谁卡了英伟达的鼻子？

2024-01-20 12:17:29

M3E，更有牢牢误触了H100的销售用量：

H100 PCIe和SXM旧原版均用了5个HBM模板，H100S SXM旧原版可达到6个，英伟达直言的H100 NVL旧原版更有达到了12个。按照研究该机构的拆由此可知，单颗16GB的HBM模板，成本高就较极低240美元。那么H100 NVL单单缓存CPU的成本高，就将近3000美元。

成本高还是小弊端，显然与H100直接恶性竞争的谷歌TPU v5和AMD MI300即将用原型机，后两者同样将换到用HBM3E，陈能更加捉襟见肘。

面对暴增的消费，据说SK海力士已定下需求量高翻番的小目标，着右手扩建工程产线，三星和半导体公司也对HBM3E摩拳擦掌，但在太阳能电池服务业，扩建工程产线从来不是一蹴而就的。

按照9-12个同月的周期冷漠预计，HBM3E需求量高最少也想得到明年周内才能想得到可用。

另外，就算彻底由此可知决了HBM的需求量高，H100能供应多少，还得看DRAM的脸色。

CoWoS：DRAM的宝刀

交易商Robert Castellano恰巧做到了一个基准，H100换到用了DRAM4N传统观念工艺（5nm）生产商，一片4N传统观念工艺的12寸积体电阻器价格为13400美元，某种总体可以切割成86颗H100CPU。

如果不考虑生产商良率，那么每生产商一颗H100，DRAM就能获155美元的支出[6]。

但其实，大概H100给DRAM促使的支出很似乎大约1000美元，缘故就在于H100换到用了DRAM的CoWoSPVC系统设计，通过PVC促使的支出较极低723美元[6]。

每一颗H100从DRAM十八工厂的N4/N5产线上仍然，都能运往同在园区内的DRAM先进设备同月1号二工厂，未完成H100装配中会最为特别、也至关重要的一步——CoWoS。

要理由此可知CoWoSPVC的重要性，依然要从H100的CPU设计讲起。

在消费品级GPU的产品中会，缓存CPU一般都PVC在GPU当年前的外围，通过PCB板彼此间的电阻器传输讯号。

比如下图中会均是由英伟达公司出品的RTX4090CPU，GPU当年前和GDDR缓存都是基本上PVC便只用到一块PCB板上，彼此独立。

GPU和CPU都遵循着Otto·诺依曼核心，其当年前在于“存算分离”——即CPU处理原始数据时，必须从外部的缓存中会调取原始数据，计数未完成后便数据传输到缓存中会，一来一回，都能造成计数的延误。同时，原始数据传输的“数用量”也似乎会因此以外。

可以将GPU和缓存的间的关系相提并论武汉的松江和闸北，海陆间的物资（原始数据）输送必须依赖南浦大桥，南浦大桥的装载用量提议了物资输送的生产商成本高，这个装载用量就是缓存以太网，它提议了原始数据传输的速率，也间接严重影响着GPU的计数速率。

1980年到2000年，GPU和缓存的“速率失配”以每年50%的速率减小。理论上，就算修了龙耀路引道和上中会路引道，也不能满足松江闸北海陆物资输送的增长，这就避免较高安全性计数情节下，以太网已是了更为明显的瓶颈。

CPU/GPU安全性与缓存安全性彼此间的差异性悄悄收窄

2015年，AMD在应用HBM缓存的同时，也针对原始数据传输换到用了一种创意的彻底由此可知决设计方案：把松江和闸北只用起来。

最简单来说，2015年的Fiji核心驱动程的单，将HBM缓存和GPU当年前“切下”在了独自，把几块小CPU变成了一整块大CPU。这样，原始数据陡然生产商成本高就成倍提较高。

不过如上文举出，由于成本高和系统设计弊端，AMD的Fiji核心并很难让零售商卖账。但深达研修的发生以及AI军事训练对原始数据陡然生产商成本高不计成本高的渴求，让“CPU切下”有了用武之地。

另外，AMD的思路固然好，但也促使了一个新弊端——无论HBM有多少恶性竞争者，它都必须和“针CPU”的先进设备PVC系统设计因应，两者唇齿相依。

如果说HBM缓存还能货比三家，那么“针CPU”所用的先进设备PVC，看来看去就只有DRAM餐馆能做到。

CoWoS是DRAM先进设备PVC投身于的起点，英伟达则是第一个换到用这一系统设计的CPU美国公司。

CoWoS由CoW和oS组合成而来：CoW暗示Chip on Wafer，指裸片在积体电阻器上被吊挂的现实生活，oS暗示on Substrate，指在平板上被PVC的现实生活。

传统观念PVC一般只有oS片段，一般在代工工厂未完成积体电阻器装配后，交给第三方同月1号工厂彻底由此可知决，但先进设备PVC减小的CoW片段，就不是同月1号工厂能彻底由此可知决的了的。

以一颗完整的H100CPU为例，H100的裸片远处地理分布了多个HBM模板，通过CoW系统设计重新组合成在独自。但不只是重新组合成而已，还要同时构建裸片和模板间的通信。

DRAM的CoW区分开其他先进设备PVC的亮点在于，是将裸片和模板放在一个硫中会介层（直觉是一块积体电阻器）上，在中会介层中会做到网络连接通道，构建裸片和模板的通信。

类似的还有英特尔公司的EMIB，区别于在于通过硫桥构建网络连接。但以太网已远不及硫中会介层，显然以太网与原始数据传输速率息息相关，CoWoS便成了H100的唯一必需。

这便是误触H100需求量高的另一只右手。

虽然CoWoS效果逆天，但4000-6000美元/片的据悉还是拦住了不少人，其中会就包括富可敌国的苹果。因此，DRAM预备的需求量高远比可用。

然而，AI浪潮顿时发生，供需平衡不停被打破。

早在6同月就有传言称，本年度英伟达对CoWoS的消费已经达到4.5万片积体电阻器，而DRAM同月的预估是3万片，便突显其他供应商的消费，需求量高空隙大约了20%。

为了补足空隙，DRAM的阵仗不可谓不大。

6同月，DRAM正的单竣工同在南科的先进设备同月1号六工厂，虹无尘室就比其余同月1号工厂的加起来还大，并允诺逐季减小CoWoS需求量高，为此将均oS外包给第三方同月1号工厂。

但正如HBM扩产易于，DRAM扩产也必须小时。现阶段，均PVC设备、零组件交期在3-6个同月差不多，到同月内年前，新需求量高能开出多少仍是未知。

不依赖于的Plan B

面对H100的整体奇缺，英伟达也不是全然很难Plan B。

在净值发行后的电话似乎会议上，英伟达就透露，CoWoS需求量高已经有其他营运商参与认证。虽然没说基本是谁，但显然先进设备PVC的系统设计门槛，除了DRAM，也就只有英特尔公司先天不足的EMIB、三星开发了很久依然等不来供应商的I-Cube能勉强救火。

但当年前系统设计更改如同阵年前换到将，随着AMD MI300即将用原型机销售，AICPU恶性竞争白热化，是否能和英特尔公司和三星的系统设计很晚到位，恐怕黄仁勋自己心理也是惴惴。

比黄仁勋更犹豫的似乎是卖不到H100的云服务工制造厂商与AI始自美国公司。绝非的游戏关卡抢到不到驱动程的单，也就是的游戏帧数少了20帧；大美国公司抢到不到H100，很似乎就丢掉了几十亿的支出和上百亿的净资产。

必须H100的美国公司主要有三类：微软、亚马逊河这类云运营商；Anthropic、OpenAI这些始自美国公司；以及特斯拉这类大型生物科技美国公司，特斯拉的新旧原版FSD设计方案就用了10000块H100组成的GPU集群来军事训练。

这还没算上Citadel这类金融美国公司，以及卖不到特供旧版H800的中会国美国公司。

根据GPU Utils的基准[7]，保守据估计，现阶段H100的自给自足空隙达到43万张。

虽然H100依赖于某种总体的替代设计方案，但在实际上情况都缺乏可行性。

比如H100的年前代的产品A100，价格只有H100的1/3约莫。但弊端是，H100的安全性比A100强了太多，避免H100单位成本高的算力比A100较高。显然生物科技美国公司都是一个大张起购，卖A100反而更亏。

AMD是另一个替代设计方案，而且仅仅安全性和H100相差无几。但由于英伟达CUDA生态的壁垒，换到用AMD的GPU很似乎让MMORPG变得更慢，而换到用H100的恶性竞争对右手很似乎就因为这点偏移，和自己拉开了差异性，甚至上亿美元的投资血本无归。

曾一度避免，一颗整体废料成本高3000美元的CPU，英伟达直接加个零卖来，大家居然都抢到着卖。这似乎是黄仁勋自己也有一天的。

而在HBM与CoWoS需求量高加强之年前，卖掉H100的方法似乎就只剩下了一种：

等那些靠暗指逼融到买卖掉一堆H100的始自美国公司宣告破产，然后接盘他们的二右手GPU。

。

食道平散适合食道癌术后患者吃吗
八子补肾胶囊能抗衰老吗
八字经
胃烧心如何治疗
宝宝消化不良怎么调理好

标签：鼻子

上一篇：自行车进去，电瓶车出来？警方仅用一小时抓获一起盗窃案

下一篇：缅甸为何成了东南亚最乱的国家？真实缘故有3点