九游体育世界杯中国官网首页

九游体育世界杯中国官网首页 「选了谷歌,落伍一年!」好意思国AI魁首「砸场」谷歌:省点钱却输了时辰!英伟达笑醒?

发布日期:2026-05-29 15:54    点击次数:126

九游体育世界杯中国官网首页 「选了谷歌,落伍一年!」好意思国AI魁首「砸场」谷歌:省点钱却输了时辰!英伟达笑醒?

AI短剧中的情节照进现实。

就在谷歌年度开导者大会进行时,AI业界魁首却绝不原谅地砸场子!到底有多大怨念?

就在几天前的谷歌I/O大会进行期间,文生图AI驰名企业Midjourney创举东说念主兼CEO大卫·霍茨( David Holz)却绝不原谅地公开吐槽谷歌TPU,激发了硅谷AI圈的平素看管。

霍茨在X平台上示意,因为早年选拔了谷歌TPU而非英伟达GPU看成中枢磨真金不怕火基础技艺,Midjourney的说合程度比本不错达到的水平落伍了整整一年。“要是不错回到畴前,我会一启动就都备采用英伟达芯片。”

这句话之是以具有弘远杀伤力,因为这是来自一家与谷歌有深度调解的驰名AI企业,当初是谷歌云扩张自家芯片的一张牌号,况且他们还靠谷歌TPU神圣了三分之二的推理本钱。此次吐槽相当于给英伟达作念了最佳的背书。

霍茨为什么如斯不给谷歌颜面,要在谷歌发布新芯片的时候砸场子?

一场真实代价的公开复盘

固然,霍茨不是随口抱怨,而是用真实代价作念出的公开复盘。它波及了现时AI基础技艺竞争最中枢的矛盾:硬件性能的竞赛除外,软件生态的护城河才是确切决定输赢的战场。

要交融霍茨的抱怨,需要先厘清谷歌TPU和英伟达GPU在说合场景下的实质互异。

举个例子,GPU相当于通用并行揣摸的瑞士军刀。英伟达的CUDA平台从2007年就启动布局,今天照旧积贮了快要二十年的生态千里淀,成为AI行业通用的平台。

AI说合员最常用的框架PyTorch与CUDA深度绑定,Hugging Face上险些通盘开源模子权重默许GPU格式发布,Nsight性能分析器、NCCL通讯库、TensorRT推理优化用具——这是一套完好意思的说合用具链。人人的AI说合员从学校启动就在CUDA上写代码,PyTorch是他们的母语。

而TPU则是另一种生态。它是专用集成电路,底层架构围绕脉动阵列打算,迥殊优化深度学习张量运算,在大范畴安稳磨真金不怕火任务上恶果极高。但它要求使用JAX或TensorFlow框架,对PyTorch的守旧恒久支离落空。社区资源匮乏,调试用具不教育,险些通盘的排错都要依赖谷歌我方的文档。

回到Midjourney的具体需求,他们作念的是图像生成说合,需要大批自界说算子实验、快速原型迭代,以及随时调用Hugging Face生态里的扩散模子组件。这些责任在GPU+PyTorch的环境下如胶投漆,在TPU上却设施维艰。

举个苟简例子,一个说合员念念考证一个新念念法,在GPU上可能只需要几小时;在TPU上,光是树立环境和适配框架就可能消耗几天。恒久累积下来,等于霍茨所说的“落伍了一年”。

当初为何选拔谷歌TPU?

不外需要强调的是,霍茨的吐槽迥殊针对说合和磨真金不怕火阶段。在推理阶段,这个逻辑就都备不同。这亦然他们当初为什么搬动到谷歌TPU的班师能源,因为用谷歌TPU不错实打实地省钱,况且无用和巨头们争抢英伟达显卡。

早在2023年,谷歌云就高调官宣,Midjourney 照旧选拔谷歌看成其中枢基础技艺供应商。Midjourney 欺诈谷歌的 TPU v4/v5(基于 JAX 框架)来磨真金不怕火其第四代和第五代的文生图大模子;同期,租用谷歌云上的 英伟达 GPU 集群,来处理人人用户数以亿计的日常生成推理。

Midjourney的选拔很现实。那时英伟达的 H100 被抢疯了,Midjourney 看成一个莫得巨头撑腰的零丁AI公司,压根排不上号。而谷歌的 TPU 算力管够,且对图像这种大范畴矩阵运算的性价比(不错省下六成的本钱)在纸面上荒谬诱东说念主。

2025年第二季度,Midjourney将主力推理集群也从英伟达A100/H100搬动到谷歌Cloud TPU v6e,月度推理开销从约210万好意思元骤降至70万好意思元以下,年化神圣特出1680万好意思元,回本周期仅11天。

换句话说,TPU在范畴化推理上的性价比上风是真实的。霍茨确切悔过的是:我方应该在说合阶段用英伟达打磨模子,推理阶段再搬动到谷歌TPU降本;而不是从一启动就在TPU上作念说合,为此付出一年的程度代价。

英伟达护城河是生态?

霍茨的公开吐槽,实质上是一份对英伟达生态护城河的证词。英伟达的护城河不在于H100比TPU快几许,而在于无数说合员的责任习气、更仆难尽的开源代码库,以及通盘这个词学术界默许GPU看成实验平台的行业惯性。

2026年,PyTorch在说合论文中的占有率仍高达85%。险些通盘前沿说合的代码都基于英伟达硬件。这意味着,任何念念要使用TPU作念说合的团队,都必须承担一个隐性本钱:将我方与主流社区遏制,烧毁大批现成的用具和资源,在一个相对小众的技艺栈里独自探索。

这等于为什么即便TPU在某些认识上照旧与GPU相当甚而更优,业界大多数说合实验室仍然默许选拔GPU。约略硬件性能不错追逐,生态积贮无法速成。黄仁勋花了快要二十年时辰诞生的这条护城河,开运中国app官方手机版恰是英伟达最值钱的财富。

谷歌显然雄厚到了问题所在。在本年的谷歌云Next大会上,谷歌发布了第八代TPU,并初度采用双芯片策略:TPU 8t(磨真金不怕火)和TPU 8i(推理)。这是TPU历史上第一次将磨真金不怕火和推理分拆成两颗架构都备不同的专用芯片,等于为了搞定霍茨吐槽的问题。

TPU 8t代号Sunfish,由博通调解打算,面向大范畴预磨真金不怕火。超等Pod范畴达9600颗芯片、分享2PB HBM,磨真金不怕火性价比比上代Ironwood提高2.7倍。TPU 8i代号Zebrafish,由联发科打算,专攻推理和serving,将片上SRAM扩大至384MB,芯片互联带宽翻倍至19.2 Tb/s,并引入全新的Boardfly齐集拓扑,将1024芯片树立的最大齐集跳数从16跳降至7跳,在大型MoE模子低蔓延推理上性价比比Ironwood提高80%。两款芯片采用台积电2纳米工艺,预测2027年量产。

谷歌此次双芯片计谋自身等于一次蹙迫的计谋承认:磨真金不怕火和推理照旧分化成两种都备不同步地的责任负载,一颗芯片无法再同期优化两头。这与英伟达“一块GPU通吃”的阶梯形成了昭彰对比,亦然谷歌对英伟达Vera Rubin NVL72和亚马逊Trainium3的正面回击。

况且谷歌此次不仅仅发布了新硬件。针对霍茨对TPU生态的抱怨,谷歌同步推出了TorchTPU款式——一个让PyTorch原生运行在TPU上的工程筹谋,面前处于预览版现象。

按照谷歌的阶梯图,TorchTPU将守旧PyTorch的Eager Mode、与vLLM和TorchTitan深度集成、并最终实现到完好意思Pod范畴的线性扩展。要是TorchTPU确切教育,那些着力PyTorch的说合团队将第一次能够在不重写代码的前提下使用TPU。

然则,TorchTPU面前仍是预览版,不是认真发布版。霍茨那种“改个架构、调个算子、快速考证念念法”的说合责任流,在TPU 8t上是否确凿像在H100上一样顺滑,还需要大批实战考证。一扇门照旧大开,但门后的路有多平坦,2027年认真量产之后智力见分晓。

Claude为什么横跨三平台?

要是Midjourney对TPU的磨真金不怕火生态有这样多不悦的话,那么当今AI行业新领头羊Anthropic是若何搞定脚踏三条船的挑战的?要知说念他们同期在英伟达GPU、谷歌TPU和亚马逊Trainium三套硬件上磨真金不怕火和运行Claude。

Anthropic底本是处于AI第一集团的追逐者变装,财力远远弗成和谷歌和OpenAI比较,因此他们接收了谷歌和亚马逊的多量投资,交换条目之一等于使用这两个巨头的TPU和Trainium芯片。

谷歌和亚马逊都是Anthropic的计谋投资者,九游体育世界杯中国官网首页两家巨头先后给Anthropic投资了近100亿好意思元。再加上微软投资的50亿好意思元,相当于人人三大云揣摸巨头在协力扶养着Anthropic。

巨头们可不是单纯的财务投资。这些投资有一大部分都折现成了谷歌和亚马逊的营收,因为Anthropic面前使用着特出百万张亚马逊Trainium芯片,迥殊用于磨真金不怕火和部署最新的Claude模子,同期使用着数十万张谷歌TPU,并筹谋在将来安详拓展到百万TPU阵列。

与此同期,谷歌云、AWS以及微软Azure亦然Claude在人人B端市集的主要分发平台。三大万亿级巨头都念念用我方的销售齐集帮Claude卖货,我方获取营收提成,更蹙迫的是,把算力流量留在自家的职业器里,同期搭售自家的云职业。

这种全面通吃的场面,也让 Anthropic 成为硅谷历史上成长速率最快、底牌最足的零丁AI巨头。最近他们还与SpaceX达成了算力租出公约,每年要支付150亿好意思元使用马斯克在田纳西州超算中心囤积的英伟达GPU芯片带来的算力。

那么,Anthropic是若何作念到同期使用三大平台芯片的?

Anthropic官方表述是:不同责任负载匹配最稳健的芯片。英伟达GPU联贯说合实验和快速原型;谷歌TPU和亚马逊Trainium折柳联贯大范畴磨真金不怕火和推理的主力责任负载,两家超等揣摸机供应商之间形成制衡,戒备单一平台威胁订价权。

Anthropic与亚马逊的调解范畴尤其引东说念主顾惜。两边已签署公约,Anthropic将在将来十年向AWS干预特出1000亿好意思元,获取最多5吉瓦的算力容量,遮蔽Trainium2到Trainium4。

意思意思的是,在最新谷歌云Next大会晓示与Anthropic深刻调解的时候,亚马逊站出来“公开邀赏”,宣称Claude的磨真金不怕火都备在Trainium上完成,Project Rainier——这个面前运行特出100万颗Trainium2芯片的集群——是人人最大的AI磨真金不怕火集群之一。

2026世界杯博亚体育(中国)官方平台

与此同期,Anthropic在谷歌Cloud Next大会前不久晓示扩大与谷歌和博通的调解,获取多吉瓦的下一代TPU容量,预测2027年干预使用。

Anthropic靠什么脚踩三条船?

Anthropic能走出这条路,有一个要津的技艺DNA:公司中枢创举团队来自Google Brain,JAX是他们的母语。从一启动,Anthropic就将JAX看成中枢磨真金不怕火框架——JAX的打算形而上学是硬件无关,吞并套代码通过XLA编译器不错在GPU、TPU乃至Trainium上运行。

这与Midjourney的旅途正值相背:Midjourney先在PyTorch+GPU的生态里建好说合责任流,再试图搬动到TPU,搬动本钱才变成了一年的失掉。

然则这种多平台策略亦然有代价的,Anthropic每次模子更新都要在三套架构上折柳测试,每个bug都有三个潜在成因,部署复杂度是单一平台决议的三倍。这是三平台策略必须承付的工程账单。

谷歌的 TPU 体系基于传统的 JAX 和 XLA 编译器。亚马逊的 Trainium 体系则基于 AWS 自研的 Neuron SDK。 这意味着,Anthropic 中枢的散播式磨真金不怕火框架,弗成班师平移。

因此,Anthropic的工程团队必须派驻顶尖的底层硬件优化行家,与谷歌和亚马逊的芯片团队闭门蚁合开导,将复杂的算子、羼杂精度磨真金不怕火代码,用三套都备不同的硬件底层汇编逻辑重写并优化。这种东说念主力本钱和时辰千里淀,如实远超隧说念使用英伟达生态的 OpenAI。

比较之下,Midjourney 的团队范畴极小,压根莫得 Anthropic 那种不错跟巨头芯片团队闭门魔改底层的千东说念主工程兵团。在濒临 TPU小众的 JAX/XLA 编译环境时,一朝遭逢诡异的硬件级 Bug,通盘这个词团队只可停工去死磕底层代码。

此外,2025年8至9月,Claude用户汇报了昭彰的性能下跌。Anthropic的过后复盘败露了三个零丁的基础技艺破绽:高下文窗口路由漏洞影响了某一平台上16%的Sonnet 4恳求;TPU职业器树立漏洞导致Opus 4和Sonnet 4输出损坏;XLA编译器破绽困扰Haiku 3.5长达两周。

Anthropic在我方的说合论文中反复强调:不要使用复杂的框架,保捏架构的相当苟简与可组合性。模子层打算得越隧说念、越少花活,在濒临多芯片平台交叉测试时,底层暴走漏的硬件 Bug 就越少,从而用“打算上的克制”化解了“平台上的繁复”。

付出了这笔昂贵的工程账单后,Anthropic 收货了全行业最鄙吝的果实。左证最新的 TCO(总领有本钱)数据,谷歌 TPU 和亚马逊 Trainium 在大范畴推理时的性价比,比英伟达平台整整逾越 50% 以上。

比较较OpenAI 赌的是“英伟达纯血生态+ Stargate 级单点超大算力”;而 Anthropic 则是用三倍的工程本钱,硬生生把我方逼成了一个“跨平台黏合体”。

这种底层基建的全面跑通,让 Claude 在如今多模态智能体大范畴并发、大流量朦拢的工业落地战斗中,领有了全行业最低廉、最不被单一方卡脖子的无穷算力大后方。这等于多平台策略阵一火短期东说念主力、一样恒久计谋制高点的终极完了。

将来样式:专用芯霎期间的竞争逻辑

话题回到霍茨的那条推文,某种程度上是AI基础技艺进入新阶段的一个缩影。接下来几年的竞争样式,照旧启动明晰。

磨真金不怕火侧的样式是:英伟达仍然是说合实验和快速迭代的首选平台,但在超大范畴安稳磨真金不怕火上,TPU和Trainium正在以性价比上风侵蚀份额。谷歌TPU 8t的2.7倍性价比提高、亚马逊Trainium3的捏续进化,意味着前沿AI实验室将越来越倾向于“说合用GPU、磨真金不怕火用专用芯片”的羼杂策略。

推理侧的样式愈加成心于挑战者。推理是AI基础技艺中增速最快的部分——2026年头推理已占AI算力总开销的55%,预测到2030年将占75%。在这个场景下,TPU和Trainium的专用优化能带来Midjourney那样65%的本钱削减,经济账算得通。谷歌TPU 8i恰是针对这一趋势的定向兵器。

生态侧的战局则更为恒久。TorchTPU能否确切让PyTorch说合员无缝搬动到TPU,是谷歌2027年最蹙迫的挑战。亚马逊的策略则更为求实:Trainium与PyTorch的兼容性一直是其主打卖点,通过Bedrock平台上十万家以上的企业客户积贮,正在偷偷构建我方的应用层生态。

但英伟达绝不会坐视敌手侵蚀我方的护城河,CUDA的捏续进化和Blackwell架构的推出,是对“GPU不是说合独一选拔”论调的最班师反击。

供给侧的变量也同样值得关怀,谷歌TPU的大范畴量产受制于台积电的先进封装产能,原筹谋2026年达到400万颗的场地已推迟至2027年。台积电现存AP8工场已满负荷,新的AP7平台首期产能已沿路分拨给苹果处理器,第二期年底智力干预。这意味着即便需求重生,TPU的供给在2026年仍将是制约身分,反而给英伟达留住了缓冲空间。

对大多数中袖珍AI公司而言,霍茨的悔过仍然具有履行意旨:说合阶段全用英伟达,生态摩擦最低,迭代速率最快。比及模子架构安稳、推理范畴上来,再评估TPU搬动的经济账。这不是因为英伟达更好,而是因为生态本钱在范畴较小时会压倒硬件本钱。

对Anthropic这个量级的前沿实验室,三平台策略的逻辑天壤悬隔:它不仅仅为了省钱,而是为了确保在职何单一供应商出现问题时,Claude的磨真金不怕火和职业都不会中断;同期用多平台需求看成筹码,在与亚马逊和谷歌的探讨中保捏议价智力。

硬件性能vs生态恶果,性价比vs说合速率,专用优化vs通用活泼,这是现时AI芯片干戈最中枢的几大矛盾张力。谷歌用双TPU计谋试图两头兼顾,亚马逊用Trainium的兼容性策略绕过生态壁垒,英伟达则用二十年积贮的软件护城河叛逆通盘挑战者。

莫得东说念主能买到通盘筹码,也莫得哪家公司的选拔是错的九游体育世界杯中国官网首页,都要付出不同的代价。在AI基础技艺的棋盘上,芯片性能早已不是独一的计分姿色。(新浪科技)

海量资讯、精确解读,尽在新浪财经APP




Copyright © 1998-2026 九游体育世界杯中国官网首页™版权所有

leberrobot.com备案号 备案号: 

技术支持:®九游体育世界杯 RSS地图 HTML地图