常用: 学生 教职工 校友 OA系统 邮件系统 VPN系统 图书馆 智慧门户 EN
首页 沙巴体育 沙巴体育app中国官网下载 「选了谷歌,过时一年!」好意思国AI首级「砸场」谷歌

沙巴体育app中国官网下载 「选了谷歌,过时一年!」好意思国AI首级「砸场」谷歌:省点钱却输了时期!英伟达笑醒?

发布时间:2026-05-30 来源:沙巴体育 作者:admin 浏览:147

沙巴体育app中国官网下载 「选了谷歌,过时一年!」好意思国AI首级「砸场」谷歌:省点钱却输了时期!英伟达笑醒?

可提现游戏平台中国官网

AI短剧中的情节照进现实。

就在谷歌年度开导者大会进行时,AI业界首级却绝不海涵地砸场子!到底有多大怨念?

就在几天前的谷歌I/O大会进行期间,文生图AI着名企业Midjourney独创东谈主兼CEO大卫·霍茨( David Holz)却绝不海涵地公开吐槽谷歌TPU,激发了硅谷AI圈的等闲征询。

霍茨在X平台上示意,因为早年遴荐了谷歌TPU而非英伟达GPU行为中枢检察基础要道,Midjourney的筹商程度比本不错达到的水平过时了整整一年。“若是不错回到畴昔,我会一启动就完满罗致英伟达芯片。”

这句话之是以具有纷乱杀伤力,因为这是来自一家与谷歌有深度互助的着名AI企业,当初是谷歌云奉行自家芯片的一张牌号,并且他们还靠谷歌TPU检朴了三分之二的推理资本。此次吐槽相当于给英伟达作念了最佳的背书。

霍茨为什么如斯不给谷歌悦目,要在谷歌发布新芯片的时候砸场子?

一场真实代价的公开复盘

虽然,霍茨不是随口怀恨,而是用真实代价作念出的公开复盘。它涉及了面前AI基础要道竞争最中枢的矛盾:硬件性能的竞赛以外,软件生态的护城河才是的确决定输赢的战场。

要贯通霍茨的悔过,需要先厘清谷歌TPU和英伟达GPU在筹阛阓景下的本体各异。

举个例子,GPU相当于通用并行策画的瑞士军刀。英伟达的CUDA平台从2007年就启动布局,今天照旧积聚了快要二十年的生态千里淀,成为AI行业通用的平台。

AI筹商员最常用的框架PyTorch与CUDA深度绑定,Hugging Face上险些悉数开源模子权重默许GPU格式发布,Nsight性能分析器、NCCL通讯库、TensorRT推理优化器具——这是一套完好的筹商器具链。公共的AI筹商员从学校启动就在CUDA上写代码,PyTorch是他们的母语。

而TPU则是另一种生态。它是专用集成电路,底层架构围绕脉动阵列瞎想,非常优化深度学习张量运算,在大界限相识检察任务上收尾极高。但它要求使用JAX或TensorFlow框架,对PyTorch的营救永恒支离落空。社区资源匮乏,调试器具不熟习,险些悉数的排错王人要依赖谷歌我方的文档。

回到Midjourney的具体需求,他们作念的是图像生成筹商,需要巨额自界说算子实验、快速原型迭代,以及随时调用Hugging Face生态里的扩散模子组件。这些使命在GPU+PyTorch的环境下水乳交融,在TPU上却交替维艰。

举个简便例子,一个筹商员思考据一个新思法,在GPU上可能只需要几小时;在TPU上,光是设置环境和适配框架就可能滥用几天。永恒累积下来,即是霍茨所说的“过时了一年”。

当初为何遴荐谷歌TPU?

不外需要强调的是,霍茨的吐槽非常针对筹商和检察阶段。在推理阶段,这个逻辑就完满不同。这亦然他们当初为什么迁徙到谷歌TPU的平直能源,因为用谷歌TPU不错实打实地省钱,并且无须和巨头们争抢英伟达显卡。

早在2023年,谷歌云就高调官宣,Midjourney 照旧遴荐谷歌行为其中枢基础要道供应商。Midjourney 运用谷歌的 TPU v4/v5(基于 JAX 框架)来检察其第四代和第五代的文生图大模子;同期,租用谷歌云上的 英伟达 GPU 集群,来处理公共用户数以亿计的正常生成推理。

Midjourney的遴荐很现实。那时英伟达的 H100 被抢疯了,Midjourney 行为一个莫得巨头撑腰的颓落AI公司,根蒂排不上号。而谷歌的 TPU 算力管够,且对图像这种大界限矩阵运算的性价比(不错省下六成的资本)在纸面上格外诱东谈主。

2025年第二季度,Midjourney将主力推理集群也从英伟达A100/H100迁徙到谷歌Cloud TPU v6e,月度推理支拨从约210万好意思元骤降至70万好意思元以下,年化检朴杰出1680万好意思元,回本周期仅11天。

换句话说,TPU在界限化推理上的性价比上风是真实的。霍茨的确痛恨的是:我方应该在筹商阶段用英伟达打磨模子,推理阶段再迁徙到谷歌TPU降本;而不是从一启动就在TPU上作念筹商,为此付出一年的程度代价。

英伟达护城河是生态?

霍茨的公开吐槽,本体上是一份对英伟达生态护城河的证词。英伟达的护城河不在于H100比TPU快若干,而在于无数筹商员的工气魄气、汗牛充栋的开源代码库,以及通盘学术界默许GPU行为实验平台的行业惯性。

2026年,PyTorch在筹商论文中的占有率仍高达85%。险些悉数前沿筹商的代码王人基于英伟达硬件。这意味着,任何思要使用TPU作念筹商的团队,王人必须承担一个隐性资本:将我方与主流社区讳饰,烧毁巨额现成的器具和资源,在一个相对小众的工夫栈里独自探索。

这即是为什么即便TPU在某些贪图上照旧与GPU相当以至更优,业界大多数筹商实验室仍然默许遴荐GPU。约略硬件性能不错追逐,生态积聚无法速成。黄仁勋花了快要二十年时期确立的这条护城河,开云2026世界杯中国官网恰是英伟达最值钱的钞票。

谷歌显然遒劲到了问题方位。在本年的谷歌云Next大会上,谷歌发布了第八代TPU,并初次罗致双芯片策略:TPU 8t(检察)和TPU 8i(推理)。这是TPU历史上第一次将检察和推理分拆成两颗架构完满不同的专用芯片,即是为了处治霍茨吐槽的问题。

TPU 8t代号Sunfish,由博通互助瞎想,面向大界限预检察。超等Pod界限达9600颗芯片、分享2PB HBM,检察性价比比上代Ironwood擢升2.7倍。TPU 8i代号Zebrafish,由联发科瞎想,专攻推理和serving,将片上SRAM扩大至384MB,芯片互联带宽翻倍至19.2 Tb/s,并引入全新的Boardfly汇集拓扑,将1024芯片设置的最大汇集跳数从16跳降至7跳,在大型MoE模子低蔓延推理上性价比比Ironwood擢升80%。两款芯片罗致台积电2纳米工艺,瞻望2027年量产。

谷歌此次双芯片计策自己即是一次热切的计策承认:检察和推理照旧分化成两种完满不相通式的使命负载,一颗芯片无法再同期优化两头。这与英伟达“一块GPU通吃”的阶梯形成了昭着对比,亦然谷歌对英伟达Vera Rubin NVL72和亚马逊Trainium3的正面回击。

并且谷歌此次不仅仅发布了新硬件。针对霍茨对TPU生态的怀恨,谷歌同步推出了TorchTPU相貌——一个让PyTorch原生运行在TPU上的工程商酌,面前处于预览版现象。

按照谷歌的阶梯图,TorchTPU将营救PyTorch的Eager Mode、与vLLM和TorchTitan深度集成、并最终实现到完好Pod界限的线性膨胀。若是TorchTPU的确熟习,那些遵照PyTorch的筹商团队将第一次能够在不重写代码的前提下使用TPU。

干系词,TorchTPU面前仍是预览版,不是正经发布版。霍茨那种“改个架构、调个算子、快速考据思法”的筹商使命流,在TPU 8t上是否的确像在H100上一样顺滑,还需要巨额实战考据。一扇门照旧怒放,但门后的路有多平坦,2027年正经量产之后才气见分晓。

Claude为什么横跨三平台?

若是Midjourney对TPU的检察生态有这样多不悦的话,那么面前AI行业新领头羊Anthropic是怎么处治脚踏三条船的挑战的?要知谈他们同期在英伟达GPU、谷歌TPU和亚马逊Trainium三套硬件上检察和运行Claude。

Anthropic正本是处于AI第一集团的追逐者扮装,财力远远弗成和谷歌和OpenAI比较,因此他们接受了谷歌和亚马逊的大王人投资,交换要求之一即是使用这两个巨头的TPU和Trainium芯片。

谷歌和亚马逊王人是Anthropic的计策投资者,沙巴体育app两家巨头先后给Anthropic投资了近100亿好意思元。再加上微软投资的50亿好意思元,相当于公共三大云策画巨头在协力服待着Anthropic。

巨头们可不是单纯的财务投资。这些投资有一大部分王人折现成了谷歌和亚马逊的营收,因为Anthropic面前使用着杰出百万张亚马逊Trainium芯片,非常用于检察和部署最新的Claude模子,同期使用着数十万张谷歌TPU,并商酌在异日舒适拓展到百万TPU阵列。

与此同期,谷歌云、AWS以及微软Azure亦然Claude在公共B端市场的主要分发平台。三大万亿级巨头王人思用我方的销售汇集帮Claude卖货,我方赢得营收提成,更热切的是,把算力流量留在自家的做事器里,同期搭售自家的云做事。

这种全面通吃的形势,也让 Anthropic 成为硅谷历史上成长速率最快、底牌最足的颓落AI巨头。最近他们还与SpaceX达成了算力租借合同,每年要支付150亿好意思元使用马斯克在田纳西州超算中心囤积的英伟达GPU芯片带来的算力。

那么,Anthropic是怎么作念到同期使用三大平台芯片的?

Anthropic官方表述是:不同使命负载匹配最稳妥的芯片。英伟达GPU邻接筹商实验和快速原型;谷歌TPU和亚马逊Trainium辩认邻接大界限检察和推理的主力使命负载,两家超等策画机供应商之间形成制衡,防患单一平台勒诈订价权。

Anthropic与亚马逊的互助界限尤其引东谈主细心。两边已签署合同,Anthropic将在异日十年向AWS进入杰出1000亿好意思元,赢得最多5吉瓦的算力容量,笼罩Trainium2到Trainium4。

真谛的是,在最新谷歌云Next大会布告与Anthropic深远互助的时候,亚马逊站出来“公开邀赏”,宣称Claude的检察完满在Trainium上完成,Project Rainier——这个面前运行杰出100万颗Trainium2芯片的集群——是公共最大的AI检察集群之一。

与此同期,Anthropic在谷歌Cloud Next大会前不久布告扩大与谷歌和博通的互助,赢得多吉瓦的下一代TPU容量,瞻望2027年进入使用。

Anthropic靠什么脚踩三条船?

Anthropic能走出这条路,有一个要害的工夫DNA:公司中枢独创团队来自Google Brain,JAX是他们的母语。从一启动,Anthropic就将JAX行为中枢检察框架——JAX的瞎想形而上学是硬件无关,归拢套代码通过XLA编译器不错在GPU、TPU乃至Trainium上运行。

这与Midjourney的旅途正巧相背:Midjourney先在PyTorch+GPU的生态里建好筹商使命流,再试图迁徙到TPU,迁徙资本才形成了一年的耗损。

干系词这种多平台策略亦然有代价的,Anthropic每次模子更新王人要在三套架构上辩认测试,每个bug王人有三个潜在成因,部署复杂度是单一平台决议的三倍。这是三平台策略必须承付的工程账单。

谷歌的 TPU 体系基于传统的 JAX 和 XLA 编译器。亚马逊的 Trainium 体系则基于 AWS 自研的 Neuron SDK。 这意味着,Anthropic 中枢的分散式检察框架,弗成平直平移。

因此,Anthropic的工程团队必须派驻顶尖的底层硬件优化内行,与谷歌和亚马逊的芯片团队闭门聚拢开导,将复杂的算子、搀和精度检察代码,用三套完满不同的硬件底层汇编逻辑重写并优化。这种东谈主力资本和时期千里淀,如实远超隧谈使用英伟达生态的 OpenAI。

比较之下,Midjourney 的团队界限极小,根蒂莫得 Anthropic 那种不错跟巨头芯片团队闭门魔改底层的千东谈主工程兵团。在濒临 TPU小众的 JAX/XLA 编译环境时,一朝际遇诡异的硬件级 Bug,通盘团队只可停工去死磕底层代码。

此外,2025年8至9月,Claude用户陈诉了彰着的性能着落。Anthropic的过后复盘走漏了三个颓落的基础要道间隙:坎坷文窗口路由无理影响了某一平台上16%的Sonnet 4苦求;TPU做事器设置无理导致Opus 4和Sonnet 4输出损坏;XLA编译器间隙困扰Haiku 3.5长达两周。

Anthropic在我方的筹商论文中反复强调:不要使用复杂的框架,保捏架构的相当简便与可组合性。模子层瞎想得越隧谈、越少花活,在濒临多芯片平台交叉测试时,底层暴走漏的硬件 Bug 就越少,从而用“瞎想上的克制”化解了“平台上的繁复”。

付出了这笔昂贵的工程账单后,Anthropic 成绩了全行业最保养的果实。凭据最新的 TCO(总领有资本)数据,谷歌 TPU 和亚马逊 Trainium 在大界限推理时的性价比,比英伟达平台整整逾越 50% 以上。

比较较OpenAI 赌的是“英伟达纯血生态+ Stargate 级单点超大算力”;而 Anthropic 则是用三倍的工程资本,硬生生把我方逼成了一个“跨平台黏合体”。

这种底层基建的全面跑通,让 Claude 在如今多模态智能体大界限并发、大流量婉曲的工业落地战役中,领有了全行业最低廉、最不被单一方卡脖子的无穷算力大后方。这即是多平台策略断送短期东谈主力、相通永恒计策制高点的终极罢了。

异日口头:专用芯短暂间的竞争逻辑

话题回到霍茨的那条推文,某种程度上是AI基础要道进入新阶段的一个缩影。接下来几年的竞争口头,照旧启动了了。

检察侧的口头是:英伟达仍然是筹商实验和快速迭代的首选平台,但在超大界限相识检察上,TPU和Trainium正在以性价比上风侵蚀份额。谷歌TPU 8t的2.7倍性价比擢升、亚马逊Trainium3的捏续进化,意味着前沿AI实验室将越来越倾向于“筹商用GPU、检察用专用芯片”的搀和策略。

推理侧的口头愈加成心于挑战者。推理是AI基础要道中增速最快的部分——2026年头推理已占AI算力总支拨的55%,瞻望到2030年将占75%。在这个场景下,TPU和Trainium的专用优化能带来Midjourney那样65%的资本削减,经济账算得通。谷歌TPU 8i恰是针对这一趋势的定向刀兵。

生态侧的战局则更为永恒。TorchTPU能否的确让PyTorch筹商员无缝迁徙到TPU,是谷歌2027年最热切的挑战。亚马逊的策略则更为求实:Trainium与PyTorch的兼容性一直是其主打卖点,通过Bedrock平台上十万家以上的企业客户积聚,正在暗暗构建我方的应用层生态。

但英伟达绝不会坐视敌手侵蚀我方的护城河,CUDA的捏续进化和Blackwell架构的推出,是对“GPU不是筹商惟一遴荐”论调的最平直反击。

供给侧的变量也相通值得谅解,谷歌TPU的大界限量产受制于台积电的先进封装产能,原商酌2026年达到400万颗的标的已推迟至2027年。台积电现存AP8工场已满负荷,新的AP7平台首期产能已一起分拨给苹果处理器,第二期年底才气进入。这意味着即便需求郁勃,TPU的供给在2026年仍将是制约身分,反而给英伟达留住了缓冲空间。

对大多数中袖珍AI公司而言,霍茨的痛恨仍然具有推行深嗜:筹商阶段全用英伟达,生态摩擦最低,迭代速率最快。比及模子架构相识、推理界限上来,再评估TPU迁徙的经济账。这不是因为英伟达更好,而是因为生态资本在界限较小时会压倒硬件资本。

对Anthropic这个量级的前沿实验室,三平台策略的逻辑天渊之别:它不仅仅为了省钱,而是为了确保在职何单一供应商出现问题时,Claude的检察和做事王人不会中断;同期用多平台需求行为筹码,在与亚马逊和谷歌的谈判中保捏议价智商。

硬件性能vs生态收尾,性价比vs筹商速率,专用优化vs通用活泼,这是面前AI芯片战斗最中枢的几大矛盾张力。谷歌用双TPU计策试图两头兼顾,亚马逊用Trainium的兼容性策略绕过生态壁垒,英伟达则用二十年积聚的软件护城河抗争悉数挑战者。

莫得东谈主能买到悉数筹码沙巴体育app中国官网下载,也莫得哪家公司的遴荐是错的,王人要付出不同的代价。在AI基础要道的棋盘上,芯片性能早已不是惟一的计分方式。(新浪科技)

海量资讯、精确解读,尽在新浪财经APP