发布时间:2025-09-04 已有: 位 网友关注
谷歌的谈判表明,它正在设法接近那些英伟达重点扶持的新兴云服务商。这些公司与Google Cloud和Amazon Web Services不同,它们几乎只租赁英伟达芯片,而且比传统云服务商更愿意采购多样化的英伟达产品。英伟达还向这些公司投资了资金,并优先供应最热门的芯片。
谷歌主要将TPU用于开发自家的AI模型,比如Gemini系列,而近年来内部对TPU的需求大增。
不过,谷歌也长期向其他公司租赁TPU。例如,Apple和Midjourney都通过Google Cloud租用TPU。而在今年夏季初,谷歌甚至一度让OpenAI对租用TPU感兴趣,但OpenAI随后突然改变了主意。
谷歌内部曾讨论扩大TPU业务,以增加收入并减少云计算部门对昂贵的英伟达芯片的依赖。据两名前高管对媒体透露,高层也曾探讨过将TPU直接销售给Google Cloud以外的客户。
分析认为,像CoreWeave和Fluidstack这类小型云服务商,例如Fluidstack为Mistral这类创业公司提供英伟达GPU,由于AI开发者普遍偏爱英伟达产品,因此在商业上有强烈动机优先提供英伟达芯片服务器。
但谷歌似乎已经找到办法促使Fluidstack支持其TPU扩张计划:如果Fluidstack无法承担即将启用的纽约数据中心的租赁成本,谷歌将提供最多32亿美元的“兜底”支持。这项承诺帮助Fluidstack及其数据中心合作伙伴筹集债务融资以建造设施。
媒体称,谷歌的第六代Trillium TPU芯片自去年12月向外部客户开放后需求强劲。分析师预计,第七代Ironwood TPU的需求将“显著上升”。Ironwood是Google首款专为大规模AI推理任务设计的芯片。
分析师指出,谷歌的TPU芯片算力最高可达42.5 exaflops,并已大幅提升高带宽内存容量。这些芯片“成本效率也显著提升”,这是吸引更多前沿实验室关注的主要原因之一。
初创公司Anthropic此前虽在小规模上使用TPU,但分析师指出,该公司近期正在招聘TPU内核工程师,这可能意味着他们正考虑从使用Amazon Web Services提供的Trainium芯片转向TPU。Trainium是亚马逊为AI训练设计的芯片,该公司已对Anthropic投资80亿美元。
分析师还指出,马斯克的xAI公司也对购买TPU表现出兴趣,部分原因在于今年“JAX-TPU工具支持的显著改进”。JAX是谷歌开发的一个高性能计算Python库,能够让程序在TPU上高效运行。分析师指出,直到最近,JAX生态系统还限制了TPU在Google外部大规模部署的可能性。