近期,英伟达H100芯片在算力租赁市场掀起价格热潮,其租赁价格呈现显著上涨态势。半导体研究机构SemiAnalysis发布的“H100一年期租赁合约价格指数”显示,这款于2022年3月发布、秋季开始出货的芯片,租赁合约价格自2025年10月触及每小时1.7美元的低点后,在今年3月已飙升至每小时每块GPU 2.35美元,涨幅接近40%。
该指数基于对100多家云服务提供商、算力资源买卖双方的直接调查数据构建,每月更新一次。最新报告指出,当前按需租用的GPU算力在各类GPU中均已售罄。即便近期价格持续攀升,已锁定按需实例的客户仍不愿将算力释放回资源池。研究人员形象地比喻,在2026年初寻找GPU算力,如同预订“最后一班离开航班”的机票——价格高昂且资源稀缺。
市场抢购GPU算力的热情高涨。客户正以每块GPU每小时14美元的价格争抢亚马逊云服务的p6-b200竞价实例,部分新兴云服务巨头甚至停止单节点销售。更值得注意的是,部分英伟达H100 GPU仍按2—3年前签订的原价续约,部分合同甚至直接续签至2028年。
尽管市场曾预期性能更强、算力成本更低的Blackwell芯片加速部署会压制H100价格,但现实情况截然相反。由于开放权重模型需求强劲及推理需求激增,新部署的Blackwell芯片交付周期已延长至6—7个月。与此同时,H100的市场需求不仅未减弱,反而在多领域呈现增强态势。
SemiAnalysis在报告中分析,今年初算力需求激增的主要驱动力来自原生媒体生成领域。字节跳动的Seedance(即梦)和谷歌的Nano Banana等应用推动用户大量生成和优化视频/图像,导致词元吞吐量大幅上升。更显著的需求增长来自多智能体工作负载的兴起,这类应用使词元使用量和算力消耗呈抛物线式增长。据该机构透露,其自身在过去一周就消耗了数十亿词元,每百万词元成本约5美元,但由此节省的时间和工作流程扩展带来的回报远超算力成本。
与算力市场供需紧张形成鲜明对比的是,新兴云服务商股价表现低迷。CoreWeave、Nebius等公司的股价处于过去6—12个月的区间低位。分析指出,市场仍普遍预期算力市场将出现供给过剩和商品化趋势,但现实是,在供给紧张环境下,各类算力资源均保持旺盛需求,性能差异对需求的影响显著弱化。
当前市场正密切关注三个关键变量:GB300集群在2026年的放量节奏能否缓解算力紧张;芯片短缺是否会进一步恶化;以及AI巨头的年度经常性收入扩张情况、AI应用普及速度和词元消耗规模的增长节奏。这些因素将共同决定GPU租赁价格能否维持高位运行。








