亚马逊自研AI芯片再升级:Trainium3性能飙升,Trainium4将兼容英伟达技术

   时间:2025-12-03 10:00 来源:互联网作者:杨凌霄

在拉斯维加斯举行的AWS re:Invent 2025年度技术大会上,亚马逊云科技(AWS)正式发布了其最新一代AI训练芯片Trainium3,并首次披露了下一代产品Trainium4的研发进展。这一系列动作标志着AWS在自研芯片领域的持续深耕,也展现了其在全球AI算力竞争中的雄心。

基于3纳米制程工艺打造的Trainium3芯片,是AWS第三代AI训练芯片。其配套系统Trainium3 UltraServer在性能上实现了显著突破:训练和高负载推理场景下的速度较前代提升超过4倍,内存容量增至4倍。更引人注目的是,通过超高速互联技术,数千台UltraServer可构建起搭载最多100万颗Trainium3芯片的超大规模集群,规模达到上一代系统的10倍。每台UltraServer最多可集成144颗芯片,为大规模AI模型训练提供了前所未有的算力支持。

在能效方面,新一代系统较前代提升了40%。这一改进在当前全球数据中心耗电量持续攀升的背景下显得尤为重要。AWS表示,通过优化芯片架构和系统设计,Trainium3在提供强大算力的同时,显著降低了单位算力的能耗,有助于构建更可持续的AI基础设施。

商业应用层面,Trainium3已获得多家客户的青睐。包括Anthropic(AWS投资企业)、日本大语言模型公司Karakuri、音乐创作平台SplashMusic以及AI研发公司Decart在内的客户,已率先采用该系统并实现了推理成本的显著降低。这些案例验证了Trainium3在实际场景中的性能优势和成本效益。

关于下一代产品Trainium4,AWS透露其正在研发中,并承诺将带来又一次性能飞跃。最引人注目的是,Trainium4将支持英伟达的NVLink Fusion高速芯片互连技术。这一技术允许Trainium4芯片与英伟达GPU协同工作,扩展整体性能,同时继续利用亚马逊自研的低成本服务器机架技术。通过兼容NVLink Fusion,Trainium4有望降低迁移门槛,吸引更多原本为英伟达GPU优化的大型AI应用转向亚马逊云平台。

当前,英伟达的CUDA平台已成为AI应用的主流标准。AWS通过支持NVLink Fusion,不仅增强了Trainium4的兼容性,也为其在AI市场争取更大份额提供了技术支撑。尽管AWS尚未公布Trainium4的具体发布时间表,但参照以往产品发布节奏,外界普遍预期将在2026年的re:Invent大会上获得更多详细信息。

从Trainium3到Trainium4,AWS的自研芯片战略正逐步显现成效。通过持续的技术创新和生态构建,AWS不仅强化了自身在AI算力领域的竞争力,也为全球AI开发者提供了更多选择。随着Trainium4的研发推进,AWS与英伟达在AI硬件领域的竞争与合作格局或将迎来新的变化。

 
 
更多>同类内容
全站最新
热门内容