电子发烧友网报道(文/李弯弯)在拉斯维加斯举办的亚马2025年亚马逊云科技re:Invent全球大會(huì)上,亚马逊云科技(AWS)推出新一代人工智能(AI)训练芯片Trainium 3,逊发I芯m性预告了下一代产品Trainium 4的布新WhatsApp%E3%80%90+86%2015855158769%E3%80%91f750%20service%20truck%20with%20crane開(kāi)發(fā)計(jì)劃。亚马逊表示,升倍這款芯片能夠比英伟达市場(chǎng)領(lǐng)先的亞馬圖形處理單元(GPU)更便宜、更高效地驱动AI模型背后的逊发I芯m性密集计算。

作為亚马逊首款3納米工藝AI芯片,布新Trainium3的升倍核心突破在于性能、能效與擴(kuò)展性的亞馬全面躍升。其計(jì)算性能較前代Trainium2提升4.4倍,遜發(fā)I芯m性內(nèi)存帶寬與能效分別增加4倍和40%,布新單芯片集成144GB高带宽内存(HBM3e),升倍WhatsApp%E3%80%90+86%2015855158769%E3%80%91f750%20service%20truck%20with%20crane提供2.52FP8 PFLOPs算力。亚马这一性能飞跃得益于三大技术创新:
3纳米制程工艺:晶体管密度提升70%以上,逊发I芯m性相同面积下集成更多计算单元,布新能效比提升40%,单位算力能耗降低40%。
Neuron Fabric互联技术:单台Trn3 UltraServer可集成144颗芯片,通过EC2 UltraClusters3.0架构扩展至百万颗芯片集群,规模较上一代提升10倍,时延降低4倍。
智能功耗管理:动态调节供电频率,高负载时提升计算核心性能,空闲时降低功耗,平衡性能与能效。
实测数据显示,Trainium3在训练OpenAI GPT-OSS模型时,单芯片吞吐量提升3倍,推理响应速度提升4倍,训练成本降低50%。
Trainium3的登場(chǎng)并非孤立事件,其前代產(chǎn)品Trainium2已為亚马逊AI芯片生態(tài)奠定基礎(chǔ)。作為AWS在2024年推出的第二代AI訓(xùn)練芯片,Trainium2采用多核架構(gòu)設(shè)計(jì),支持高并發(fā)計(jì)算,峰值性能達(dá)每秒數(shù)千億次浮點(diǎn)運(yùn)算,性價(jià)比較GPU實(shí)例提升30%-40%。
其核心优势包括,定制化硬件优化,针对Transformer架构设计注意力机制加速单元,大语言模型训练效率提升40%。NeuronLink超速互联,通过低延迟网络连接4个Trn2服务器,形成83.2Petaflops算力的UltraServer,支持超大规模模型训练。生态兼容性,支持TensorFlow、PyTorch等主流框架,无缝迁移现有模型,降低技术门槛。
Trainium2的商业化已取得实质进展。Adobe、Poolside等企业利用其训练和部署AI模型,Anthropic的“Project Rainier”项目更通过数十万颗Trainium2芯片构建超级集群,算力较前代提升5倍。

AWS在发布Trainium3的同时,预告了下一代芯片Trainium4的研发进展,其核心突破在于与英伟达生態(tài)的深度整合。支持英伟达GPU與Trainium芯片高速互聯(lián),形成機(jī)架級(jí)AI基礎(chǔ)設(shè)施,兼顧性能與成本。FP8算力提升3倍,F(xiàn)P4算力提升6倍,內(nèi)存帶寬提升4倍,模型訓(xùn)練與推理吞吐量至少提升3倍。通過(guò)持續(xù)軟硬件協(xié)同,實(shí)際性能提升將遠(yuǎn)超基準(zhǔn)數(shù)值,降低客戶遷移成本。
這一戰(zhàn)略調(diào)整直指AI芯片市場(chǎng)的核心矛盾:性能競(jìng)爭(zhēng)與生態(tài)壁壘。盡管Trainium3內(nèi)存容量(144GB)較谷歌TPU(192GB)和英伟达Blackwell(288GB)存在差距,但通過(guò)與英伟达的合作,AWS試圖在保持性價(jià)比優(yōu)勢(shì)的同時(shí),吸引依賴英伟达生態(tài)的客戶遷移至Trainium平臺(tái)。
亚马逊的芯片戰(zhàn)略已初見(jiàn)成效。截至2024年,Trainium系列在AWS數(shù)據(jù)中心部署速度超预期,Anthropic计划年底使用超百万颗Trainium2芯片。对于客户而言,Trainium3的性价比优势显著。其一成本降低,与GPU系统相比,训练和推理成本最高降低50%,碳排放减少40%。其二弹性扩展,支持从单芯片到百万芯片集群的无缝扩展,满足不同规模需求。其三行业适配,覆盖金融风控、医疗影像分析、自动驾驶等高并发场景,推动AI技术商业化落地。
然而,挑戰(zhàn)依然存在。亚马逊需進(jìn)一步豐富軟件庫(kù)生態(tài),吸引更多第三方开发者采用Trainium平台。对此,AWS通过提供Neuron SDK开发套件、性能分析工具等,降低模型迁移门槛,同时以Trainium4的生态兼容性为长期竞争力铺路。
文章推薦: