亚马逊云计算发布突破性Trainium芯片集群与高性能服务器,挑战Nvidia市场主导地位
发布时间:2024-12-08作者:网翼互联阅读:0
亚马逊云计算部门Amazon Web Services(AWS)近日宣布了两项重大进展:一是推出由数十万颗自研Trainium芯片组成的超级计算集群“Ultracluster”;二是发布全新服务器“Ultraserver”。
“Ultracluster”是AWS位于德克萨斯州奥斯汀的AI芯片设计实验室开发的最新项目,旨在提升AI模型训练的效率。AWS透露,该集群将用于支持AI初创公司Anthropic的模型训练工作。Anthropic近期获得了亚马逊追加的40亿美元投资,而其训练集群将在“Project Rainier”项目中使用该超级计算集群,预计将成为全球最大的AI训练集群之一,预计于2025年投入使用。AWS表示,“Ultracluster”将提供比Anthropic现有集群高五倍的计算性能,显著加速AI模型的训练过程。
同时,AWS还推出了全新服务器“Ultraserver”,由64颗自研Trainium芯片互联组成,采用创新架构提供强大的算力。Ultraserver的设计将四台服务器整合为一个单一封装,每台服务器包含16颗Trainium芯片。相比之下,某些Nvidia的GPU服务器仅包含8颗芯片。AWS通过其网络技术“NeuronLink”使四台服务器之间高效通信,从而将计算能力提升至83.2 PetaFLOPS。Ultraserver的体积接近于冰箱大小的主机计算机,远大于紧凑型个人电脑。
AWS的AI芯片战略始于2018年发布的Inferentia芯片,专为AI推理计算而设计;2020年推出了AI训练芯片Trainium,随后在2023年发布了更强大的Trainium2,目前该芯片已经对外全面开放使用。AWS透露,下一代Trainium3芯片正在开发中,预计将提供当前版本四倍的性能。
据市场统计,全球AI芯片市场在2024年预计达到1175亿美元,且到2027年将增长至1933亿美元,而Nvidia目前占据了约95%的市场份额。AWS首席执行官Matt Garman表示:“虽然在GPU领域,Nvidia目前几乎占据主导地位,但我们相信客户需要更多选择,我们将继续推动技术创新,提供更广泛的解决方案。”
标题:亚马逊云计算发布突破性Trainium芯片集群与高性能服务器,挑战Nvidia市场主导地位
TAG标签: