大模型之家讯 日前 ,领导者在全球商场分析组织世界数据公司(IDC)发布的亚马云基《2025年IDC MarketScape:全球公有云基础设施即服务(IaaS)陈述》中,亚马逊云科技被评为“领导者”,科技在才能和战略的获评双维度上均为“领导者”。 。全球IDC在该陈述中表明,础设全球公有云IaaS继续快速增长,施即估计2025年的服务全体规划将到达1880亿美元。
IDC分析师、领导者陈述作者Dave McCarthy。亚马云基表明 :“亚马逊云科技经过广泛的科技服务组合和继续的立异,在公有云IaaS商场中处于领导地位。获评广泛的全球全球基础设施 ,结合Amazon Graviton等定制芯片方案以及在AI范畴的础设严重出资,使其在满意企业需求方面独具优势。施即其在可扩展性方面的杰出体现 、老练的开发者社区以及对AI基础设施的活跃投入,使其成为需求先进云才能的企业的首选。 。” 。
作为全球云核算的开创者和引领者,亚马逊云科技是首先进入自研芯片范畴的云供货商 。革命性的Nitro虚拟化渠道全面加速了亚马逊云科技在自研芯片范畴的立异速度。迄今为止 ,亚马逊云科技已推出了多个系列的自研芯片,包括Amazon Nitro体系、通用处理器芯片Amazon Graviton、机器学习练习芯片Amazon Trainium和推理芯片Amazon Inferentia,一起坚持稳定的更新频率,且每次更新均供给两位数以上的百分比的性价比进步。在2024年的re:Invent上 ,亚马逊云科技推出全面晋级的Amazon Trainium2芯片,以及根据该芯片的Amazon EC2 Trn2实例和超级服务器。Amazon EC2 Trn2。实例。与当时根据GPU的EC2 P5e和P5en实例比较,Amazon EC2 Trn2实例的性价比进步30-40%。单实例装备16个Trainium2芯片 ,可供给高达20.8 Petaflops浮点算力的功能,十分合适练习和推理高达 。数十亿参数。的大型言语模型。
Amazon EC2 Trn2 UltraServers服务器是亚马逊云科技在纵向扩展范畴的又一次打破,用以满意大规划生成式AI练习和实时推理的功能需求 。该服务器装备64个相互连接的Trainium2芯片,选用NeuronLink超速互连技能 ,可供给高达83.2 Petaflops浮点算力 ,其核算、内存和网络才能是单一实例的四倍,能够支撑练习和布置超大规划的模型 。练习方面,Amazon EC2 Trn2 UltraServers使客户能够打破单个Trn2实例的约束进行扩展 ,然后削减练习时刻,加速投放商场的速度,完成快速迭代以进步模型准确性 。推理作业负载方面 ,客户能够运用Trn2 UltraServers进步出产环境中万亿参数模型的实时推理功能 。亚马逊云科技携手Anthropic正打造名为Project Rainier的EC2 UltraCluster,其包括数十万颗Trainium2 芯片,所到达的超级算力比他们当时一代抢先AI模型练习所需算力高出5倍以上。
此外 ,亚马逊云科技发布了新一代AI练习芯片Amazon Trainium3。Trainium3是亚马逊云科技首款选用3纳米工艺制作的芯片 。搭载Trainium3的UltraServers功能估计将是Trn2 UltraServers的4倍。第一批根据Trainium3的实例估计将在2025年底上线 。
芯片立异重塑核算,而在基础设施的另一个重头场景——网络中,亚马逊云科技在2024年re:Invent上推出了第二代UltraCluster网络架构 ,也称为”10p10u”网络 ,支撑超越20,000个GPU协同作业 ,带宽达。10P。b/s ,推迟低于。10μ。s(微秒),这一打破性的功能跃迁将模型练习时刻缩短至少15% 。一起还推出了兼具中心操控和优化及分布式的速度和弹性的SIDR(Scalable, Intent Driven Routing)全新网络路由协议。 。比较传统的BGP、OSPF等协议 ,SIDR在亚马逊云科技的10p10u网络中能在不到1秒内康复网络,速度比传统办法快10倍,明显进步了分布式AI练习中的可靠性和实时性,保证网络在毛病产生时也能坚持高效运转。10p10u 。是亚马逊云科技有史以来扩展最快的网络,在。2024。年,安装了超越。300 。万条链路。