• AWS 已推出 Trainium2 实例和新一代 Trainium3 芯片,以加速 AI 模型训练
  • 这些创新增强了基于云的 AI 工作负载,提供了更高的效率和可扩展性

事件:AWS 推出动力十足的 Trainium2 实例

Amazon Web Services 于 12 月 3 日推出其下一代定制芯片 Trainium3,用于高效 AI 训练和部署,并宣布全面推出由 AWS Trainium2 驱动的云实例,将高性能 AI 能力交付给客户。

亚马逊在 AWS re:Invent 大会上发布了 Trainium3,这是公司的年度云计算会议,表示这将是 AWS 首款采用三纳米工艺制造的芯片,成为能效和密度的新标杆。这些芯片将提供比当前 Trainium2 芯片两倍的性能和 40% 的能效提升。

AWS Trainium 定制芯片系列帮助企业应对日益增长的 AI 模型规模,这些模型需要强大的计算能力来处理海量数据集。随着这些模型的扩展,它们需要更多资源进行高效训练和部署。为支持这一点,AWS 推出了弹性计算云(EC2)Trainium2 实例,配备 16 颗 Trainium2 芯片,可提供高达 20.8 petaflops 的峰值性能。这些实例比同类 EC2 实例多提供 30% 的计算性能和 25% 的内存带宽,以更低的成本提供相同的功能。

另请阅读:AWS 承诺提供 1 亿美元云积分以促进教育
另请阅读:亚马逊 AWS 将投资 18 亿美元于巴西,直至 2034 年

为什么重要

AWS 推出 Trainium2 和 Trainium3 实例凸显了 AI 开发领域的关键转变,以远低于传统本地解决方案的成本提供强大的云基础设施。缺乏定制硬件资源的小型公司和初创企业,现在可以通过这些价格合理的云实例获得尖端 AI 能力。随着 AI 模型日益复杂,需要巨大的计算能力,这一点尤为重要。例如,像 Vicarious 这样专注于机器人视觉系统的小型 AI 初创公司,现在可以利用 AWS 的 Trainium2 来扩展其 AI 模型,而无需在物理基础设施上投入巨资。

这种可及性在由财大气粗的大公司主导的领域至关重要,在这些领域,AI 开发往往偏向于资金充裕的参与者。通过提供可扩展且成本效益高的解决方案,AWS 使较小的参与者能够竞争,从而加速各行业的创新。然而,像 AWS 这样的专有云基础设施的崛起,从长远来看也可能扼杀竞争,因为企业越来越依赖这些提供商。随着对数据安全和供应商锁定的担忧日益增加,企业需要在云服务的优势与潜在的长期风险之间取得平衡。