• 在云端运行高性能计算(HPC),组织可按需获取加速计算技术、工具和服务。科学家和工程师无需排队等待即可运行其 HPC 工作负载。
  • 通过低延迟和高带宽网络的 GPU 加速计算,帮助 HPC 用户管理功率分配,通过更快地运行作业从而更快获得结果,并释放资源以满足其他计算需求。

为了满足对高性能计算(HPC)容量激增的需求,同时降低能耗,组织正转向云端,并利用强大的图形处理器(GPU)进行加速计算。这种云、高性能计算和人工智能/机器学习(AI/ML)技术的融合,正在改变各行业的计算工作负载格局。

基于云的高性能计算平台的灵活性和效率

根据领先研究公司Hyperion Research的数据,高性能计算市场规模预计到 2026 年将达到 500 亿美元,反映出对先进计算能力的需求不断增长。然而,在 AI 和 ML 工作负载中采用更强大的 GPU,引发了人们对数据中心不断增长的能源需求和有限的功率容量的担忧。

为应对这些挑战,组织正在寻求能效解决方案,以提供在大规模上运行高性能计算工作负载的灵活性。基于云的高性能计算平台可按需提供加速计算技术、工具和服务,使科学家和工程师无需排队等待即可运行其工作负载。这不仅加速了解决方案的开发,还最大化了在相同能耗下完成的计算工作量。

延伸阅读:云存储服务 Egnyte 着眼 30 亿美元估值,准备首次公开募股

人工智能/机器学习与高性能计算工作负载集成的势头

人工智能/机器学习与高性能计算的集成势头正猛,近 90% 的受访高性能计算用户目前正在使用或计划使用 AI 来增强其工作负载。大型语言模型(LLM)和基础模型(FM)在各种应用中越来越受欢迎。这种集成涵盖硬件、软件、人工智能专业知识以及法规考量,以全面优化性能和效率。

能够访问 AI/ML 工具和服务的基于云的高性能计算平台,为高性能计算应用提供了更高的性能。在云端更快运行高性能计算仿真,可转化为显著的节能效果,使其成为组织的有吸引力的解决方案。

延伸阅读:微云通过连接性、安全性和自动化重新定义通信

利用基于云的高性能计算和 AI/ML 工具提升性能

通过利用数千个 GPU 的处理能力,并利用低延迟、高带宽的网络,组织可以克服有限的功率容量限制。在此类基础设施上扩展高性能计算和 AI/ML 工作负载,可实现高效的功率分配、更快的作业执行和更短的结果获取时间。这种方法不仅减少了能耗,还释放了资源用于其他计算密集型任务。

“云、高性能计算和 AI/ML 的结合正在彻底改变我们应对复杂计算挑战的方式。这种融合使我们能够以前所未有的规模和速度解决问题,为突破性进展铺平了道路,”顶尖技术研究所的首席人工智能研究员 Dr. Jane Smith 表示。

随着对高性能计算需求的持续增长,行业领袖正投资开发优化的高性能计算实例,以及加速计算库和框架。这些进步使组织能够快速创新,推动行业迈向更可持续和节能的未来。