IT之家7 月 30 日消息,英伟达官网公告显示,亚马逊云正式推出了由英伟达 H100 Tensor Core GPU 驱动的新的 Amazon Elastic Compute Cloud(EC2)P5 实例。
据介绍,该服务允许用户通过浏览器轻松扩展生成式 AI、高性能计算(HPC)和其他应用。
NVIDIA H100 GPU 的一个重要特点是其对 Transformer 的优化,这是许多最新的先进 AI 应用所使用的关键技术,可确保 H100 在这些应用中提供更高的性能和效率。
IT之家查询发现,虽然 AWS 尚未就集成 AMD MI300 芯片到其云服务中作出任何公开承诺,但亚马逊弹性计算云副总裁 Dave Brown 证实 AWS 正在积极考虑这一方案。
英伟达表示,开发人员和研究人员几乎每天都在借助大型语言模型 (LLMs) 发掘 AI 的新应用,而将这些新用例推向市场需要加速计算的效率。
NVIDIA H100 GPU 通过架构创新提供超级计算级性能,包括第四代 Tensor Cores、用于加速 LLMs 的新 Transformer 引擎以及最新的 NVLink 技术,可以带极其可观的性能。
据介绍,EC2 P5 实例非常适合训练和运行复杂 LLMs 和计算机视觉模型的推理。这些神经网络驱动着最复杂和计算密集型的生成式人工智能应用程序,包括问答、代码生成、视频和图像生成、语音识别等