谷歌下月上线 A3 实例将搭载英伟达 H100,可提供 26 exaFlops AI 性能,根据8 月 31 日消息,Google Cloud 在今天召开的云 Next 大会上,宣布下月上线 A3 虚拟机实例。谷歌云在今年 5 月召开的 I / O 开发者大会上宣布 A3 实例,最大的亮点在于配备英伟达 H100 Tensor Core GPU,满足生成式 AI 和大语言模型的需求。
小编此前报道,A3 实例采用了第 4 代英特尔至强可扩展处理器、2TB DDR5-4800 内存,以及 8 张英伟达 H100“Hopper”GPU,通过 NVLink 4.0 和 NVSwitch 实现了 3.6 TBps 的对分带宽。
新的 A3 超级计算机“专门用于训练和服务要求最苛刻的人工智能模型,这些模型为当今的生成人工智能和大型语言模型创新提供动力”。据介绍,这款超级计算机可以提供 26 exaFlops 的人工智能性能。
谷歌云在今天的发布会上还介绍了全新的 TPU v5e,是迄今为止最具成本效益和可访问的云 TPU。这些 TPU 或定制 ASIC 旨在加速 AI 和 ML 工作负载。
SDxCentral 报道称,TPU v5e 相比较前代,每美元的训练性能提高了一倍,每美元的推理性能提高了 2.5 倍。
生活服务 2.64MB 9.9分
谷歌下月上线 A3 实例:搭载英伟达 H100,可提供 26 exaFlops AI 性能
谷歌下月上线 A3 实例将搭载英伟达 H100,可提供 26 exaFlops AI 性能,根据8 月 31 日消息,Google Cloud 在今天召开的云 Next 大会上,宣布下月上线 A3 虚拟机实例。谷歌云在今年 5 月召开的 I / O 开发者大会上宣布 A3 实例,最大的亮点在于配备英伟达 H100 Tensor Core GPU,满足生成式 AI 和大语言模型的需求。
小编此前报道,A3 实例采用了第 4 代英特尔至强可扩展处理器、2TB DDR5-4800 内存,以及 8 张英伟达 H100“Hopper”GPU,通过 NVLink 4.0 和 NVSwitch 实现了 3.6 TBps 的对分带宽。
新的 A3 超级计算机“专门用于训练和服务要求最苛刻的人工智能模型,这些模型为当今的生成人工智能和大型语言模型创新提供动力”。据介绍,这款超级计算机可以提供 26 exaFlops 的人工智能性能。
谷歌云在今天的发布会上还介绍了全新的 TPU v5e,是迄今为止最具成本效益和可访问的云 TPU。这些 TPU 或定制 ASIC 旨在加速 AI 和 ML 工作负载。
SDxCentral 报道称,TPU v5e 相比较前代,每美元的训练性能提高了一倍,每美元的推理性能提高了 2.5 倍。
生活服务 2.64MB 9.9分
-
腾讯开启《逆战:未来》保密技术测试招募:仅安卓,1 月下旬开测 更新时间:2023-12-29 -
网易游戏发布寒假限玩通知:未成年人春节只能玩 9 小时,整个假期总计 16 小时 更新时间:2024-01-24 -
OWL 终结,暴雪宣布与沙特 EFG 合办《守望先锋》冠军系列赛 OWCS 更新时间:2024-01-24 -
腾讯开放世界抓宠游戏《创造吧!我们的星球》开启预约,现已上架苹果 App Store 及 Steam 更新时间:2024-01-24
查看更多文章 >