英伟达是一个显卡芯片和主板芯片的生产商,今天微软宣布加强和英伟达的合作,将 GPU 从此前的 A100 升级到 H100,推出专门针对人工智能开发的全新的 ND H100 v5 虚拟机。
微软表示该虚拟机主要面向需要整合或开发人工智能的企业,附该虚拟机配置如下:
8 块英伟达 H100 Tensor Core GPU,通过下一代 NVSwitch 和 NVLink 4.0 互连
在非阻塞(non-blocking)的胖树(Fat-Tree)架构网络下,每块 GPU 的 NVIDIA Quantum-2 CX7 InfiniBand 性能可以达到 400 Gb / s,每台虚拟机可以达到 3.2Tb / s。
通过 NVSwitch 和 NVLink 4.0,每台虚拟机内的 8 个本地 GPU 之间的对分带宽为 3.6TB / s。
采用英特尔第 4 代 Xeon Scalable 处理器
使用 PCIe Gen5 连接 GPU,每个 GPU 带宽为 64GB / s
16 通道 4800MHz DDR5 DIMM
微软先前在 Azure OpenAI 服务中宣布了 ChatGPT 相关服务,而本次虚拟机是该服务的补充,它允许第三方通过 Azure 访问聊天机器人技术。
资讯阅读 20.78MB 10分
微软推出 ND H100 v5 虚拟机:采用英伟达 H100 GPU,满足企业 ChatGPT 生成式 AI 需求
英伟达是一个显卡芯片和主板芯片的生产商,今天微软宣布加强和英伟达的合作,将 GPU 从此前的 A100 升级到 H100,推出专门针对人工智能开发的全新的 ND H100 v5 虚拟机。
微软表示该虚拟机主要面向需要整合或开发人工智能的企业,附该虚拟机配置如下:
8 块英伟达 H100 Tensor Core GPU,通过下一代 NVSwitch 和 NVLink 4.0 互连
在非阻塞(non-blocking)的胖树(Fat-Tree)架构网络下,每块 GPU 的 NVIDIA Quantum-2 CX7 InfiniBand 性能可以达到 400 Gb / s,每台虚拟机可以达到 3.2Tb / s。
通过 NVSwitch 和 NVLink 4.0,每台虚拟机内的 8 个本地 GPU 之间的对分带宽为 3.6TB / s。
采用英特尔第 4 代 Xeon Scalable 处理器
使用 PCIe Gen5 连接 GPU,每个 GPU 带宽为 64GB / s
16 通道 4800MHz DDR5 DIMM
微软先前在 Azure OpenAI 服务中宣布了 ChatGPT 相关服务,而本次虚拟机是该服务的补充,它允许第三方通过 Azure 访问聊天机器人技术。
资讯阅读 20.78MB 10分
-
网易游戏发布寒假限玩通知:未成年人春节只能玩 9 小时,整个假期总计 16 小时 更新时间:2024-01-24 -
OWL 终结,暴雪宣布与沙特 EFG 合办《守望先锋》冠军系列赛 OWCS 更新时间:2024-01-24 -
腾讯开放世界抓宠游戏《创造吧!我们的星球》开启预约,现已上架苹果 App Store 及 Steam 更新时间:2024-01-24 -
微软官方 Surface 设备维修指南手册正式发布,含 Surface Pro 8/9、Laptop Go / Studio 等多款机型 更新时间:2024-01-24
查看更多文章 >