dGPU(dynamic GPU)基于CUDA API拦截转发技术,将NVIDIA物理GPU显存按需动态切分,调度给不同云主机使用,最大化GPU算力利用率。多个云主机可共享同一张物理GPU卡,适用于AI推理、深度学习等计算场景。
物理GPU使用模式
ZStack AIOS支持对物理GPU启用以下三种使用模式,同一张物理GPU同一时刻仅支持一种模式:
| 使用模式 | 定义 |
|---|---|
| 物理GPU | 以直通方式将整张物理GPU加载给单台云主机使用。 |
| vGPU模式 | 采用原生切分技术对物理GPU进行虚拟化切分,具有强隔离性。适用于云桌面、3D渲染和AI推理等场景。 |
| dGPU模式 | 基于CUDA API拦截转发技术实现软件切分,无需预切分,按需动态分配显存。允许多个云主机共享同一张物理卡,最大化资源利用率。适用于AI推理、深度学习等计算场景。 |
