ZStack AIOS

dGPU

按 AI 模型平台功能组织的 UI 操作说明和配置入口。

dGPU(dynamic GPU)基于CUDA API拦截转发技术,将NVIDIA物理GPU显存按需动态切分,调度给不同云主机使用,最大化GPU算力利用率。多个云主机可共享同一张物理GPU卡,适用于AI推理、深度学习等计算场景。

物理GPU使用模式

ZStack AIOS支持对物理GPU启用以下三种使用模式,同一张物理GPU同一时刻仅支持一种模式:
使用模式 定义
物理GPU 以直通方式将整张物理GPU加载给单台云主机使用。
vGPU模式 采用原生切分技术对物理GPU进行虚拟化切分,具有强隔离性。适用于云桌面、3D渲染和AI推理等场景。
dGPU模式 基于CUDA API拦截转发技术实现软件切分,无需预切分,按需动态分配显存。允许多个云主机共享同一张物理卡,最大化资源利用率。适用于AI推理、深度学习等计算场景。