
在这篇文章中,我们回答了 EDEM 用户提出的有关单GPU和多GPU的最常见问题。了解有关 EDEM GPU 求解器引擎、使用单GPU和多GPU的原因和时间、推荐的GPU卡以及预期的加速效果。
Q-1: 什么是 EDEM GPU,为什么要使用它?
EDEM GPU 求解器引擎允许用户使用计算机图形处理单元(GPU)运行 EDEM 模拟。
与传统的台式机 CPU 不同,GPU 包含数千个计算内核,而离散元方法(DEM)特别适合在这些大量内核之间进行扩展。这意味着 EDEM GPU 求解器可以更快地运行仿真,而且用户现在可以运行比单独使用 CPU 更大的仿真。
Q-2: EDEM GPU 使用什么架构?
最新版本的 EDEM GPU 求解器是使用 CUDA 语言编写的,仅在 NVIDIA 硬件上运行。
Q-3: EDEM GPU 是单精度还是双精度?
可以使用 CUDA GPU 求解器精度模式加快仿真速度。EDEM CUDA 精度模式有3个可用选项,包括:双精度、单精度和混合精度。
Q-4: 不同精度模式有什么区别?
双精度具有最高的数值精度和最慢的求解器速度。
单精度具有最快的求解器速度和最低的数值精度,这并不适合所有应用,特别是剪切应力高和时间步长很小的材料。
混合精度使用单精度和双精度的组合,这不仅提供更快的仿真,而且还减少了内存使用。在运行包含数百万个可能耗尽内存的粒子的大规模模拟时,混合精度模式在数值精度和速度之间提供了良好的平衡。
Q-5: 推荐哪些 GPU 卡?
首先,它应该是 NVIDIA GPU 卡,CUDA代码至少需要3.5或更高的计算能力,并兼容Windows或Linux。
我们建议用户选择工作站或数据中心级 GPU 来运行 EDEM 仿真。
推荐的 GPU 主要区别是:内核数、可用内存大小和 FP64(双精度)性能。通常,在运行大型 EDEM 仿真时,具有大物理内存、良好带宽和高 FP64 和 FP32 性能的卡表现良好。
如果您不确定如何为 EDEM 选择 GPU,请联系我们,我们很乐意谈论我们最近几轮测试的结果。
Q-6: GPU 在哪些仿真情况下最有效?
仿真速度会根据许多因素而变化,例如材料属性、应用规模和使用的硬件。
在大多数情况下,对于粒子数超过 10k 的较大模拟,在GPU上运行模拟变得更加有效。对于粒子数超过 100k 的模拟,特别是一些工业级别和粉末颗粒的仿真,GPU运行模拟的速度明显提高。
以前可能需要数周时间才能在 CPU 上运行的大型模拟现在可以在 24 小时内运行,因为 CPU 和 GPU 之间的加速幅度很大。
Q-7: 有没有测试示例说明可以达到什么样的加速效果?
下图是一系列测试用例,每个测试用例包括 100 万个粒子。
在我们的测试数据中,单块A100卡的速度甚至可以比32核CPU快100倍以上。
Q-8: 什么时候使用多 GPU?
当需要加速大型模拟时,您可以考虑使用 EDEM 多 GPU,在包含 5 到 1000 万个粒子的模拟中,如上图测试示例所示,从1个GPU加速到2个时,速度提高了 1.6 – 1.8 倍。
此外,EDEM 多 GPU 的主要优势之一是,当需要使用非常多的粒子(数十万个粒子)运行模拟时,超过某个阈值后,单个 GPU 可能没有足够的物理内存来运行仿真。
EDEM GPU 求解器使用的内存取决于许多因素,包括粒子数量、接触数量和自定义属性数量等。在大多数情况下,如果模拟大小需要,在升级到多 GPU 功能之前,应先考虑投资功能更强大的单个 GPU。
Q-9: EDEM 哪些功能支持GPU求解器?
最新版本的 EDEM GPU 求解器支持所有 EDEM 颗粒形状(多球体、球柱体和多面体)的仿真,包括前处理、API、后处理工具和接触模型大部分功能。
Q-10: 如何访问 EDEM GPU?
EDEM GPU 求解器引擎直接集成到 EDEM 环境中,并在正版许可下作为标准提供。
用户需要将GPU驱动程序更新到最新版本。首次在计算机上运行 EDEM CUDA GPU 之前,需要进行设备测试,测试成功后方可调用。