最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

在Windows平台上使用多核CPU加速Fluent计算

IT圈 admin 35浏览 0评论

2024年3月29日发(作者:屈安彤)

在Windows平台上使用多核CPU加速Fluent计算

摘要:当利用Fluent计算3维问题时,普通PC显得相当吃力,尤其是使用其默认的串

行版本时。其实Fluent完全可以通过简单的设置来进行并行计算。本文只示例一

种在现在主流配置PC(CPU有2-6个核心)下的Windows版Fluent并行计算的设

置, 关于Linux/Unix平台或并行集群计算机(分布式存储)等环境下的并行设置,

请参考Fluent 官方文档(User’s Guide & Tutorial Guide)。

示例硬件软件环境:

OS: M$ Windows7 64bit version

CPU: AMD Athlon™IIX4 641 Quad-Core(四核心)

RAM: 4.00GB

Fluent: v6.36

求解问题:

大作业3(略)

步骤:

1. 准备case文件

使用并行计算时,前期参数模型设置的方法与串行计算完全相同,区别只在与网格的分

区与进程个数的指定。 因此这里不再介绍Case Setup过程(设置边界条件、设置求解器、

设置非预混模型等等)。本文假设已设置好并保存的case的名称为 。

2. 启动并行版本的Fluent

Fluent可以以多种方式启动并行版本,这里只介绍在多处理器计算机上通过命令行启动

的方式。

a) 打开Windows命令行窗口(i.e., Win-R 输入cmd回车)

b) 移动(cd)至Fluent可执行文件目录(i.e., X:/Program

Files//ntbin/win64)(

我实在不知道在M$ Word中怎么把这半行搞上去!!!

)

将X换为相应盘符,对于32bit Windows版本须将win64 换为 ntx86 。

e.g.,

c) 在cmd窗口输入 fluent –t3:

e.g.,

根据你CPU的核心数量设置-t选项后的数字,这里的CPU是四核心的,所以设置

的是3个。

3. 设置并行求解器

File->Run

选中3D 和 Parallel 选项, 并设置Processes个数为3(与前述t选项后面的参数相

同,请自行更改),其他参数保持为默认值。 点击 Run。

4. 对网格分区并读取case文件

并行计算的核心思想是将流场网格分区,分区个数与所用处理器/进程个数相同,每个

进程计算一部分流场。因此读入case后要对网格进行分区。 Fluent具有自动分区功

能,当然,对于比较复杂的流场区域,手工分区效果可能更好。这个算例中结构很简单,

因此我们使用Fluent的自动分区功能。

1) 检查自动分区选项

Parallel->

确认Case File 已选中。

2) 读入case 文件

File->Read ->Case ...

这一步与普通的串行版本相同。

3) 检查网格分区情况

这一步可以让你看到分区效果。

点击 Print Active Partitions Fluent 将输出详细的分区信息。

4) 从图形上直观检查分区情况

a) 初始化流场

Solve->

这一步跟普通串行版本一致,不再赘述。

b) 显示网格分区

Contour也可以用来显示网格分区(这也是为何要执行步骤a的原因)。

勾选Filled选项;

在Contours of栏中选 和 Active CellPartition;

Surfaces 中选default-interior;

将Levels 调成3,这是计算节点(进程/cpu核心)的个数(与前述t选项后

面的参数相同,请自行更改);

点击Display,将会看到下图:

不同颜色的区域将交由不用的CPU核心来计算。

5) 保存网格分过区的case

至此,并行计算设置及网格分区已完成,可以保存case文件了。与读进来的

不同,这个case里的网格已包含分区信息。可以选择重命名,以免

覆盖串行版本的case文件。

5. 恭喜你!

至此所有设置已完成,可以开始迭代了。接下来的操作同以前的串行计算版本完全相同。

6. 评价并行效率

在完成一定的迭代步数后可以检查并行计算的效率。理想的情况下,N个处理器核心参

与并行计算可以将计算速度提高N倍,但由于存在核心之间的通信时间开销,加速比并

不能达到N倍。评价并行效率最准确而直接的办法是比较串行版本的计算时间和并行版

本的计算时间。不过这里我们采用Fluent自带的Timer功能来计算效率。

Parallel->Timer->Usage

Fluent将会输出并行计算效率等相关情况。其中的Total wall-time 和CPU time之比

即是加速比,与核心数量对比可知并行效率如何。

参考资料:

Fluent 6.36

Tutorial Guide

Parallel Processing

2024年3月29日发(作者:屈安彤)

在Windows平台上使用多核CPU加速Fluent计算

摘要:当利用Fluent计算3维问题时,普通PC显得相当吃力,尤其是使用其默认的串

行版本时。其实Fluent完全可以通过简单的设置来进行并行计算。本文只示例一

种在现在主流配置PC(CPU有2-6个核心)下的Windows版Fluent并行计算的设

置, 关于Linux/Unix平台或并行集群计算机(分布式存储)等环境下的并行设置,

请参考Fluent 官方文档(User’s Guide & Tutorial Guide)。

示例硬件软件环境:

OS: M$ Windows7 64bit version

CPU: AMD Athlon™IIX4 641 Quad-Core(四核心)

RAM: 4.00GB

Fluent: v6.36

求解问题:

大作业3(略)

步骤:

1. 准备case文件

使用并行计算时,前期参数模型设置的方法与串行计算完全相同,区别只在与网格的分

区与进程个数的指定。 因此这里不再介绍Case Setup过程(设置边界条件、设置求解器、

设置非预混模型等等)。本文假设已设置好并保存的case的名称为 。

2. 启动并行版本的Fluent

Fluent可以以多种方式启动并行版本,这里只介绍在多处理器计算机上通过命令行启动

的方式。

a) 打开Windows命令行窗口(i.e., Win-R 输入cmd回车)

b) 移动(cd)至Fluent可执行文件目录(i.e., X:/Program

Files//ntbin/win64)(

我实在不知道在M$ Word中怎么把这半行搞上去!!!

)

将X换为相应盘符,对于32bit Windows版本须将win64 换为 ntx86 。

e.g.,

c) 在cmd窗口输入 fluent –t3:

e.g.,

根据你CPU的核心数量设置-t选项后的数字,这里的CPU是四核心的,所以设置

的是3个。

3. 设置并行求解器

File->Run

选中3D 和 Parallel 选项, 并设置Processes个数为3(与前述t选项后面的参数相

同,请自行更改),其他参数保持为默认值。 点击 Run。

4. 对网格分区并读取case文件

并行计算的核心思想是将流场网格分区,分区个数与所用处理器/进程个数相同,每个

进程计算一部分流场。因此读入case后要对网格进行分区。 Fluent具有自动分区功

能,当然,对于比较复杂的流场区域,手工分区效果可能更好。这个算例中结构很简单,

因此我们使用Fluent的自动分区功能。

1) 检查自动分区选项

Parallel->

确认Case File 已选中。

2) 读入case 文件

File->Read ->Case ...

这一步与普通的串行版本相同。

3) 检查网格分区情况

这一步可以让你看到分区效果。

点击 Print Active Partitions Fluent 将输出详细的分区信息。

4) 从图形上直观检查分区情况

a) 初始化流场

Solve->

这一步跟普通串行版本一致,不再赘述。

b) 显示网格分区

Contour也可以用来显示网格分区(这也是为何要执行步骤a的原因)。

勾选Filled选项;

在Contours of栏中选 和 Active CellPartition;

Surfaces 中选default-interior;

将Levels 调成3,这是计算节点(进程/cpu核心)的个数(与前述t选项后

面的参数相同,请自行更改);

点击Display,将会看到下图:

不同颜色的区域将交由不用的CPU核心来计算。

5) 保存网格分过区的case

至此,并行计算设置及网格分区已完成,可以保存case文件了。与读进来的

不同,这个case里的网格已包含分区信息。可以选择重命名,以免

覆盖串行版本的case文件。

5. 恭喜你!

至此所有设置已完成,可以开始迭代了。接下来的操作同以前的串行计算版本完全相同。

6. 评价并行效率

在完成一定的迭代步数后可以检查并行计算的效率。理想的情况下,N个处理器核心参

与并行计算可以将计算速度提高N倍,但由于存在核心之间的通信时间开销,加速比并

不能达到N倍。评价并行效率最准确而直接的办法是比较串行版本的计算时间和并行版

本的计算时间。不过这里我们采用Fluent自带的Timer功能来计算效率。

Parallel->Timer->Usage

Fluent将会输出并行计算效率等相关情况。其中的Total wall-time 和CPU time之比

即是加速比,与核心数量对比可知并行效率如何。

参考资料:

Fluent 6.36

Tutorial Guide

Parallel Processing

发布评论

评论列表 (0)

  1. 暂无评论