最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

基于ContextCapture实景三维建模中CPU与GPU的性能分析

IT圈 admin 28浏览 0评论

2024年3月16日发(作者:红乐英)

基于ContextCapture实景三维建模中

CPU与GPU的性能分析

摘要:实景三维建模具有原始数据量大的特点,常需要计算机集群来生产。

集群设备最重要的计算资源是CPU与GPU,二者如何搭配、使用才能最大化建模

效率缺乏系统性的讨论分析。基于ContextCapture update19在不同的平台下使

用不同GPU处理不同面积的样本数据,分析数据的处理效率、GPU及CPU使用效

率、功耗、性价比等情况,测试了双显卡、AMD显卡、显卡驱动、显存超频等对三

维建模效率的影响,指出在选择计算资源时时应注意CPU及GPU性能的平衡;在

计算机内存及建模软件允许的情况下,使用较大的Tile能提高效率;同档位AMD

显卡效率不如Nvida显卡,但前者功耗低;较新的显卡驱动能带来一定的性能提

升;显存超频对建模效率提升不明显;双显卡能有效提升建模效率。

关键词:实景三维建模;计算机集群;计算资源; GPU;CPU

引言

倾斜摄影技术通过采集不同视角的影像进行三维重建,不同于传统的航空摄

影测量,实景三维建模由于需要从更多角度获取更高重叠度的像片,导致原始影

像数据量极大,如果融合Lidar或者空地一体化建模,则数据量进一步增大。倾

斜摄影测量已经成熟应用于大测区范围(如一个片区/城市),普通PC或者工作

站已很难满足这类测区在自动建模时的需求,集群技术的出现为普通PC 机进行

大测区范围的自动建模提供了支撑。

本文基于ContextCapture update 19测试不同GPU在不同试验平台下处理

不同样本的建模效率及功耗,分析GPU及CPU的利用率情况,并测试双显卡、超

频、显卡驱动对建模效率的影响,提出一些计算资源选择搭配及使用的建议。

1 试验数据、软硬件及平台

1)试验数据:中心相同的40米×40米(样本1)、60米×60米(样本2)、

80米×80米(样本3)三块区域,影像分辨率为3cm,郊区平地。

2)显卡:

①NVIDIA显卡: RTX3070(3070),RTX3060ti(3060ti),GTX1660s(1660s),

GTX1650s(1650s)

②AMD显卡: RX 6700xt(6700xt)

3)软件:ContextCpture update 19

4)系统环境:为避免网络传输的影响,采用单机测试,系统均为win10。

5)实验平台

表1 Intel试验平台 表2 AMD

试验平台

型号

CP

U

10900k

Intel S4610 1.92TB

商海盗船DDR4 3200

128GB

华硕Prime Z490-P

型号

C

PU

锐龙r9 3950x

4T

希捷 ST4000NM0035

商海盗船DDR4 3200

128GB

华硕PRIME X570-PRO

2 试验数据分析

(1)CPU与GPU利用率的关系

Intel平台下,以不同GPU处理样本2,GPU与CPU利用率如图1所示。

1650s与10900k搭配明显CPU性能过剩而GPU性能太弱;1660s对10900k利用

率仅50%,CPU性能仍然过剩;6700xt、3060ti、3070、1660s双显卡对10900k

的总体利用率在70%左右,但是3070利用率仅为34.5%,GPU性能过剩;6700xt

虽然理论性能高于3060ti,但对10900k的利用率低于3060ti;3060ti基本能发

挥10900k的性能;1660s双显卡对10900k的利用率最高,这种廉价的显卡组合

方式通过使用Wulkan双显卡功能,取得不错的GPU利用率。

(2)建模效率对比

Intel平台下,以不同GPU处理样本2, GPU的建模效率如图2:

建模效率(m

2

/s)=样本面积÷耗时

图2可知,高端显卡的建模效率高于低端显卡建模效率;双显卡建模效率提

升明显,能达到单张高端显卡建模效率1.5倍以上;AMD显卡6700xt虽然理论性

能优于3060ti,在Intel平台下处理样本2时,只能达到3060ti效率的85%,

处理样本3时也只能达到87%。

图1 CPU与GPU使用率 图2 不同GPU处理样本2

的效率

(3)GPU能耗分析

图3可知,3060ti与3070为安培构架,8nm工艺;1660s为图灵构架,12nm

工艺;6700xt使用RDNA2构架,7nm工艺。同为英伟达显卡安培显卡总功耗及单

位效率功耗优于上一代的图灵显卡,AMD显卡总功耗最低,单位效率功耗也较低。

使用新生产工艺的显卡能有效降低功耗。

(4)相同GPU处理不同样本效率

图4可知,在 ContextCapture允许的情况下一次处理较大的分块(tile)

能有效提高建模效率,建议提高系统内存。

图3 不同GPU能

耗 图4 不同样本建模

效率

(5)双显卡效率

Intel平台下,1660S双显卡与单显卡的建模效率如下:

图5 双显卡与单显卡效率对比

图5可知,双显卡建模效率能提升50%以上,前提是要与CPU等其他硬件资

源适配。

(6)AMD平台下3060ti与6700xt比较

图6 AMD平台下的效率比较 图7 AMD平台下的总功耗比较

上图可知,即使在AMD平台下,6700xt建模效率仍不如3060ti,功耗低是

其优势。

3 结语

实景三维建模方兴未艾,在组建计算机集群时要综合考虑网络吞吐率、硬盘

读写速度、数据处理的速度。每个节点机中CPU与GPU是计算关键资源,两者性

能应相互匹配,一般推荐使用低端GPU搭配低端CPU。从实验来看,一个高端

CPU搭配两张低端显卡也具有不错性价比。总之,在选择硬件时要综合考虑效率、

功耗和性价比。

参考文献

[1]单杰,李志鑫,张文元.大规模三维城市建模进展[J].测绘

报,2019,48(12):1523-1541.

[2]何雁如,徐敬海,秦骏.集群技术下的实景三维建模[J].测绘通

报,2019(4):119-124.

[3]王俊.Context Capture实景三维建模硬件性能分析[J].安徽建

筑,2019,26(9):210-211.

2024年3月16日发(作者:红乐英)

基于ContextCapture实景三维建模中

CPU与GPU的性能分析

摘要:实景三维建模具有原始数据量大的特点,常需要计算机集群来生产。

集群设备最重要的计算资源是CPU与GPU,二者如何搭配、使用才能最大化建模

效率缺乏系统性的讨论分析。基于ContextCapture update19在不同的平台下使

用不同GPU处理不同面积的样本数据,分析数据的处理效率、GPU及CPU使用效

率、功耗、性价比等情况,测试了双显卡、AMD显卡、显卡驱动、显存超频等对三

维建模效率的影响,指出在选择计算资源时时应注意CPU及GPU性能的平衡;在

计算机内存及建模软件允许的情况下,使用较大的Tile能提高效率;同档位AMD

显卡效率不如Nvida显卡,但前者功耗低;较新的显卡驱动能带来一定的性能提

升;显存超频对建模效率提升不明显;双显卡能有效提升建模效率。

关键词:实景三维建模;计算机集群;计算资源; GPU;CPU

引言

倾斜摄影技术通过采集不同视角的影像进行三维重建,不同于传统的航空摄

影测量,实景三维建模由于需要从更多角度获取更高重叠度的像片,导致原始影

像数据量极大,如果融合Lidar或者空地一体化建模,则数据量进一步增大。倾

斜摄影测量已经成熟应用于大测区范围(如一个片区/城市),普通PC或者工作

站已很难满足这类测区在自动建模时的需求,集群技术的出现为普通PC 机进行

大测区范围的自动建模提供了支撑。

本文基于ContextCapture update 19测试不同GPU在不同试验平台下处理

不同样本的建模效率及功耗,分析GPU及CPU的利用率情况,并测试双显卡、超

频、显卡驱动对建模效率的影响,提出一些计算资源选择搭配及使用的建议。

1 试验数据、软硬件及平台

1)试验数据:中心相同的40米×40米(样本1)、60米×60米(样本2)、

80米×80米(样本3)三块区域,影像分辨率为3cm,郊区平地。

2)显卡:

①NVIDIA显卡: RTX3070(3070),RTX3060ti(3060ti),GTX1660s(1660s),

GTX1650s(1650s)

②AMD显卡: RX 6700xt(6700xt)

3)软件:ContextCpture update 19

4)系统环境:为避免网络传输的影响,采用单机测试,系统均为win10。

5)实验平台

表1 Intel试验平台 表2 AMD

试验平台

型号

CP

U

10900k

Intel S4610 1.92TB

商海盗船DDR4 3200

128GB

华硕Prime Z490-P

型号

C

PU

锐龙r9 3950x

4T

希捷 ST4000NM0035

商海盗船DDR4 3200

128GB

华硕PRIME X570-PRO

2 试验数据分析

(1)CPU与GPU利用率的关系

Intel平台下,以不同GPU处理样本2,GPU与CPU利用率如图1所示。

1650s与10900k搭配明显CPU性能过剩而GPU性能太弱;1660s对10900k利用

率仅50%,CPU性能仍然过剩;6700xt、3060ti、3070、1660s双显卡对10900k

的总体利用率在70%左右,但是3070利用率仅为34.5%,GPU性能过剩;6700xt

虽然理论性能高于3060ti,但对10900k的利用率低于3060ti;3060ti基本能发

挥10900k的性能;1660s双显卡对10900k的利用率最高,这种廉价的显卡组合

方式通过使用Wulkan双显卡功能,取得不错的GPU利用率。

(2)建模效率对比

Intel平台下,以不同GPU处理样本2, GPU的建模效率如图2:

建模效率(m

2

/s)=样本面积÷耗时

图2可知,高端显卡的建模效率高于低端显卡建模效率;双显卡建模效率提

升明显,能达到单张高端显卡建模效率1.5倍以上;AMD显卡6700xt虽然理论性

能优于3060ti,在Intel平台下处理样本2时,只能达到3060ti效率的85%,

处理样本3时也只能达到87%。

图1 CPU与GPU使用率 图2 不同GPU处理样本2

的效率

(3)GPU能耗分析

图3可知,3060ti与3070为安培构架,8nm工艺;1660s为图灵构架,12nm

工艺;6700xt使用RDNA2构架,7nm工艺。同为英伟达显卡安培显卡总功耗及单

位效率功耗优于上一代的图灵显卡,AMD显卡总功耗最低,单位效率功耗也较低。

使用新生产工艺的显卡能有效降低功耗。

(4)相同GPU处理不同样本效率

图4可知,在 ContextCapture允许的情况下一次处理较大的分块(tile)

能有效提高建模效率,建议提高系统内存。

图3 不同GPU能

耗 图4 不同样本建模

效率

(5)双显卡效率

Intel平台下,1660S双显卡与单显卡的建模效率如下:

图5 双显卡与单显卡效率对比

图5可知,双显卡建模效率能提升50%以上,前提是要与CPU等其他硬件资

源适配。

(6)AMD平台下3060ti与6700xt比较

图6 AMD平台下的效率比较 图7 AMD平台下的总功耗比较

上图可知,即使在AMD平台下,6700xt建模效率仍不如3060ti,功耗低是

其优势。

3 结语

实景三维建模方兴未艾,在组建计算机集群时要综合考虑网络吞吐率、硬盘

读写速度、数据处理的速度。每个节点机中CPU与GPU是计算关键资源,两者性

能应相互匹配,一般推荐使用低端GPU搭配低端CPU。从实验来看,一个高端

CPU搭配两张低端显卡也具有不错性价比。总之,在选择硬件时要综合考虑效率、

功耗和性价比。

参考文献

[1]单杰,李志鑫,张文元.大规模三维城市建模进展[J].测绘

报,2019,48(12):1523-1541.

[2]何雁如,徐敬海,秦骏.集群技术下的实景三维建模[J].测绘通

报,2019(4):119-124.

[3]王俊.Context Capture实景三维建模硬件性能分析[J].安徽建

筑,2019,26(9):210-211.

发布评论

评论列表 (0)

  1. 暂无评论