2024年3月16日发(作者:红乐英)
基于ContextCapture实景三维建模中
CPU与GPU的性能分析
摘要:实景三维建模具有原始数据量大的特点,常需要计算机集群来生产。
集群设备最重要的计算资源是CPU与GPU,二者如何搭配、使用才能最大化建模
效率缺乏系统性的讨论分析。基于ContextCapture update19在不同的平台下使
用不同GPU处理不同面积的样本数据,分析数据的处理效率、GPU及CPU使用效
率、功耗、性价比等情况,测试了双显卡、AMD显卡、显卡驱动、显存超频等对三
维建模效率的影响,指出在选择计算资源时时应注意CPU及GPU性能的平衡;在
计算机内存及建模软件允许的情况下,使用较大的Tile能提高效率;同档位AMD
显卡效率不如Nvida显卡,但前者功耗低;较新的显卡驱动能带来一定的性能提
升;显存超频对建模效率提升不明显;双显卡能有效提升建模效率。
关键词:实景三维建模;计算机集群;计算资源; GPU;CPU
引言
倾斜摄影技术通过采集不同视角的影像进行三维重建,不同于传统的航空摄
影测量,实景三维建模由于需要从更多角度获取更高重叠度的像片,导致原始影
像数据量极大,如果融合Lidar或者空地一体化建模,则数据量进一步增大。倾
斜摄影测量已经成熟应用于大测区范围(如一个片区/城市),普通PC或者工作
站已很难满足这类测区在自动建模时的需求,集群技术的出现为普通PC 机进行
大测区范围的自动建模提供了支撑。
本文基于ContextCapture update 19测试不同GPU在不同试验平台下处理
不同样本的建模效率及功耗,分析GPU及CPU的利用率情况,并测试双显卡、超
频、显卡驱动对建模效率的影响,提出一些计算资源选择搭配及使用的建议。
1 试验数据、软硬件及平台
1)试验数据:中心相同的40米×40米(样本1)、60米×60米(样本2)、
80米×80米(样本3)三块区域,影像分辨率为3cm,郊区平地。
2)显卡:
①NVIDIA显卡: RTX3070(3070),RTX3060ti(3060ti),GTX1660s(1660s),
GTX1650s(1650s)
②AMD显卡: RX 6700xt(6700xt)
3)软件:ContextCpture update 19
4)系统环境:为避免网络传输的影响,采用单机测试,系统均为win10。
5)实验平台
表1 Intel试验平台 表2 AMD
试验平台
部
件
型号
CP
U
10900k
硬
盘
Intel S4610 1.92TB
内
存
商海盗船DDR4 3200
128GB
主
华硕Prime Z490-P
板
部
件
型号
C
PU
锐龙r9 3950x
硬
盘
4T
希捷 ST4000NM0035
内
存
商海盗船DDR4 3200
128GB
主
板
华硕PRIME X570-PRO
2 试验数据分析
(1)CPU与GPU利用率的关系
Intel平台下,以不同GPU处理样本2,GPU与CPU利用率如图1所示。
1650s与10900k搭配明显CPU性能过剩而GPU性能太弱;1660s对10900k利用
率仅50%,CPU性能仍然过剩;6700xt、3060ti、3070、1660s双显卡对10900k
的总体利用率在70%左右,但是3070利用率仅为34.5%,GPU性能过剩;6700xt
虽然理论性能高于3060ti,但对10900k的利用率低于3060ti;3060ti基本能发
挥10900k的性能;1660s双显卡对10900k的利用率最高,这种廉价的显卡组合
方式通过使用Wulkan双显卡功能,取得不错的GPU利用率。
(2)建模效率对比
Intel平台下,以不同GPU处理样本2, GPU的建模效率如图2:
建模效率(m
2
/s)=样本面积÷耗时
图2可知,高端显卡的建模效率高于低端显卡建模效率;双显卡建模效率提
升明显,能达到单张高端显卡建模效率1.5倍以上;AMD显卡6700xt虽然理论性
能优于3060ti,在Intel平台下处理样本2时,只能达到3060ti效率的85%,
处理样本3时也只能达到87%。
图1 CPU与GPU使用率 图2 不同GPU处理样本2
的效率
(3)GPU能耗分析
图3可知,3060ti与3070为安培构架,8nm工艺;1660s为图灵构架,12nm
工艺;6700xt使用RDNA2构架,7nm工艺。同为英伟达显卡安培显卡总功耗及单
位效率功耗优于上一代的图灵显卡,AMD显卡总功耗最低,单位效率功耗也较低。
使用新生产工艺的显卡能有效降低功耗。
(4)相同GPU处理不同样本效率
图4可知,在 ContextCapture允许的情况下一次处理较大的分块(tile)
能有效提高建模效率,建议提高系统内存。
图3 不同GPU能
耗 图4 不同样本建模
效率
(5)双显卡效率
Intel平台下,1660S双显卡与单显卡的建模效率如下:
图5 双显卡与单显卡效率对比
图5可知,双显卡建模效率能提升50%以上,前提是要与CPU等其他硬件资
源适配。
(6)AMD平台下3060ti与6700xt比较
图6 AMD平台下的效率比较 图7 AMD平台下的总功耗比较
上图可知,即使在AMD平台下,6700xt建模效率仍不如3060ti,功耗低是
其优势。
3 结语
实景三维建模方兴未艾,在组建计算机集群时要综合考虑网络吞吐率、硬盘
读写速度、数据处理的速度。每个节点机中CPU与GPU是计算关键资源,两者性
能应相互匹配,一般推荐使用低端GPU搭配低端CPU。从实验来看,一个高端
CPU搭配两张低端显卡也具有不错性价比。总之,在选择硬件时要综合考虑效率、
功耗和性价比。
参考文献
[1]单杰,李志鑫,张文元.大规模三维城市建模进展[J].测绘
报,2019,48(12):1523-1541.
[2]何雁如,徐敬海,秦骏.集群技术下的实景三维建模[J].测绘通
报,2019(4):119-124.
[3]王俊.Context Capture实景三维建模硬件性能分析[J].安徽建
筑,2019,26(9):210-211.
2024年3月16日发(作者:红乐英)
基于ContextCapture实景三维建模中
CPU与GPU的性能分析
摘要:实景三维建模具有原始数据量大的特点,常需要计算机集群来生产。
集群设备最重要的计算资源是CPU与GPU,二者如何搭配、使用才能最大化建模
效率缺乏系统性的讨论分析。基于ContextCapture update19在不同的平台下使
用不同GPU处理不同面积的样本数据,分析数据的处理效率、GPU及CPU使用效
率、功耗、性价比等情况,测试了双显卡、AMD显卡、显卡驱动、显存超频等对三
维建模效率的影响,指出在选择计算资源时时应注意CPU及GPU性能的平衡;在
计算机内存及建模软件允许的情况下,使用较大的Tile能提高效率;同档位AMD
显卡效率不如Nvida显卡,但前者功耗低;较新的显卡驱动能带来一定的性能提
升;显存超频对建模效率提升不明显;双显卡能有效提升建模效率。
关键词:实景三维建模;计算机集群;计算资源; GPU;CPU
引言
倾斜摄影技术通过采集不同视角的影像进行三维重建,不同于传统的航空摄
影测量,实景三维建模由于需要从更多角度获取更高重叠度的像片,导致原始影
像数据量极大,如果融合Lidar或者空地一体化建模,则数据量进一步增大。倾
斜摄影测量已经成熟应用于大测区范围(如一个片区/城市),普通PC或者工作
站已很难满足这类测区在自动建模时的需求,集群技术的出现为普通PC 机进行
大测区范围的自动建模提供了支撑。
本文基于ContextCapture update 19测试不同GPU在不同试验平台下处理
不同样本的建模效率及功耗,分析GPU及CPU的利用率情况,并测试双显卡、超
频、显卡驱动对建模效率的影响,提出一些计算资源选择搭配及使用的建议。
1 试验数据、软硬件及平台
1)试验数据:中心相同的40米×40米(样本1)、60米×60米(样本2)、
80米×80米(样本3)三块区域,影像分辨率为3cm,郊区平地。
2)显卡:
①NVIDIA显卡: RTX3070(3070),RTX3060ti(3060ti),GTX1660s(1660s),
GTX1650s(1650s)
②AMD显卡: RX 6700xt(6700xt)
3)软件:ContextCpture update 19
4)系统环境:为避免网络传输的影响,采用单机测试,系统均为win10。
5)实验平台
表1 Intel试验平台 表2 AMD
试验平台
部
件
型号
CP
U
10900k
硬
盘
Intel S4610 1.92TB
内
存
商海盗船DDR4 3200
128GB
主
华硕Prime Z490-P
板
部
件
型号
C
PU
锐龙r9 3950x
硬
盘
4T
希捷 ST4000NM0035
内
存
商海盗船DDR4 3200
128GB
主
板
华硕PRIME X570-PRO
2 试验数据分析
(1)CPU与GPU利用率的关系
Intel平台下,以不同GPU处理样本2,GPU与CPU利用率如图1所示。
1650s与10900k搭配明显CPU性能过剩而GPU性能太弱;1660s对10900k利用
率仅50%,CPU性能仍然过剩;6700xt、3060ti、3070、1660s双显卡对10900k
的总体利用率在70%左右,但是3070利用率仅为34.5%,GPU性能过剩;6700xt
虽然理论性能高于3060ti,但对10900k的利用率低于3060ti;3060ti基本能发
挥10900k的性能;1660s双显卡对10900k的利用率最高,这种廉价的显卡组合
方式通过使用Wulkan双显卡功能,取得不错的GPU利用率。
(2)建模效率对比
Intel平台下,以不同GPU处理样本2, GPU的建模效率如图2:
建模效率(m
2
/s)=样本面积÷耗时
图2可知,高端显卡的建模效率高于低端显卡建模效率;双显卡建模效率提
升明显,能达到单张高端显卡建模效率1.5倍以上;AMD显卡6700xt虽然理论性
能优于3060ti,在Intel平台下处理样本2时,只能达到3060ti效率的85%,
处理样本3时也只能达到87%。
图1 CPU与GPU使用率 图2 不同GPU处理样本2
的效率
(3)GPU能耗分析
图3可知,3060ti与3070为安培构架,8nm工艺;1660s为图灵构架,12nm
工艺;6700xt使用RDNA2构架,7nm工艺。同为英伟达显卡安培显卡总功耗及单
位效率功耗优于上一代的图灵显卡,AMD显卡总功耗最低,单位效率功耗也较低。
使用新生产工艺的显卡能有效降低功耗。
(4)相同GPU处理不同样本效率
图4可知,在 ContextCapture允许的情况下一次处理较大的分块(tile)
能有效提高建模效率,建议提高系统内存。
图3 不同GPU能
耗 图4 不同样本建模
效率
(5)双显卡效率
Intel平台下,1660S双显卡与单显卡的建模效率如下:
图5 双显卡与单显卡效率对比
图5可知,双显卡建模效率能提升50%以上,前提是要与CPU等其他硬件资
源适配。
(6)AMD平台下3060ti与6700xt比较
图6 AMD平台下的效率比较 图7 AMD平台下的总功耗比较
上图可知,即使在AMD平台下,6700xt建模效率仍不如3060ti,功耗低是
其优势。
3 结语
实景三维建模方兴未艾,在组建计算机集群时要综合考虑网络吞吐率、硬盘
读写速度、数据处理的速度。每个节点机中CPU与GPU是计算关键资源,两者性
能应相互匹配,一般推荐使用低端GPU搭配低端CPU。从实验来看,一个高端
CPU搭配两张低端显卡也具有不错性价比。总之,在选择硬件时要综合考虑效率、
功耗和性价比。
参考文献
[1]单杰,李志鑫,张文元.大规模三维城市建模进展[J].测绘
报,2019,48(12):1523-1541.
[2]何雁如,徐敬海,秦骏.集群技术下的实景三维建模[J].测绘通
报,2019(4):119-124.
[3]王俊.Context Capture实景三维建模硬件性能分析[J].安徽建
筑,2019,26(9):210-211.