HFSS作为领导电磁场仿真行业二十余年的产品,备受业内的尊敬和推崇,在技术发展上的高度、深度和前瞻性不仅为工程领域做出了持续不断的巨大贡献,并且引领了计算电磁学的发展。 在并行技术的研发上,HFSS根据工程领域的需求及计算机硬件发展的趋势,研发出基于有限元法的DDM(区域分解算法)技术,针对工程中常见的包含复杂结构和介质材料的大规模计算问题,DDM技术可提供优于线性的加速比,在商业电磁场仿真软件乃至计算电磁学领域都具有里程碑式的意义。

上海超级计算中心(Shanghai Supercomputer Center,www.ssc.net.cn) 成立于2000年12月,由上海市政府投资建设,座落于浦东张江高科技开发园区内。上海超级计算中心是国内第一个面向社会开放,资源共享、设施一流、功能齐全的高性能计算公共服务平台,目前拥有曙光4000A(2004年世界  排名第十)和“魔方”(2008年世界排名第十、亚洲第一)等3台超级计算机,同时配备丰富的科学和工程计算软件,致力于为国家科技进步和企业创新提供高端计算服务。

此次Ansoft联合上海超算中心所进行的测试主要针对HFSS-HPC模块在计算大规模电磁问题时的并行效率。测试提供的数据是在8核以上计算机上进行的,给出了8到32核(域)间的加速比数据。

 

硬件配置

为说明DDM计算在国内的适用性,本次测试采用的硬件平台为“魔方”超级计算机。

本次测试共采用了“魔方”的4个节点,共计128个CPU内核,512GB内存。每个节点的配置为:SMP架构,8个4核AMD巴塞罗那CPU计32核,32条4GB内存计128GB。节点间由20 Gb高速Infiniband网络连接,连接速度是千兆网的20倍。

 

软件配置:

操作系统:SUSE 10 SP2,其Linux内核版本2.6.16.60

仿真工具:HFSS版本 V12.1.0

 

测试案例简介:

计算目标物体为全铝制机身的飞机,计算机载UHF通信频段天线的工作状态。连同周围的空气盒子计算空间的初始网格量为290万网格(一阶)。

计算情况:

该问题单域计算时约需300GB内存。(注:单域计算所需内存超出单个计算节点的物理内存,故在下表中标记为NA)。8域以上的计算机时对比如下(使用上述算例):

Num. of Cores

Num. of Domains

Memory  per domain/core

(GB)

Total memory(GB)

Solution time

 

1

1

NA

NA

NA

8

8

30.74

245.9

8 hrs 23 mins

16

16

11.78

188.5

2 hrs 46 mins

32

32

5.31

159.3

1 hr 24 mins

从上表中可以看出,随着并行计算机CPU核数量的增加:

1、    项目计算所用总内存逐步降低,例如32个核比8个核求解此290万网格的问题所需总内存降低约40%;(有效降低问题所需总内存);

2、    单个域使用内存的降低速度超过域数的增加速度;

3、    优于线性的加速比。如,当CPU核数量从8个增加到16个时,计算时间从8小时23分降低到2小时46分,速度加快到了约3倍!从使用16核到使用32核,计算速度也提高到了约2倍的效果。DDM技术的加速比体现出了良好的超线性。

1:8、16、32核的求解时间均不包含网格剖分时间,而三者的网格剖分时间均为41分37秒。

2:8、16、32核的并行求解均采用跨节点并行方式,将计算任务均匀分配到4台曙光TC5000的节点上,即32核并行求解时,每台节点分配8核参与并行计算。

3:加速比见附页。

 

小结

综上所述,HFSS-HPC采用的DDM技术配合曙光TC5000并行计算平台,在有效降低电磁大问题求解所需总内存、增加电磁大问题求解速度两个方面体现出了杰出的性能。使用HFSS DDM技术可以使客户在保证问题求解精度的前提下,极大的扩展精确仿真所能覆盖的电尺寸范围,并且极大提高大问题求解效率,是将客户自身电磁仿真能力提升到另一个更高层次的必备工具!

 


附:加速比等曲线图