HFSS作为领导电磁场仿真行业二十余年的产品,备受业内的尊敬和推崇,在技术发展上的高度、深度和前瞻性不仅为工程领域做出了持续不断的巨大贡献,并且引领了计算电磁学的发展。 在并行技术的研发上,HFSS根据工程领域的需求及计算机硬件发展的趋势,研发出基于有限元法的DDM(区域分解算法)技术,针对工程中常见的包含复杂结构和介质材料的大规模计算问题,DDM技术可提供优于线性的加速比,在商业电磁场仿真软件乃至计算电磁学领域都具有里程碑式的意义。
上海超级计算中心(Shanghai Supercomputer Center,www.ssc.net.cn) 成立于2000年12月,由上海市政府投资建设,座落于浦东张江高科技开发园区内。上海超级计算中心是国内第一个面向社会开放,资源共享、设施一流、功能齐全的高性能计算公共服务平台,目前拥有曙光4000A(2004年世界 排名第十)和“魔方”(2008年世界排名第十、亚洲第一)等3台超级计算机,同时配备丰富的科学和工程计算软件,致力于为国家科技进步和企业创新提供高端计算服务。
此次Ansoft联合上海超算中心所进行的测试主要针对HFSS-HPC模块在计算大规模电磁问题时的并行效率。测试提供的数据是在8核以上计算机上进行的,给出了8到32核(域)间的加速比数据。
硬件配置:
为说明DDM计算在国内的适用性,本次测试采用的硬件平台为“魔方”超级计算机。
本次测试共采用了“魔方”的4个节点,共计128个CPU内核,512GB内存。每个节点的配置为:SMP架构,8个4核AMD巴塞罗那CPU计32核,32条4GB内存计128GB。节点间由20 Gb高速Infiniband网络连接,连接速度是千兆网的20倍。
软件配置:
操作系统:SUSE 10 SP2,其Linux内核版本2.6.16.60
仿真工具:HFSS版本 V12.1.0
测试案例简介:
计算目标物体为全铝制机身的飞机,计算机载UHF通信频段天线的工作状态。连同周围的空气盒子计算空间的初始网格量为290万网格(一阶)。
计算情况:
该问题单域计算时约需300GB内存。(注:单域计算所需内存超出单个计算节点的物理内存,故在下表中标记为NA)。8域以上的计算机时对比如下(使用上述算例):
Num. of Cores | Num. of Domains | Memory per domain/core (GB) | Total memory(GB) | Solution time
|
1 | 1 | NA | NA | NA |
8 | 8 | 30.74 | 245.9 | 8 hrs 23 mins |
16 | 16 | 11.78 | 188.5 | 2 hrs 46 mins |
32 | 32 | 5.31 | 159.3 | 1 hr 24 mins |
从上表中可以看出,随着并行计算机CPU核数量的增加:
1、 项目计算所用总内存逐步降低,例如32个核比8个核求解此290万网格的问题所需总内存降低约40%;(有效降低问题所需总内存);
2、 单个域使用内存的降低速度超过域数的增加速度;
3、 优于线性的加速比。如,当CPU核数量从8个增加到16个时,计算时间从8小时23分降低到2小时46分,速度加快到了约3倍!从使用16核到使用32核,计算速度也提高到了约2倍的效果。DDM技术的加速比体现出了良好的超线性。
注1:8、16、32核的求解时间均不包含网格剖分时间,而三者的网格剖分时间均为41分37秒。
注2:8、16、32核的并行求解均采用跨节点并行方式,将计算任务均匀分配到4台曙光TC5000的节点上,即32核并行求解时,每台节点分配8核参与并行计算。
注3:加速比见附页。
小结
综上所述,HFSS-HPC采用的DDM技术配合曙光TC5000并行计算平台,在有效降低电磁大问题求解所需总内存、增加电磁大问题求解速度两个方面体现出了杰出的性能。使用HFSS DDM技术可以使客户在保证问题求解精度的前提下,极大的扩展精确仿真所能覆盖的电尺寸范围,并且极大提高大问题求解效率,是将客户自身电磁仿真能力提升到另一个更高层次的必备工具!
附:加速比等曲线图