2025年11月14日
配天机器人2025年11月14日
TE2025年11月14日
西门子2025年11月14日
新时达2025年11月14日
蔡司工业
2025年11月13日
埃尔森
2025年11月10日
BBS
2025年11月07日
劳易测
2025年11月06日
和利时
2025年11月14日
威图
2025年11月14日
TE
2025年11月14日
KUKA
2025年11月14日
先导智能
2025年11月14日
TDK
要点综述
Autodesk Moldflow Insight 2011对求解器的准确性进行了优化,并引入了全新特性,能够缩短耦合 3D流动求解器的计算时间。在所测试的模型中,计算速度在某些情况下有所提高,在某些情况下则有所下降。总体而言,平均求解速度略有下降。但在此版本中,使用并行求解( parallel solution)技术和 GPU技术的选项已默认开启,能够抵消单线程计算速度的小幅下降。使用并行解算技术时,“并行的线程数”选项默认为“自动”。“自动”设置能够在确保不会造成计算器超载的前提下,对每个时间段步长中可以使用的线程数目进行智能检测。使用 GPU技术时,“如可用,则使用 GPU”选项的默认状态为启用。因此,一直使用求解器默认设置的用户将体验到比先前版本更快的计算速度。在只启用并行求解技术的情况下,平均增速(先前版本的所用时间 ÷最新版本的所用时间)为 1.68。使用 GPU技术后,平均增速为 1.46。
简介
与Autodesk Moldflow Plastic Insight 2010 Release 2 Service Pack 1相比,此版本的计算速度之所以在某些模型中有所提高而在某些模型中有所下降,是因为对求解器进行了以下改进:
• 通过引入水平集方法来计算每个时间步长的流体前沿移动,计算的准确性得到了提高。根据所分析的模型和所用的求解器参数的不同,对计算速度的影响也不同。许多情况下的计算速度均有提高,特别是在启用“模拟惯性效应”选项进行分析的情况下。有关求解器准确性的更多信息可在“ Autodesk Moldflow Insight 2011:三维流体求解器中的流体前沿移动”验证报告中找到。
• 引入了两个新特性:缩痕和熔接线计算。这些特性能够帮助提高计算速度。
引入自动启用的并行求解技术在某种程度上缓解了求解器速度的下降。在 Autodesk Moldflow Insight 2011中,“并行线程数目”选项的默认状态为“自动”。这一设置能够在确保不会造成计算器超载的前提下,对每个时间步长中可以使用的线程数目进行智能检测。这一设置通过考虑计算机中其它进程的计算负载来选择要使用的线程数目。这一方法使得 2011版本的计算速度比使用先前版本的默认设置进行分析要慢一些。此外, 2011版本中的并行求解功能也比先前版本更加准确。例如在先前版本中,根据所使用线程数目的不同,分析结果也会稍有不同。然而 2011版本则不存在这些差异。
相似地,该版本中“如可用,则使用 GPU”选项的默认状态为启用。如果计算机上配有一个兼容 GPU,将会自动使用这个 GPU进行分析。此外,在该版本中, GPU可以得到更有效的利用。在先前版本中,如果模型太大, GPU内存无法满足,则不使用 GPU。然而 2011版本会一直使用 GPU进行分析,直到分析所需的内存超过 GPU容量为止。例如,如果GPU卡内存容量不够,无法运行整个模型,则会在模型未完全填满时,在所需内存较小的时间步长中使用 GPU进行分析。达到 GPU内存的最大值时, GPU将停止工作,分析将继续通过计算机的 CPU进行。
在文本中,增速用来衡量速度的提高程度。增速的计算方法为:先前版本的所用时间÷最新版本的所用时间。
验证
我们对代表各种使用情景的 14个不同网格尺寸的模型进行了分析,并进行了增速比较。为了更准确地衡量增速,我们每次只在这些模型上运行一次分析,并且计算时没有再运行其它的 CPU密集型或 GPU密集型程序。
我们使用配有四核的酷睿 i7至尊处理器和一块 NVIDIA Tesla C1060 GPU卡的计算机。计算机和 GPU卡的规格见表 1。
表1:用于测量性能的计算机规格。
操作系统 Microsoft Windows Vista 64位版本
处理器 四核的酷睿 i7至尊 CPU,3.2GHz主频
三级高速缓存 8 MB
内存 12 GB
GPU设备 NVIDIA Tesla C 1060
GPU内存总容量 4 GB
GPU多处理器数 30
GPU内核数 240
GPU内存带宽 102 GB/s
图1以图表的形式展示了在未使用 GPU的情况下利用单线程 CPU和四线程 CPU进行分析的增速值。请注意,四线程计算结果是与先前版本中四线程相对比的增速值,而不是与 2011版本中单线程和四线程相对比的数值。还要注意的是,对于图 1中增速仅为 0.4左右(1,276,948个四面体单元)的模型,我们在分析求解器参数中选中了“模拟惯性效应”选项。这个版本在涉及惯性效应的计算结果上更加准确,但会增加一些计算时间。

图 1:与只使用 CPU以及单线程或四线程的 Autodesk Moldflow Plastic Insight 2010 Release 2 Service Pack 1相对比的增速。
同样,增强特性也会影响到使用 GPU技术时的计算时间。图 2以图表的形式展示了使用 GPU的单线程 CPU和使用 GPU的四线程 CPU的增速值。请再次注意,四线程的增速值是相对于先前版本中四线程的计算时间而言的。

图 2:与使用 GPU以及单线程或四线程的
Autodesk Moldflow Plastic Insight 2010 Release 2 Service Pack 1相对比的增速。
在2011版本中,“并行线程数目”选项的默认状态为“自动”。与使用单线程进行分析(先前版本的默认设置)相比,计算时间有所缩短。因此,一直使用求解器默认设置的用户应该可以感觉到分析速度的加快。
同样,在 2011版本中,“如可用,则使用 GPU”选项的默认状态也为启用。如果用户的计算机装有兼容的 GPU,则在先前版本中一直使用求解器默认设置的用户将可以感觉到速度的提升。
将使用先前版本的求解器默认设置进行分析所用的计算时间与使用最新版本的全新求解器默认设置进行分析所用的计算时间相对比便可得出,不使用 GPU时的平均增速为1.68,其中最小值为 0.73,最大值为 2.48。如果将分析中包含惯性效应的模型排除掉,则平均增速为 1.75,其中最小值为 1.33,最大值为 2.48。
同样,使用 GPU时,平均增速为 1.46,其中最小值为 0.68,最大值为 2.11。如果将分析中包含惯性效应的模型排除掉,则平均增速为 1.52,其中最小值为 1.24,最大值为 2.11。图 3以图形方式展示了这些数值。

图 3:与使用求解器默认参数的 Autodesk Moldflow Plastic Insight 2010 Release 2 Service Pack 1相对比的增速。
讨论
很明显计算时间受到了影响。与先前版本相比,有些模型的计算时间有所增加,而有些模型的计算时间有所减少。总体而言,影响分析速度的传统瓶颈是速度压力矩阵求解器。由于速度提升主要通过并行处理矩阵求解器和使用 GPU进行数字密集型计算来实现,因此特定情况下的增速值将取决于分析时间用在计算速度 -压力矩阵方面的比例。由于计算的整体准确度得到了提高,并且添加了缩痕和熔接线的计算特性,因此这一比例在大多数情况下是有所下降的。这就是使用 GPU时两个版本之间的增速不如使用 CPU大的原因,通过对比图 1和图 2中的数据便可发现。
此外,此版本还消除了使用多线程所带来的分析结果差异。在测试的所有模型中,均未发现多线程的分析结果存在差异。
增速的程度还取决于计算机和 GPU卡的规格。对于小型到中等尺寸的模型而言,如果计算机的处理器性能较高,则使用处理器比使用 GPU卡的分析效率更高;如果计算机的处理器性能较低,则使用 GPU卡比使用处理器的分析效率更高。因此,不同的处理器和 GPU卡组合将产生不同的增速值。在本文所介绍的测试中,使用 GPU的平均增速值为1.46,这一数值要低于不使用 GPU的平均增速值 1.68,这是由于四核酷睿 i7处理器的性能比较强大。我们还在一台性能相对较低的计算机上运行了这十四个模型:这台计算机的处理器为英特尔至强 X5472,主频为 3.0 GHz,并配有一块 Quadro FX 5800 GPU卡。 Quadro GPU卡的规格与 Tesla C1060相似。在这台性能相对较低的计算机上,使用 GPU的平均增速为 1.81,不使用 GPU的平均增速为 1.70。
结论
在主频为 3.2 GHz并配有酷睿 i7至尊处理器和一块 Tesla C1060 GPU卡的计算机上使用 Autodesk Moldflow Insight 2011进行计算时,许多模型的计算时间都有所缩短,但部分模型的计算时间出现了增加。计算时间的缩短主要是由于引入了缩痕和熔接线计算两个全新特性以及计算准确性的整体提高,特别是在分析中包含惯性效应时。此外在 2011版本中,使用并行解算和 GPU技术的选项是默认开启的。并行解算技术引入了一个新选项,这个选项能够在确保不会造成计算器超载的前提下,对每个时间步长中可以使用的线程数目进行智能检测。
将使用先前版本的求解器默认设置进行分析所用的计算时间与使用最新版本的全新求解器默认设置进行分析所用的计算时间相对比便可得出,不使用 GPU时的平均增速为1.68,其中最小值为 0.73,最大值为 2.48。使用 GPU的平均增速为 1.46,其中最小值为0.68,最大值为 2.11。
准确性和速度对于仿真都非常重要,我们将一如既往地在未来版本中进一步优化这两方面的性能。
(Autodesk技术社区)