根据最新报道,中国研究人员研发出一项创新的高性能算法,可显著提升NVIDIA消费级GPU在科学计算领域的性能,甚至达到了惊人的800倍!这项成果来自于深圳北理莫斯科大学的团队,该校由北京理工大学和莫斯科国立罗蒙诺索夫大学联合创办。
新算法利用了近场动力学(Peridynamics)的计算效率,这是一种前沿的非局部理论,在解决材料断裂、损坏等复杂物理问题时广泛应用。然而,近场动力学的计算过程十分复杂,传统模拟方法的效率相对较低。
深圳北理莫斯科大学团队基于NVIDIA CUDA编程技术创建了新的PD-General框架,并进行了优化设计和内存管理,充分发挥了GPU的大规模并行计算能力。结果显示,在一块普通的RTX 4070显卡上,新算法比传统串行算法速度快达惊人的800倍!与最新的OpenMP并行算法相比也提升了100倍。
对于涉及上百万粒子的大规模模拟而言,在这种情况下只需不到5分钟即可完成4000步迭代。而在大规模2D单轴拉伸问题中,则只需不到2分钟即可完成695万次单精度迭代。此外,这一算法具有广阔的应用前景,包括航空与国防领域、工程与制造领域以及军事研究。
值得一提的是,这一算法并不依赖高性能的GPU芯片,并且不受美国制裁限制。因此,在家庭级别电脑或游戏机上使用普通消费级GPU也能实现该功能。如果能进一步支持国产GPU硬件的话,那就更完美了!
本文属于原创文章,如若转载,请注明来源:中国科研团队开发新算法 使GPU在科学计算方面性能大幅提升https://news.zol.com.cn/945/9459366.html