8月24日,在青岛举行的全国高性能计算学术年会大会(CCFHPC China2023)上,由北京大学和华为技术有限公司联合申报的超融合以太网络荣获解决方案创新奖。CCF是中国计算机学会的简称,CCFHPC China是高性能计算领域具有影响力的三大超算盛会之一,有着“中国超算风向标”的称号。
如果说计算机领域,国际上的
CCF副理事长金海颁奖(中)
北京大学计算中心付振新(左)
华为数据中心网络领域副总裁张白领奖(右)
那么,此次北大和华为联合获得的创新成果到底有何含金量呢?让我们仔细道来。
算力落地面临拥堵难题
近年来,算力已经像水、电一样,渗透到生产生活的各个领域,成为经济社会高质量发展的重要驱动力。目前,我国算力总规模居
从去年年底以来,ChatGPT引发了
北京大学选中华为超融合以太网络解决方案
北京大学早在2018年就建成了高性能计算校级公共平台,先后建成投用了“未名一号”“未名二号”“未名生科一号”等5套集群,共有732个节点、31000多个核心,计算峰值3.65PFLOPS,配备存储14PB。
高性能计算校级公共平台从整体上提升了北京大学的科研服务能力,降低了科研成本。截至2023年5月12日,该平台为来自数学、力学、物理、化学、生物、地球科学等96个院系的5000多名师生提供了高性能计算服务,支撑了545项科研课题,1400多篇科研论文,并支撑了2020年戈登贝尔奖的发布。
不过随着平台使用人数、计算任务的增加,网络基础设施的吞吐量和复杂性都大大增加,年均节点占用率都在80%以上,“未名生科一号”的节点占用率甚至长期处于95%以上,作业时间和排队时间变得越来越漫长。
不能让科研攻关任务堵在“临门一脚”!为了提升高性能计算的效率,降低科研成本,北京大学高性能计算校级公共平台组织了一次厂家“考核”,意在选出智能时代最优的高性能计算网络。通过严格测试,北京大学高性能计算校级公共平台选择采用华为超融合以太网络解决方案,基于智能无损高性能计算网络搭建高性能计算集群,
华为超融合以太网络解决方案为何能脱颖而出
针对热门大型公共计算平台排队和作业时间过长的问题,各厂商先后提出IB(Infiniband)、RoCEv1、RoCEv2等无损网络技术。但是,通用计算区部署的传统以太网、高性能计算区部署的IB网、存储区部署的FC网,是三张异构网络,他们协议各异、架构割裂,带来了运维困难、专网生态封闭、成本高、无法实现全生命周期管理等问题。
华为超融合以太网络解决方案
此次北京大学和华为的联合获奖绝非偶然,这证明了超算行业技术圈对华为超融合以太网络解决方案的充分认可。
随着数字产业智能化向智能