热点:

    华为发布昇腾AI计算集群:支持万亿参数大模型训练

      [  中关村在线 原创  ]   作者:两三杯可乐

    近日,华为在2023年全联接大会上正式发布了全新架构的昇腾AI计算集群Atlas 900 SuperCluster。这款新的计算集群具备强大的处理能力,能够支持超万亿参数的大模型训练。 Atlas 900 SuperCluster采用了华为全新的星河AI智算交换机CloudEngine XH16800,这款交换机拥有高密的800GE端口能力。通过两层交换网络,它能够实现2250节点(等效于18000张卡)的超大规模无收敛集群组网。 此外,新集群还采用了创新的超节点架构。这一架构的使用,极大地提升了大模型训练能力。同时,华为充分发挥了在计算、网络、存储、能源等领域的综合优势,从器件级、节点级、集群级和业务级全面提升系统可靠性,将大模型训练稳定性从天级提升到月级。为了进一步提升开发效率,华为还升级了Ascend C编程语言,以更高效的方式,简化算子实现逻辑,大幅缩短融合算子的开发周期,为AI模型与应用的快速开发赋能。 华为常务董事汪涛表示,随着人工智能进入大模型时代,大算力正在成为人工智能发展的核心引擎。华为改变传统的服务器堆叠模式,以系统架构创新打造AI集群,实现算力、运力、存力的一体化设计,突破大算力瓶颈。

    本文属于原创文章,如若转载,请注明来源:华为发布昇腾AI计算集群:支持万亿参数大模型训练https://news.zol.com.cn/833/8337976.html

    news.zol.com.cn true https://news.zol.com.cn/833/8337976.html report 922 近日,华为在2023年全联接大会上正式发布了全新架构的昇腾AI计算集群Atlas 900 SuperCluster。这款新的计算集群具备强大的处理能力,能够支持超万亿参数的大模型训练。 Atlas 900 SuperCluster采用了华为全新的星河AI智算交换机CloudEngine XH16800,这款交换机拥有高密...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错