下载贤集网APP入驻自媒体
6月20日,在华为开发者大会2025上,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线。 该服务首创将384颗昇腾NPU和192颗鲲鹏CPU通过MatrixLink全对等互联,形成超级“AI服务器”,单卡推理吞吐量达2300Tokens/s。超节点架构可实现“一卡一专家”,支持384个专家并行推理,还能“一卡一算力任务”,将MFU提升50%以上。云数据中心可将432个超节点级联成最高16万卡的超大集群,支持训推算力一体部署。 目前,新浪、硅基流动、面壁智能、中国科学院、360等超1300家客户已使用该服务。新浪推理交付效率提升超50%,NPU利用率提升超40%。硅基流动能高效提供推理服务,面壁智能推理业务性能提升2.7倍。