回复智者先行:支持,华为超牛逼的!!
下载贤集网APP入驻自媒体
部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了——不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构! 而做到这一点的,正是华为昇腾;具体而言,共包含两个产品: CloudMatrix 384超节点部署DeepSeek V3/R1,在50ms时延约束下单卡Decode吞吐突破1920 Tokens/s Atlas 800I A2推理服务器部署DeepSeek V3/R1,在100ms时延约束下单卡吞吐达到808 Tokens/s,可支持灵活的分布式部署