时间:2025-07-30 06:12 作者:荆暮
为什么昇腾384超节点能成为“镇馆之宝”?
文 观察者网 吕栋
镇馆之宝背后,是系统工程的突破
自大模型蓬勃发展以来,中国产业界就一直存在算力焦虑。一方面,大模型的Scaling Law(尺度定律)持续有效,训练和推理的算力需求爆发式增长;另一方面,美国不断收紧对先进算力芯片的出口管制,并遏制中国先进芯片制造能力,给国产单卡算力追赶制造障碍。
但实际上,大模型技术演进过程中,国产算力的挑战和机遇并存。一方面训练万亿参数大模型,仅靠单卡算力无法实现,集群算力成为大势所趋;另一方面,随着以DeepSeek为代表的MoE(混合专家模型)成为主流模型架构,其复杂混合并行导致通信需求骤增,单纯靠堆芯片,已不能带来有效算力的线性增加,但给提升通信带宽进而改善性能带来机遇。
并且,昇腾384超节点还可以通过灵活分配资源,更好地支持混合专家MoE大模型的训推,实现384卡“一卡一专家”,是业界唯一支持DeepSeekV3/R1在一个超节点域内即可完成所有的专家并行(EP)的方案,也是MoE模型的最佳训练/推理方案。
之所以能实现这种超强性能,是因为昇腾超节点并非修补式改进,而是彻底重构系统。一是打破以CPU为中心的冯诺依曼架构,计算单元通过总线直接互访,转变为更高效、更灵活的全对等架构;其次,新的总线技术重新定义通信互联协议,减少系统开销,内存统一编址,超节点内全局TB级内存统一访问;第三,突破传统服务器间通信能力不足带来的系统性能瓶颈,实现通信能力10倍提升,让计算不再等待通信,提升算力利用率和整体性能。
枝繁叶茂,昇腾已走进千行万业
“中国制造业像今天这样如此强大的原因,不仅是它能更便宜地生产东西,也因为它能更便宜、更快、更好、更智能地生产东西,而且正在越来越多地将人工智能融入到产品中来。”美国记者 托马斯·弗里德曼 在《我在中国看到了世界未来的样子》一文中写道。
1、非必要不外出!北京28日20时将启动全市防汛一级应急响应,北京防汛期是几号到几号
2、刚从北京回来,能劝一个是一个……,刚从北京回来需要做核酸检测吗
3、恒瑞医药与GSK达成125亿美元合作;和铂预计上半年盈利6800-7400万美元,恒瑞医药对比