随着人工智能(AI)技术的快速发展,大模型训练和推理对算力的需求呈指数级增长。万卡集群作为一种由超过一万张加速卡组成的高性能计算系统,正成为推动 AI 发展的关键基础设施。本文将深入探讨万卡集群的概念、作用、国内外布局情况,以及对国产 AI 芯片公司的影响。
什么是万卡集群?
万卡集群是由超过一万张加速卡(例如 GPU、TPU 或其他专用 AI 加速芯片)组成的超大规模计算系统。其主要目的是加速 AI 模型的训练和推理过程。
为什么需要一万张加速卡?想象一个巨大的土堆,如果只有一个工人,处理进度将非常缓慢国内 中国移动:在中国移动呼和浩特、哈尔滨、贵阳的万卡级智算中心已投产运行。 中国电信:上海和北京的两大万卡集群已投产运营。 中国联通:正在打造上海、呼和浩特有万卡智算集群,全网智算算力超过 15EFLOPS。 小米:计划建设一座 GPU 万卡集群。 字节:已建立起超过 1 万张 Ampere 架构 GPU 集群,并正在建设大规模 Hopper 架构集群。
发表评论