现金九游体育app平台智算规模高达 6.7EFLOPS(FP16)-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载
文 | 半导体产业纵横
GPU 万卡集群,小米下场了!摩尔线程智算集群推广至万卡!中国挪动将商用三个自主可控万卡集群 ...... 一系列标题的袭来,让笔者短暂意志到,仿佛在不经意间,智能算力成立闭塞迈入万卡时期。
那么到底什么是万卡集群?万卡集群到底有哪些作用?有必要部署万卡集群吗?
01 什么是万卡集群?
万卡集群,是指由杰出一万张加快卡(如 GPU、TPU 或其他专用 AI 加快芯片)构成的高性能诡计系统,用以加快东说念主工智能模子的老练和推理经由。
至于为什么需要一万张加快卡?
无人不晓,大模子竞赛的本体是算力竞赛。比如这里有一个超大土堆,放一个工东说念主和放一万个工东说念主,在恶果上详情会有质的飞跃。
以 OpenAI 老练 GPT 模子为例,GPT-4 需要使用 2.5 万张英伟达 A100 GPU,并行老练 100 天独揽的时分,在此期间要处理 13 万亿个 token,况兼波及约莫 1.76 万亿个参数。在不久的异日,开发大模子所需的算力将已毕指数级的增长,关于行将亮相的 GPT-5,瞻望该模子的老练需要部署 20 万 ~30 万个 H100 GPU,耗时 130~200 天。
如今 OpenAI 发布 ChatGPT 已有两年的时分,从成立进程上看,国外头部厂商在 2022 年、2023 年也曾完成万卡集群搭建。比如 2023 年 5 月,谷歌推出的 AI 超等诡计机 A3,搭载了约 26000 块英伟达 H100 GPU;2022 年,META 告示了一个由 1.6 万块英伟达 A100 GPU 构成的集群。到了 2024 年头,META 进一步扩大规模,建成了两个各含 24576 块 GPU 的集群,并设定了宏伟主义:到 2024 年底,构建一个包含 35 万块英伟达 H100 GPU 的庞大基础技艺。亚马逊 Amazon EC2 Ultra 集群聘请了 2 万个 H100 TensorCore GPU。
再看中国的智能算力成立情况。
02 国产万卡集群,谁在布局?
日前,中国工程院院士郑纬民指出,"构开国产 AI 卡的万卡大模子老练平台很难,但也很迫切以及必要。"
当下,国内已有多家厂商及机构入辖下手向万卡集群领域拓展业务。
字据《智算产业发展研究论说 ( 2024 ) 》骄贵,在中国,超万卡集群的智算中心已达十余个。
本年以来, 中国挪动 、联通、电信三大运营商均在加快鼓动超万卡集群智算中心的成立。
本年 8 月,中国电信在智算网罗成立方面赢得了权贵进展,其上海与北京两大万卡集群已到手投产运营。
中国挪动位于呼和浩特、哈尔滨、贵阳的万卡级别的智算中心也曾先后投产运行。据悉,三大集群总规模近 6 万张 GPU 卡,充分幽闲大模子聚会老练需求。
中国联通正在打造上海、呼和万卡智算集群,全网智算算力超 15EFLOPS,发布 AICC、AICP、星罗调理平台等五大智算产物,提供涵盖国度"东数西算"重要、31 省要点城市、超 600 边际节点的 AIDC 基座。
小米也正野心成立一座 GPU 万卡集群。据悉,小米在其大模子团队成随即也曾领有 6500 张 GPU 资源。
字节在 2023 年就已建立起杰出 1 万张卡的 Ampere 架构 GPU (A100/A800) 集群,尔后还在成立大规模 Hopper 架构(H100/H800)集群。
如今,"万卡集群"被业界视作是这一轮大模子竞赛的"入场券",甚而还有不少厂商也曾启动布局"十万卡集群"。
百度的百舸 4.0 通过一系列产物技能更动,也曾大约已毕十万卡集群的高效料理。
阿里巴巴的阿里云可已毕芯片、奇迹器、数据中心之间的高效协同,搭救 10 万卡量级的集群可推广规模,已奇迹宇宙一半的东说念主工智能大模子企业。
腾讯已告示自研星脉高性能诡计网罗全面升级,星脉网罗 2.0 搭载全自研的网罗开荒与 AI 算力网卡,大约搭救超 10 万卡大规模组网,网罗通讯恶果比上一代普及 60%,让大模子老练恶果普及 20%。
03 国产 AI 芯片公司,得到利好
赫然,在运营商以及科技巨头纷繁入场布局之际,国产 AI 芯片公司也迎来利好。
华为昇腾
据悉,以政府为主导的城市智能诡计中心多聘请国产 A1 芯片中的杰出人物如华为昇腾等,其中华为更是在统计的 20 多个城市为主体的智能诡计中心中占据 79% 的阛阓份额,处于国产 AI 芯片的最先位置。在可猜测的 2025 年,昇腾芯片及奇迹器的阛阓依旧会处于急切的供给地点。
寒武纪
2023 年寒武纪想元(MLU)系列云霄智能加快卡在中国挪动负责上线。扫尾 2023 年 12 月,中国挪动已有 12 个省公司、杰出 70 个 AI 业务完成向寒武纪想元系列云霄智能加快卡的转移。
2024 年 8 月,中国挪动云智商中心参建的全球运营商最大单集群智算中心——中国挪动智算中心(哈尔滨)负责投产使用。该智算中心部署超 1.8 万张 AI 加快卡,AI 芯片国产化率达 100%,可提供 6.9EFLOPS(每秒 690 亿亿次浮点运算)智能算力。据悉,该智算中心便是由寒武纪参与成立。
南京智能诡计中心由南京市麒麟科技更动园与波浪、寒武纪共同打造,聘请波浪 AI 奇迹器算力机组,搭载最先的寒武纪想元 270 和想元 290 智能芯片及加快卡,已运营系统的 AI 诡计智商达每秒 80 亿亿次 ( 800P OpS ) 。
大模子爆火确当下,AI 的老练和推理芯片及训推一体化等芯片成为阛阓"香饽饽",寒武纪在此领域的深耕研发,加快想元系列芯片的迭代。
摩尔线程
2023 年 12 月摩尔线程 KUAE 智算中心揭幕,这是国内首个以国产全功能 GPU 为底座的大规模算力集群,以全功能 GPU 为底座,提供软硬一体化的全栈责罚有筹办。
2024 年 7 月,摩尔线程合资中国挪动通讯集团青海有限公司、中国联通青海公司、北京德说念信科集团、中国动力成立股份有限公司总承包公司、桂林华崛大数据科技有限公司等,分手就三个万卡集群方法进行了策略签约,多方将聚力共同构建好用的国产 GPU 集群。
燧原科技
2021 年燧原科技与之江实验室在之江实验室南湖新园区签约成立"燧原 - 之江东说念主工智能芯片合资研究中心"。
成渝智算中心由四川并济科技投建,燧原科技提供搭建算力底座。
与此同期,燧原科技还助力太湖亿芯(无锡)智算中心、甘肃庆阳算力重要的成立。
天数智芯
中国挪动智算中心(呼和浩特)是全球运营商领域内规模最大的单体液冷智算中心,智算规模高达 6.7EFLOPS(FP16),领有国度级 N 节点万卡规模 AI 老练场。
天数智芯在该方法中充分推崇天垓 150 产物的额外性能与平凡适用性,与新华三信息技能强强合资,共同打造高性能 AI 老练奇迹器。
壁仞科技
壁仞科技也参与中国挪动呼和浩特智算中心方法。
此外,壁仞科技的壁砺系列通用 GPU 算力产物还在中国电信落地千卡集群并开展交易化应用,另外皮中国电信集团新一轮国产化 GPU 集采方法中,壁仞科技的主流 GPU 产物也曾纳入中国电信的集采名录,成为中国电信的主要 GPU 供应商。
沐曦科技
2024 年 11 月,由上海联通联袂加佳科技、沐曦共同打造的曦源一号 SADA 万卡集群算力方法第一期千卡国产算力集群在上海联通临港机房负责落地。该方法以沐曦 GPU 芯片技能产物为中枢,服从构建集算力、算法、数据、产业应用为一体的东说念主工智能产业重生态。
据悉,沐曦和加佳科技已在上海、湖南、江苏等多地建成智算中心,并野心于 2025 年 6 月完成 10000 卡国产高质料算力成立。
04 岂止"万卡",甚而要"百万卡"
从早期智算中心重荷起步,一步步发展到如今 "万卡" 规模的算力集群纷繁落地,这无疑是巨大的飞跃。当下,行业头部厂商更是将视线进一步拓宽,闭塞聚焦于更为重大的 "百万卡" 主义。
近日,在 AI 阛阓快速增长的布景下,博通市值打破 1 万亿好意思元,创下历史新高。
博通首席履行官陈福阳暗示,他有信心在 2020 年代后期络续加大对东说念主工智能的投资。他指出,三年内,博通的客户野心构建配备数百万个 AI 芯片的大规模诡计集群,从而推动阛阓大幅增长。
博通正与三大客户和谐开发 AI 芯片,野心到 2027 年在网罗集群中部署 100 万个芯片。据 CNBC 报说念,他忖度,到 2027 年,其 XPU 和 AI 网罗组件的总阛阓规模将达到 600 亿至 900 亿好意思元。
诚然博通尚未负责公布其芯片客户,但分析师暗示,该公司正在与谷歌、Meta 和字节跨越和谐,以加快 AI 系统的老练和部署。据《金融时报》报说念,该公司已为此开发了定制处理器。
05 "万卡集群"确切有必要吗?
先说论断,"万卡集群"的成立一定是有必要的。
刻下,我国智能算力供不应求的问题较为杰出,大模子对算力的需求增速远超单颗 AI 芯片性能的普及次第。有关论说骄贵,2023 年,中国智能算力需求达 123.6EFLOPS,而供给仅为 57.9EFLOPS,供需缺口一目了然。利用集群互联弥补单卡性能短板,或是现阶段缓解 AI 算力荒最值得探索与推行的有用路线。
不外,在鼓动 "万卡集群" 成立进程中,有两大重要艰苦亟待责罚:其一,若何高质料完成成立任务,保证集群在相识性、高效性、兼容性等多方面达到圭表条款;其二,建成后如何充分挖掘其应用价值,使其在东说念主工智能老练、大数据分析等适配场景推崇最大作用,根绝资源空置与浪掷风景。
最先,不妨将 "万卡集群" 类比为参与 "多东说念主多足" 游戏的团队,巨匠都了了,让一群东说念主如团结个东说念主般整皆整齐地前行并非易事,要调理上万张诡计卡协同高效功课、达成性能的线性推广、确保任务无远离运行,这对集群的设想、调理以及容错智商都提议了极高挑战。
其次,智算中心的成立仅仅一个伊始,更迫切的是后续的有用欺诈。
据报说念,由于智算中心的投资、成立、运营时常由不同主体负责,前期成立方不时对后续运营模式、奇迹圭表败落满盈考量,出现 "只管成立、不顾运营"、成立与运营脱节的情况,影响了客户体验,致使不少城市所建智算中心的机架利用率不尽东说念办法。
从交易模式来讲,智算中心大多以出租或售卖算力为主要盈利妙技,但是因行业尚未颐养算力订价圭表,不同智算中心价钱相反悬殊,阛阓接受程度受限。
近期,多位智算中心领域从业者造访国内各地智算中心后,他们中的一些东说念主向《智能清楚》反映,刻下国内算力中心阛阓较为低迷。一位业内东说念主士败露:"就现在所掌持情况,多数机房出租率大致在 20% - 30% 区间浮动,部分企业级智算中心出租率甚而低至 10% 独揽。"
要了了,智算中心不仅前期需要插足大都资金购置 GPU 等 AI 芯片,后续运营阶段相通需要不绝注资。
《智能清楚》不久前发文指出,一台英伟达 H100 奇迹器(8 卡)租借价钱,已从年头的 12- 18 万元 / 月,下滑至现在的 7.5 万元 / 月,降幅约 50%。
若按照刻下机房 20% 的利用率来算,一个英伟达 H100 千卡集群智算中心每年营收仅 2300 万元(即 7.5 万元 / 月 ×12 个月 ×128 台奇迹器 ×20%),这意味着,即便算力中心强迫保管运营,所得收入基本只可隐敝一半的普通运营成本,前期插足的本钱压根无从回本。
说七说八,"万卡集群"已成为智能算力时期的迫切里程碑,象征着我国在东说念主工智能领域的算力成立迈上了新的台阶。从小米、中国挪动等科技巨头正积极布局万卡集群,以期在这场大模子竞赛中占据成心地位。但是,万卡集群的成立并非易事现金九游体育app平台,智算中心需要多万古分本领通过运营收入收回投资,行业也还需更多的探索。

- 现金九游体育app平台智算规模高达 6.7EFLOPS(FP16)-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-10)
- 九游体育app官网在 DriveOS 的基础上-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-10)
- 九游体育app(中国)官方网站接近百度、阿里、腾讯的总数(约 1000 亿元)-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-10)
- 现金九游体育app平台TCL捏续引颈Mini LED娇傲技巧-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-09)
- 九游体育娱乐网甘雨藏药握续聚焦灾地动态-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-09)

- Ninegame九游体育指挥关连单元加强安全监管-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-09)
- 九游体育娱乐网刻下融资余额1.96亿元-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-08)
- 九游体育app官网卖出金额0.00元;融券余额11.40万-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-08)
- 现金九游体育app平台占当日买入金额的26.86%-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-08)
- 九游体育娱乐网中国关联驻外使领馆已接到当事东说念主支属的乞助-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载 (2025-07-07)