发布日期:2026-05-03 00:26 点击次数:55


「中枢提醒」
国产算力迎来“DeepSeek+LongCat”节点。
作家 | 张经纬
Token,是改日数字世界最中枢、最值钱的巨额商品。
2026年GTC大会上,黄仁勋这么界说AI期间的底层通货,而数据中心等于分娩智能的工场。
畴前几年,寰球绝大多数这么的“工场”齐依赖吞并套拓荒:英伟达的GPU与CUDA生态。当霍尔木兹海峡的绽开与关闭,影响地缘政事与动力安全款式,寰球AI市集的Token供给也需要通告:算力供应链出现单点依赖,若何保险Token的巩固产出?
4月24日上昼,DeepSeek V4认真发布,其官方期间陈施展确将华为昇腾950PR写入硬件考据清单,已矣了从英伟达CUDA到国产算力的全栈迁徙。下昼,好意思团LongCat-2.0-Preview绽开测试,这是现在独一公开阐述由国产算力完成万亿参数预教师的大模子,教师全程动用了5万至6万张国产算力卡,其教师范围是迄今为止最大的。
两款模子在吞并天跨入“万亿参数俱乐部”,更枢纽的是,这意味着一条自主的“国产Token”供应链,正在英伟达体系除外加快接通。
调治这一天意味着什么,需要隔断来看。
1、万亿参数俱乐部的新玩家
畴前一段时期里,万亿参数如同大模子的“珠峰”。玩家们想登顶,需要刷好意思国期间栈的“装备”,尤其离不开英伟达。
Open AI、Anthropic等硅谷独角兽,无不是英伟达H100/A100集群上的“付费玩家”。凭借软硬一体的CUDA生态系统,英伟达在寰球AI教师负载市集会占据了90%以上的全齐阁下地位。
对中国AI企业而言,这有诸多不细目性。频年来,好意思国对华高端AI芯片的出口管制捏续收紧,从领先的A100、H100禁售,蔓延至特供版H20的许可磨灭,到本年4月,好意思国高端芯片本色对华禁售。即便通过其他渠谈拿到芯片,也随时濒临升级旅途被堵截的风险。
至此,算力不再只是支拨成本,亦然生活成本。
2026年4月24日,备受关怀的DeepSeek V4发布,同日好意思团LongCat-2.0-Preview启动绽开测试,双双加入了“万亿参数模子”的行列。这两个大模子用不同神志,已矣了国产算力替代的发达。
DeepSeek V4的早期教师基于英伟达CUDA架构和GPU硬件,之后全栈迁徙至华为芯片。V4适配的华为昇腾950PR推理芯片,致使在低精度推理中展现出杰出通用GPU的后果。
同期进行测试的LongCat-2.0-Preview选拔了另一种神志,这是现在独一由国产算力教师的万亿参数大模子。其教师与推理全程依托国产算力集群独处完成,动用的国产算力卡数目在5万至6万张之间,是国产算力上完成的范围最大的教师任务。
从期间层面来看,DeepSeek V4和LongCat-2.0-Preview均选定MoE架构,支捏1M(100万token)超长凹凸文窗口,单次推理可治理数百万字输入,治理量级与GPT-5.5处于吞并水平。两款模子在学问容量、长文本调治及复杂逻辑推理的上限上,已认真跨入寰球第一梯队。
莫得选定行业通行的“堆算力”道路,DeepSeek V4和LongCat-2.0-Preview齐是通过架构优化,对每一张国产卡算力进行极致榨取,同期它们也用践诺施展注解,极致优化算力后果,可以对消硬件的账面差距。
V4通过混杂防备力架构(CSA + HCA)、Muon优化器等底层架构创新,在凹凸文长度放大8倍的前提下,算力浪掷比V3.2裁减七成以上。LongCat-2.0-Preview每token激活参数约48B,从一些测试响应来看,在保捏较高性能的同期,已矣了可以的推理后果。
后果创新最终转变为颠覆性的买卖订价。DeepSeek V4最新的API订价,V4 Flash每百万tokens输入(缓存射中)价钱为0.02元,V4 Pro为0.025元。国外酬酢媒体上,有网友暗意,这是从Claude大意GPT迁徙到DeepSeek的最好窗口期。
两款模子的发布,激勉了国产算力适配的四百四病,国产算力替代逐渐成为趋势。
从华为昇腾、百度昆仑芯、寒武追念念元、海光信息DCU到阿里平头哥,国产AI芯片在性能与生态上捏续迭代;摩尔线程、壁仞科技、沐曦股份等创业企业也在加快追逐。
TrendForce揣测,2026年国产芯片在高端市集的份额将增长到70%,行业对国产算力的期待,不再停留在“可用”层面。
2、算力解围前后
中国AI厂商们加快布局国产替代,除了此前说到的好意思国高端芯片出口管制等政策压力,还有一个重要的考量:算力荒传导至价钱端,导致算力变得越来越贵。
中信证券指出,白金会手机版app下载Token调用量井喷带来的是算力需求极大爆发,与此同期供给侧受到各类硬料理短期边缘增量有限,现在国表里均出现了严重的算力荒。
而中国AI用户的算力浪掷极其巨大,把柄OpenRouter的数据, 2026年3月30日-4月5日,中国AI模子的周调用量冲破12.96万亿Token,是同期好意思国的4.3倍。如斯弘大的需求, 要是永久高度依赖单一的“英伟达+台积电”供应链,将濒临供应受限与价钱捏续上升的双重风险。
这种结构性矛盾,使得国产算力替代不再只是 “备选题”,而是 “必答题”。关系词,替代之路向来重荷。
其难点在于铲除现成的代码库、编译和调试用具,从“零”运转。英伟达CUDA经过20年蕴蓄,领有超400万开发者和锻练的cuBLAS、cuDNN、NCCL库。国产算力平台的算子库障翳度、优化深度以及测试用具齐不圆善,需要工程团队进行无数底层开发与调试使命。
另一个难点在于硬件的并行计较。由于单卡性能存在差距,国产芯片想要已矣相同的计较性能,例必要并行更多硬件,而算力硬件并行容易带来故障。
在大模子教师中,集群范围一朝扩大至万卡级别,故障概率呈指数级上升,任何微弱的计较失误、通讯延迟或数值精度偏差,齐会在并走运算中指数级放大,导致统统教师任务中断或模子料理失败。
LongCat-2.0-Preview在5、6万张国产集群上完成万亿参数MoE模子的巩固教师,意味着团队必须在并行策略、通讯拓扑、混杂精度教师及容错机制上进行深度自研与调优。这是对国产算力系统工程才气的一次高强度的压力测试。
工程才气还只是冰山一角,芯片设想制造、软件栈乃至诓骗,需要更多产业力量的永久过问。来自互联网巨头、产业成本与风险投资的资金,成为这些永久进化背后的重要撑捏。
以好意思团为例,近几年在算力、科技硬件和大模子等鸿沟进行了凡俗的早期投资。芯片方面,好意思团投资了摩尔线程、沐曦股份、紫光展锐、爱芯元智、荣芯半导体等稠密企业,障翳了多家国产GPU头部和“国度队”级别的半导体公司。
这些企业的期间认识各有侧重:摩尔线程与沐曦股份聚焦通用GPU设想;紫光展锐在移动通讯与物联网芯片鸿沟根基深厚,为端侧AI提供底层畅达才气;爱芯元智专注边缘算力、AI视觉芯片;荣芯半导体则涉足晶圆代工,藏身于芯片的产能擢升。
好意思团还同期投资了包括宇树科技、星河通用、星海图在内的多产物身智能公司和科技硬件公司。从大模子上游的芯片设想制造、到大模子研发,再到AI在各个鸿沟的诓骗,用王兴的话来说,好意思团将AI视为计谋机遇。
好意思团的密集投资并非孤例,它所折射的,是中国科技成本对国产算力赛谈乃至改日科技发展的系统性布局。
3、模子在国产算力上跑通了,然后呢?
当国产芯片铺开、万亿参数模子跑通,原土AI能否走向“更好用”阶段,濒临着数据层面的挑战。
一方面,是工程响应数据。
当超大范围AI模子在国产芯片集群上教师时,会暴清晰各式问题,比如某些计较局势精度有症结、芯片之间数据传输太慢、软件编译优化不到位、多卡并行时通讯通谈拥挤、低精度计较时数值丢失等。
期间团队逐个攻克这些问题的流程,本人等于一场对国产芯片软硬件的大范围测试。每一个被设置的bug、每一段被调优的通讯左券,齐会响应给国产芯片厂商,鼓吹下一代硬件的更正和软件栈的锻练。
对LongCat-2.0-Preview这么的“原生国产模子”来说,从教师阶段起便全程依托国产算力集群完成,产生的工程响应较为圆善和真确。这种“模子反哺芯片”的闭环,故意于国产算力生态向下扎根。
另一方面,大模子需要物理底座,和具体任务、真确世界产生高质地的数据互动。
特斯拉凭借寰球最大的真确驾驶数据库,构建了其自动驾驶的中枢基石,从真确世界相聚、到仿真教师、再到算法迭代的“Real-to-Sim-to-Real”飞轮,同期驱动了自动驾驶汽车与东谈主形机器东谈主的进化。
相同的逻辑,正在一个更复杂高频,逼近普通生活的场景伸开,那不是加州的高速公路,而是中国城市的大街弄堂。好意思团领有世界2800多个市县的即时配送相聚,障翳中国最复杂的物理环境。好意思团无东谈主机已累计完成买卖订单超78万笔,国表里灵通70条航路。好意思团无东谈主车已至少已完成550万单配送任务,自动驾驶总里程冲破1900万公里。
无东谈主机在楼宇间穿行时的视觉避障数据、无东谈主车在复杂路况下的及时有缠绵轨迹、骑手与机器协同颐养中的动态优化样本,齐是高价值、高密度的真确世界数据。这些是LongCat大模子捏续进化的养料,亦然国产算力芯片在严苛环境中考据可靠性、能效比的真确环境。
吞并天里先后发布和绽开测试的DeepSeek V4与LongCat-2.0-Preview,组成了国产算力进化的一体两面。前者以开源、廉价与通用才气,施展注解了国产算力可撑捏寰球顶尖的基础模子;后者以原生国产教师、万亿参数范围与物理世界闭环,施展注解了国产算力集群可独处完成极限的工程任务。
这不单是是算力焦急下的替代叙事,更是一场 “主动界说”的回身,独处滋长、正向轮回的中国AI产业链,还需要永久起劲白金会(PlatinumGaming)官方网站,但正在加快成型。
杏彩(XingCai)官网平台