本文作者:星海舰长

2025年7月14日,脱下皮衣穿起唐装的黄仁勋,在中国链博会上宣布了一个重磅消息:

美国政府已经批准了英伟达AI芯片H20的出口许可,很快就能向中国市场提供。

而几乎与此同时,AMD也宣布,将很快恢复向中国市场交付AI芯片MI308。

两个消息加起来,被很多人视为美国芯片行业对华政策集体“掉头”。

对于这件事,中国的舆论界迅速出现了两种完全对立的观点。

一部分人认为,中国通过不卑不亢的关税战和稀土管制,终于逼美国做出了让步,恢复了对华芯片供应,是中国芯片战的一次阶段性胜利。

另一部分人则认为,中国自主AI芯片刚刚有起色,H20解禁就是倾销,是企图摧毁中国尚在起步阶段的AI芯片行业,国家应该禁止进口H20这种阉割版芯片。

那么,H20的解禁到底是好事还是坏事?它到底是蜜糖还是毒药呢?

首先明确一点,这次H20的解禁,本身就是黄仁勋夹在中美之间,不断奔走游说的结果。

H20,最早可以追溯到2022年英伟达发布的旗舰版AI芯片——H100,因为采用了全新架构,所以比上一代A100提升了数倍的计算性能。

当然,这么好的芯片,美国是不会同意卖给中国的。

但问题在于,全世界除了中美,谁还会在AI产业上下那么多本钱?砸那么多真金白银去买芯片?

我们可以看一组数据,2022年,全球算力格局中,美国占36%,中国占31%,排在第三名的日本仅占6%。而中美之间的差距,其实比GDP还小。

也就是说,中国对AI芯片的需求量,其实仅次于美国。可偏偏美国禁止出口AI芯片给中国。

眼看着中国这么大的市场却吃不到嘴里,黄仁勋非常着急,最终在工程师团队的建议下,想了个变通的办法,在H100的基础上阉割了数据传输速率,将集群卡之间的互连速度从H100的900GB/s,限制在了400GB/s以内,造出了H800芯片。

也就是说,这款新品如果你只是单纯单机使用,那问题不大。

但如果是中国AI企业用H800集群进行千亿级参数模型训练时,那么训练效率就会大大下降。

黄仁勋就拿着这个H800,去找了美国商务部工业与安全局(BIS):你看,H800远远不如H100先进,中国人如果拿它训练大模型的话,只会事倍功半,耽误中国人的时间,所以出口中国是没问题的。

就这样,H800拿下了许可证。

虽然被阉割,不过H800仍然是当时中国能拿到的最好的AI芯片了,所以无论是腾讯还是阿里巴巴,都花了大价钱大量购买H800。可以说,正是H800搭建起了中国AI企业腾飞的硬件基础。

不过黄仁勋和BIS都没有想到,中国人面对集群算力限制,逐渐琢磨出了通过算法减少运算量的方案,使训练成本比美国同行低了10倍!从“大力出奇迹”,变成了“小力也能出奇迹”。

比如幻方量化旗下的DeepSeek-V3,就是用了“蒸馏技术”,只用了2048块H800显卡就训练出来了。

这样一来,光H800的性能,就足够中国AI再上一个新台阶了。

美国BIS发现这一点后,自然是不干的,很快就收紧了AI芯片管控政策。

2024年10月,BIS在最新管控文件中,正式提出了“性能密度”这一概念,每平方毫米性能密度达到370 GFLOPS,或者总算力达到300 TFLOPS,这两条只要符合一条,就不能出口。

而H800,恰恰就处在管控范围之内,没法再往中国卖了。

那怎么办?放弃中国市场吗?黄仁勋是不会甘心的。于是大刀一挥,再次阉割,推出了H20。

说起来,H20完全符合了BIS“性能密度”的要求,FP8算力仅为296TFLOPS,相较于H100的1979TFLOPS,已经不足后者的15%。

BIS一看英伟达合规了,二话不说,批准了出口许可。

但BIS很快就后悔了,因为英伟达耍了个心机:你只限制了我的总算力和性能密度,但没限制我的带宽啊!

虽然H20大幅度阉割了算力,但在内存和带宽方面,却来了一次“反向降级”。

比如H100的内存是80GB,而H20的内存却达到了96GB,H100的带宽是3.35TB/s,而H20的带宽则达到了4TB/s。

这种大内存、大带宽设计,可满足大规模矩阵运算、深度学习等计算密集型任务对数据吞吐量的需求,尤其在处理高维度数据时能减少延迟,提升整体运算效率。

同时,H20还支持NVLink互联进行多卡协同,适用于需要高并发推理的场景(如长文本生成),所以在大语言模型推理方面,没有比H100差太多。

说实话,H20如果单纯看算力,其实已经不如国产的昇腾910B了,但就是靠着自己的内存和带宽优势,再加上CUDA生态的支持,允许多张卡高效协同工作,所以对国产AI企业来说,想玩大模型,首选的方案仍然是H20,就算知道它是阉割的,大家也只能一边骂一边买。

但是呢?黄仁勋钻的这个空子很快又被BIS注意到了,今年4月份,BIS再次发布了新规,要求DRAM总带宽≥1400GB/s、I/O带宽≥1100GB/s,或两者总和≥1700GB/s的产品都受到管制。

这样一来,H20也没法卖了。一同受影响的,还有英特尔的Gaudi,以及AMD的MI308。

面对禁令,黄仁勋哭都哭不出来了。

为什么?

因为随着2025年年初deepseek的爆火,极大拉低了大模型的门槛,国内随便一个有点钱的企业都在砸钱搞大模型,导致黄仁勋对中国的需求非常乐观,在H20生产时,一下子下达了几十亿美元的H20排产计划!

结果到了4月,一纸禁令袭来,就算立即下令停产,相关的库存也有几十万块了。

要知道,H20作为中国特供版芯片,国外是没人要的,人家要买就买H100和H200了,谁去买阉割之后的H20?

那这部分库存H20咋办?只能堆着等落后,变成垃圾。

2024年,英伟达净利润才767 亿美元,怎么可能容忍几十亿美元的库存损失?

所以,本身是技术男出身的黄仁勋,也只能开始在中美之间飞来飞去,开始了他的公关行动。

不得不说,黄仁勋有着中国人式的智慧,知道要想快点解决问题,必须找一把手。

所以在4月份H20芯片禁令刚刚出台的时候,黄仁勋就花了100万美元,买下了和特朗普在马阿拉歌庄园共进晚餐的机会。

席间黄仁勋几乎什么都没吃,不停对特朗普进行反复游说,告诉特朗普如果美国完全禁止对华出口AI芯片,只会倒逼中国开发出不依赖美国技术的AI软硬件生态,到时候美国企业不仅会丢掉中国市场,还可能在国际上面临中国的激烈竞争。

而白宫人工智能和加密货币事务负责人、美国AI沙皇戴维·萨克斯,以及白宫的AI高级政策顾问斯里拉姆·克里希南,也按照黄仁勋提前商量好的口径,在旁边敲边鼓,终于说动了特朗普。

不过呢?席上特朗普并没有表态,熟悉特朗普的都知道,特朗普并不是一个能被轻易说服的人,如果真要说服也可以,得加钱。

不就是加钱嘛,对黄仁勋来说,根本不是个事。

4月14日,黄仁勋在白宫和特朗普共同宣布了一个消息,将在4年内在美国投资5000亿美元,联合台积电、富士康、纬创资通、安靠科技和硅精工业,将世界芯片制造中心从台湾转到美国,彻底改变芯片产业供应链。

不仅给领导送政绩,黄仁勋还特别懂给领导提供情绪价值,在发布会上黄仁勋还超计划地说:“坦白讲,没有总统的领导、他的政策支持,以及,非常重要的是——他的大力鼓励——美国制造业的发展速度不可能达到如今这样。”

而特朗普没有说话,只是笑的很开心。

搞定了特朗普,4月15日,黄仁勋又跑到众议院外交事务委员会去做公关。

毕竟,就算特朗普点头了也不行,因为监督对海外芯片销售是外交事务委员会的职权,如果不把他们搞定,就算特朗普解除了禁令,也会被国会通过法案要求停止执行。

经过一番舌战,黄仁勋用一嘴技术名词把这些议员侃得云山雾罩,最终答应了放行H20芯片。

除此之外,黄仁勋还做出承诺,未来将向支持特朗普的“超级政治行动委员会”捐款。

钱也给了,特朗普也答应了,国会也搞定了,按说应该解禁了吧?

还不是时候。

4月份,是中美关税战打得一塌糊涂的时候,以特朗普这么好面子的人,是不会主动轻易让步的,所以解禁H20不是不行,但要等时机。

很快,时机来了,6月5日,中美元首通电话;6月10日,中美代表团在伦敦会谈,达成了框架性协议。从近一个月以来的动作来看,都是在落实这个框架协议,中国放松了稀土管制,而美国也放松了EDA、航空发动机和乙烷的管制,中美关系大大缓和,时机总算成熟了。

7月10日,黄仁勋再次前往白宫,终于得到了特朗普关于解禁H20的承诺。然后黄仁勋带着这份承诺,在7月11日飞往中国,参加链博会。

然后,也就有了7月14日,黄仁勋官宣H20解禁的消息。

由此来看,黄仁勋才是美国对华芯片解禁第一说客,虽然中国没给他编制,但人家一直自带干粮来替干活。

当然,这不是黄仁勋对中国有好感,他的诉求很简单,赶紧把这一批坑爹的H20给卖出去,把库存垃圾变成真金白银。

但是问题来了,美国解禁H20,真的是个好事情吗?不会冲击到中国刚刚起步的AI芯片产业吗?

这个问题,我们需要深入探讨一下。

实事求是地讲,中国近年来AI芯片领域的进步很大,可以说用几年走完了英伟达30年的路。

用黄仁勋前几天在链博会上的话来说就是,“我们是全球绝大多数AI基础设施的提供者。这种垄断地位的建立,花了整整三十年。”“但华为才开始做了几年,他们已经在舞台上了。”“任何低估华为、低估中国制造能力的人,都是极其天真的。”

但问题在于,目前的中国AI芯片,尚且不能满足中国AI产业的需要。

首先,从技术上,中国还差世界先进水平2代。

以中国下半年即将发布的AI昇腾920芯片为例,这款芯片基于中芯国际 6nm工艺打造,算力达900 TFLOPS,同时内存将升级到HBM3,单卡提供4TB/s的带宽,而且还可以通过达芬奇架构3.0进行硬件加速和软件协同,算是国产AI芯片中,唯一能媲美H100的了。

2025年4月,经过测试,昇腾训练率达到了H100的105%,听起来的确可喜可贺。

但问题在于,H100,毕竟是2022年的芯片了。

而这三年时间,英伟达也一直没闲着,2023年英伟达推出了H100的升级版H200,随后又更新到了GB200,今年3月又量产了更强的GB300,一颗GB300的理论算力约为45颗H100,算力异常强大,专为下一代万亿参数级大模型而生。

相比中国刚刚搞到H100的水平,这是多么巨大的一个差距?

目前,中美在AI领域的竞争如火如荼,那么最核心的是什么?

时间。

AI领域和其他科研领域的“线性发展”不同,是具有爆发性,谁先爆发,谁就能拥有系统性壁垒,就会像滚雪球一样急剧扩大领先方的优势。领先者不仅研发更快,更能以更低的边际成本探索前沿方向。

这样一来,AI竞争,会呈现出一步慢,步步慢的情况。

当前,中国AI刚刚起步,虽然进展迅速,但当务之急并不是全部国产化,而是利用应用场景多的优势,先建立起一个独立的大模型应用市场,先把钱赚到手,再继续投入研发,这样才能不被美国的谷歌、OpenAI拉开代差。

否则,一旦中美形成代差,中国想追也追不上了。

今年年初,中国的deepseek刚刚把中美AI大模型的差距拉到了一代以内,非常不容易,那么,现在到底是停下来,等国产AI芯片成熟呢?还是先用进口芯片解决模型水平的问题,跟上美国的脚步,等国产芯片起来了再替换呢?

显然,后者更加符合当前的形势。

紧跟美国步伐、不被拉开代差、抢时间超车,这才是中国在现阶段的核心竞争策略,而不是纠结于芯片是不是国产。

这也就是为什么明知H20可能会冲击国产AI芯片产业的情况下,国家层面还是对解禁H20芯片乐观其成的原因。这一点,从黄仁勋访华得到了商务部长、副总理的接见,就已经很说明问题了。

其次,从生态上来看,中国AI产业大面积依赖英伟达的CUDA生态。

很多人不知道的是,英伟达最厉害的技术护城河,其实并不是芯片设计和制程,而是黄仁勋在20年前创造的CUDA生态。

CUDA是什么呢?

CUDA是一种控制程序,可以让普通程序员利用英伟达免费送的CUDA工具包进行开发,来实现最大限度发挥英伟达GPU的性能。

你可以简单把它理解为控制GPU的一种语言,是AI领域的“普通话”,GPU只能听懂这种“普通话”,所以几乎所有程序员,都要在这种“普通话”(CUDA生态)基础上进行编程。

发展到现在,几乎所有的AI模型,都是通过这种“普通话”开发出来的。离开了“普通话”,恐怕大部分程序员都不知道如何在GPU的硬件平台上进行开发。

那么问题来了,一旦让你摒弃英伟达的芯片,选择华为昇腾芯片,相当于你要在开发阶段就去学一种新“方言”,这可不是简单换一种语言的事情,而是从底层架构到核心代码的整体重塑,哪个企业愿意付出这么巨大的时间和金钱成本?

就算企业有钱,培养懂“新方言”的程序员,也是需要时间和成本的。

这就好比你是一个普通话主持人,已经用普通话主持了十几年了,现在突然把你调到粤语频道,你需要现学粤语,你会不会很痛苦?

看看微信适配鸿蒙有多难,花了多长时间,就知道换平台的难度了。

H20的优势就在于,哪怕它的算力其实并不如新推出的昇腾920,但因为它能讲“普通话”,就凭这一条,对于习惯于CUDA平台的国内AI大厂来说,也会优先选择H20的,因为可以节省巨大的时间成本。

而时间,又是中国AI企业最缺的。

这和爱不爱国没关系,纯粹是为了企业的生存考虑。

第三,就是产能了。

咱们假设,中国搞定了AI芯片的性能问题,也搞定了生态问题,那么就一定能解决中国AI企业的硬件需求问题吗?

对不起,也不能。

昇腾910B和昇腾910C都是7纳米制程,昇腾920是6纳米制程,这个制程从设计上来说算是非常先进了,但问题在于,怎么生产呢?

现在国内能勉强生产这个制程的,也就只有中芯国际,用DUV光刻机通过多次曝光的技术来生产。

但问题在于,DUV光刻机也被荷兰禁止出口了啊!就连中国已经进口的DUV光刻机,荷兰也不再提供维护和零配件更换了。

这就造成一个问题,昇腾系列芯片没法大批量供货。

2023年底,中国数据中心机架总规模突破810万架,按照一个机架能配备1块H20芯片来算(其实能配8块),中国也需要更新800万片AI芯片。

可2024年,中芯国际拼了老命,也才生产了40万片的昇腾910B,逼得嗷嗷待哺的国内AI厂商被迫花几十万的天价去购买H20,一买就是80万片。

2024年如此,2025年在高制程DUV光刻机没有增加的情况下,中芯国际产能又能提高多少呢?

从目前中国光刻机企业的进度来看,突破7nm节点,可能还要2-3年。这也就意味着,起码在2-3年内,中国AI芯片的产能问题无法解决。

所以就算国内AI企业愿意支持国产AI芯片,但也要先拿到货再说吧?

还是前面提到的问题,时间。

面对美国正在飞速进步的大模型和芯片,中国是一步也不敢停,所以该买的时候就要买,H20该用就要用,不管怎么样,先跟上再说。

这也是中国在当前局势下,明知H20会带来冲击,但仍然要做出的艰难决定。

当然,看清了中国当前面临的窘境,我们也没必要灰心丧气。

事实上,H20芯片解禁带来的冲击,可能也没有我们想象那么大。

H20芯片库存再多,无非也就是一个季度的产量,50万片顶天了,卖完就没了。

目前,黄仁勋说又给中国定制了一款芯片B30,虽然B30算力比H20再降20%,内存从高速HBM3更换成了低速GDDR7,但能不能拿到BIS的出口许可证,仍是个未知数。

而且,任何一家有远见的中国企业,在解决了当前应急需求之后,出于防风险考虑,也必然会考虑分散供应商来分摊风险。

别忘了,特朗普的任期还有三年半,以这位爷的奇葩风格,哪天一抽风再玩一把断供,国内AI企业不就傻眼了?

所以,下一步华为、沐曦科技、摩尔线程,以及百度的昆仑芯片等等,都会迎来采购机会。虽然这些芯片在初期肯定会出现这样那样的问题,比如生态啊,产能啊,稳定性啊等等。但是只要用上了,问题就会被发现,技术才会不断被改进,生态才会慢慢成熟,而企业也会得到资金,投入研发实现正向反馈。

不管怎么样,赚到钱,活下来,才是硬道理。

更何况,国家层面又不是不管,不会任由英伟达倾销的。

一方面,中国的政府机构、央国企已经全面开始安可工程,从硬件到软件实行全面的国产化替代。

那也就是说,像中国移动这些公司要采购AI芯片,就只能采购国产的了。还有一些地方政府,对采购国产AI芯片(主要是本地企业),也提供30%的补贴。

有订单,国产AI芯片才能活下来,活下来才能慢慢长大,用时间来蚕食英伟达的护城河,就算软件生态仍然是短板,在国家层面的统一规划下,也在进行不断优化和补齐。

事实上,这也正是国内AI公司正在做的事情,华为推出了CANN,已经有了替代CUDA一统中国市场的潜力了。

另一方面,别忘了,去年年底因英伟达公司涉嫌违反《反垄断法》及违反《英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》,中国对英伟达发起的反垄断调查,还没有结束呢。

如果形势需要,中国随时就可以做出裁决,掐住英伟达对华倾销的渠道,把国内市场让给国产AI芯片厂商。

所以现在回过头来看,H20这块小小的芯片,远远比它承载的晶体管还要复杂,它不仅仅是一个芯片,更是大国斗争、商业利益算计与技术竞赛复杂博弈的象征。

H20的解禁,可以解决中国短期内的算力焦虑,但同时也是中国自主发展AI产业决心的一次大考。

一方面,我们不能因为H20的解禁就觉得万事大吉,开始欢天喜地庆祝芯片战争的胜利,事实上,中国距离真正胜利,还有很远的征程。

另一方面,中国从来都是相信开放必将战胜封闭,对于利用全球一切可以使用的先进技术、产品和服务来发展自己,中国没有任何心理障碍,所以我们也没必要盲目自信,去“主动脱钩”,这无疑是愚蠢的行为。

所以,对于H20的解禁,我们大可以淡定一些,我们进口H20,并不意味着我们会放缓脚步。

毕竟,历经了8年中美博弈的我们早就意识到,真正的安全,永远来自技术的自主权。

H20就像一条鲶鱼,它的使命是刺激唤醒沙丁鱼群,快速地游动起来,仅此而已。

黎明将至,鱼群将活。

可是你啥时候听过,鲶鱼会成为主角的呢?

标签: none