1月9日消息,2017年,中国公布了《新一代人工智能发展规划》,目标是在2030年成为全球人工智能创新中心和领导者。规划要求,到2020年在人工智能领域取得“标志性进展”,以展示其发展成果。然而,2022年底,OpenAI推出的ChatGPT横空出世,不仅震惊全球,也让中国措手不及。
彼时,中国科技企业正经历严厉的监管风暴,导致科技行业损失约1万亿美元。直到近一年后,部分人工智能聊天机器人才获准公开发布。而就在ChatGPT问世的一个月前,拜登政府出台了出口管制措施,限制中国获取训练大规模人工智能模型所需的尖端芯片。这些因素使中国在2030年实现人工智能领先的目标显得更加困难。
但到今天,中国发布的一系列人工智能产品显示出其快速进步,与美国的差距显著缩小。2024年11月,阿里巴巴和中国人工智能开发商DeepSeek分别发布了推理模型,在某些测试中表现接近OpenAI的o1预览版。同月,腾讯发布了混元大模型新版本,这款开源模型在多项基准测试中超过了美国顶级开源模型的表现。而在2024年底,DeepSeek发布的DeepSeek-v3更是在知名在线排行榜上占据开源领域榜首,甚至与OpenAI和Anthropic的顶级闭源系统展开竞争。
这一趋势引起了关注。2024年5月,谷歌前CEO埃里克·施密特(Eric Schmidt)曾表示,美国在人工智能领域领先两到三年,“在我看来,这已经是一个非常长的时间了。”但到了11月,他在哈佛大学的一次演讲中改口,称中国的技术进展——尤其是阿里巴巴和腾讯的成果——正在迅速缩小差距。“这让我震惊,我原以为芯片限制会遏制他们的进步。”
人工智能领域的竞争不仅关乎国家声誉,更深刻影响全球力量平衡。智能代理(或称智能体)的广泛应用可能推动经济增长,而未来能够指挥武器或实施网络攻击的智能系统将为国家带来决定性的军事优势。当许多国家不得不在中美人工智能系统之间做出选择时,人工智能将成为一种强大的全球影响力工具。中国的快速崛起令人质疑,美国的半导体出口管制是否足以维持其优势地位?
构建更强大的人工智能系统离不开三个核心要素:数据、创新算法和算力。类似GPT-4的大语言模型,其训练数据通常来源于互联网,这使全球开发者都能轻松获取。同样,算法作为改进人工智能系统的创新思路,也因学术论文的广泛传播而跨越国界。即便缺少学术交流,中国仍凭借其丰富的人才储备,培养出比美国更多的顶尖人工智能研究人员。然而,与数据和算法不同,先进芯片作为实体产品,其流通可以受到边境限制。
先进半导体供应链主要由美国及其盟友控制。在这一领域,美国的英伟达和AMD几乎垄断了AI数据中心使用的GPU市场。其芯片设计复杂至极,目前只有台积电能够制造这些尖端芯片。而台积电则依赖荷兰阿斯麦(ASML)公司提供的昂贵制造设备。
为了保持竞争优势,美国实施了一系列限制措施。2022年,拜登政府推出出口管制,禁止向中国出售最先进芯片。这一政策延续了特朗普政府时期的相关举措,旨在遏制中国获取芯片制造技术。这些措施不仅限制了先进芯片进入中国市场,也抑制了中国本土芯片产业的发展。美国商务部长吉娜·雷蒙多(Gina Raimondo)曾在去年4月的一次采访中表示,中国在芯片领域“已落后多年”。
然而,出口管制的效果并非无懈可击。在限制生效之前,部分中国开发者已预见到即将出台的政策,提前大量囤积即将受限的芯片。例如, DeepSeek在美国出口管制实施前一年,组建了一个由1万个英伟达A100 GPU组成的计算集群,并开发了人工智能推理模型R1。
除此之外,其他规避措施也削弱了出口管制的效果。有报道称,中国企业通过境外空壳公司购入受限芯片,还有一些公司选择向离岸云服务提供商租用GPU资源。去年12月,有媒体报道称,美国正计划出台新的限制措施,以阻止中国通过第三国获取芯片的途径。
尽管美国的出口管制措施限制了中国获取最先进的半导体,但仍允许销售性能较弱的芯片。然而,确定哪些芯片可以销售、哪些应被禁止,一直是一个复杂的挑战。2022年,英伟达调整了其旗舰芯片的设计,为中国市场推出了一个符合管制要求的版本。尽管性能有所降低,该芯片在AI开发领域依然具备实用价值,这促使美国在2023年10月进一步收紧限制。
兰德技术与安全政策中心的人工智能与计算主管伦纳特·海姆(Lennart Heim)表示:“过去一年,中国能够购买性能几乎同等的芯片。”他认为,这一漏洞,加上新芯片融入开发商基础设施所需的时间,是目前尚未看到出口管制对中国AI发展全面影响的主要原因。
当前管制门槛是否合理,仍有待观察。2024年11月,腾讯发布了“混元大模型”,其在多个性能基准测试中表现优异,甚至超越了Meta最强大的Llama 3.1模型。尽管伯克利风险与安全实验室的研究显示,基准测试并非衡量AI智能的完美指标,但混元大模型的表现依然令人印象深刻,尤其是它使用的是性能较弱、不受管制的英伟达H20 GPU进行训练。
该研究报告的作者里特维克·古普塔(Ritwik Gupta)同时也是美国国防部国防创新部门的顾问,他表示: “通过软件优化,中国开发商显然更高效地利用了硬件资源。”此外,DeepSeek开发的DeepSeek-v3模型也在开源领域表现出色,而其训练所需的计算能力却低得出乎意料。
尽管候任总统特朗普在人工智能政策上的具体方向尚不明朗,多位专家在2024年11月表示,预计出口管制将继续执行,甚至可能进一步扩大范围。在2024年12月美国出台新一轮限制措施前夕,中国企业再次大规模囤积即将受限的芯片。
对此,古普塔评论道:“整个战略需要重新思考。我们不能再继续这种针对硬件芯片的‘打地鼠’式应对。”他建议,美国应将关注点从限制芯片使用转向防止军用AI系统的崛起,因为这类系统对计算能力的需求通常较低。同时,他也承认,美国对芯片供应链其他关键环节的限制(如对ASML芯片制造设备出口的管控)在遏制中国国内芯片产业发展方面发挥了重要作用。
海姆补充说,在过去一年,美国在AI领域的领先优势确实有所缩小。他指出,中国目前可能已经能够开发出媲美美国顶尖开源模型的产品,但这些模型仍比美国最强闭源模型落后约一年。他进一步强调,这并不意味着出口管制的失败。“我们应该摒弃出口管制要么有效、要么无效的二元思维,”他说,“中国可能需要更长时间才能真正感受到出口管制的深远影响。”
过去十年间,用于训练人工智能模型的计算能力增长迅猛,令人瞩目。以OpenAI为例,该公司在2023年发布的GPT-4据估计使用的计算量是2019年发布的GPT-2的约1万倍。有迹象表明,这一增长趋势仍将持续。美国公司如X和亚马逊正在建造配备数十万颗GPU的超大型超级计算机,其计算能力远超当前领先的人工智能模型所需的水平。
基于这一趋势,海姆预测,美国的芯片出口管制将对中国人工智能的发展能力构成重大限制。他指出:“出口管制主要影响的是数量,即便部分受限芯片最终流入中国开发者手中,由于数量受到压缩,这将大大增加训练和部署大规模模型的难度。”他进一步补充道,“只要计算能力仍然是关键,随着时间推移,出口管制的影响可能会更加深远。”
卡内基国际和平基金会技术与国际事务项目访问学者斯科特·辛格(Scott Singer)则表示,目前华盛顿在是否应与中国展开人工智能谈判的问题上态度犹豫。他分析道:“隐含的逻辑是,如果美国已处于领先地位,为何还要与中国分享任何成果?”
然而,辛格强调,与中国就人工智能展开对话具有重要意义。他指出:“即便中国在计算能力上受限,但其持续的技术进步仍可能使其在未来开发出具有潜在危险能力的人工智能系统。”他警告道,“当中国的模型水平显著接近美国时,美国需要考虑如何与中国进行对话,以确保双方的人工智能系统能够保持安全。”