编者按:在新一轮科技革命和产业变革浪潮中,人工智能在与5G通信、物联网以及云计算的协同下,成为引领智能时代、促进经济高质量发展的重要力量。同时,也引发了全球关于人工智能发展带来一系列问题与挑战的讨论。其中,如何化解人工智能的巨量能源消耗与能源转型发展之间的矛盾,成为一个不容忽视的重要议题。人工智能快速发展将对人类社会产生怎样的积极作用?是否会出现人们担忧的加剧失业、挤占全球发展资源等负面影响?人工智能发展需要巨量的能源支撑主要体现在哪些方面?全球新能源发展快速扩容,是否能够满足人工智能发展的需求?怎样才能更好地平衡与化解能源约束与人工智能发展的矛盾?如何强化人工智能发展与能源转型的国际合作?国务院发展研究中心发展战略和区域经济研究部副部长、研究员卓贤对此进行了深入分析。

问题一:ChatGPT的问世,推动人工智能发展进入“快车道”,这将对人类社会发展产生怎样的积极作用?是否会出现人们担忧的加剧失业或挤占全球发展资源等负面影响?
卓贤:以OpenAI推出ChatGPT为标志,人工智能进入快速发展的轨道。当前,生成式人工智能正实现着从文本世界、多媒体世界再到物理世界的技术三级跳。在逐步理解和处理文本、图像、声音、视频等多模态信息之后,人工智能还通过物联网和具身机器人连接物理设备,感知真实环境参数,实现智能决策和自主处理复杂指令。随着技术更新迭代,人工智能的应用场景也在不断拓宽。比如,人工智能有望打破生物医药的“双十困境”(即一款新药研发至少需要投入10亿美元和耗费10年研发周期)。再如,人工智能技术提高了发现和合成新无机化合物的速度和精确性,加快了新材料的问世。
人工智能并非天使,其快速发展也引发人们对其潜在负面影响的讨论。比如,机器换人带来失业和不平等加剧,技术垄断造成消费者福利和社会利益损害,没有与人类价值观“对齐”带来犯罪和恐怖主义风险等。技术中性论认为,技术本身无所谓善恶,技术所产生的影响取决于技术使用者。有鉴于此,一些科技界和企业界的个人或机构发布公开信,呼吁加强人工智能治理以避免出现对人类发展不可逆的风险。上述讨论已引发了诸多研究,我们主要从人工智能对发展要素尤其是电力能源的占用角度来看。
人工智能技术在台前展示的是比特世界的算力、算法、数据,但其“轻盈的灵魂”背后则是土地、能源、水等物理世界“沉重的肉身”。
算力的尽头是电力。据国际能源署数据,2022年美国共有约2700个数据中心,电力消耗占全国总量的4%左右,到2026年这一比例将达到6%。芯片设计公司Arm的首席执行官Rene Haas则表示,如果不提高芯片的效率,到2030年数据中心的耗电量可能高达美国电力需求的20%到25%。
此外,人工智能的快速发展还需要大量的水、土地、劳动力和资金要素的支持。比如,人工智能的耗水主要体现为冷却、发电用水、生产芯片用水等。
由于全球发展资源有限,当一项新技术突破带来新产业热潮时,虽然其在长期可能有利于人类福祉,但在初期会挤占其他领域的发展资源。当前,跨国公司成为全球要素和资源配置的重要主体,尽管科技向善在国际科技企业的社会责任报告中有所体现,但资本的配置导向并不全然是人类福利的最大化。由于目前人工智能产业的高利润,资本的力量推动各类资源向人工智能领域集聚形成热潮和泡沫,有可能影响对人类更有当期价值的其他产业的发展。
作为一项能加速人类发展进程的潜在通用目的技术,人工智能的发展在长期具有正外部性。但在近中期,人工智能发展的收益并不会均匀地分配给全球各国和各收入群体,受益者主要是互联网企业和风险投资者,而隐性成本的承担者主要是发展中国家和低收入群体。在全球发展仍然面临粮食安全、能源安全和水资源安全等问题时,这种负外部性尤为明显:根据联合国相关数据,当前全世界有24亿人无法持续获得食物,有6.75亿人无法用上电,23亿人无法获得清洁烹饪燃料和技术,四分之一人口面临“极高”的水资源短缺压力。

问题二:您刚刚提到人工智能的发展需要巨量的能源支撑,这主要体现在哪些方面?未来,随着人工智能的进一步发展,其对能源的需求将发生怎样的变化?
卓贤:提升能量密度的努力贯穿人类发展史。煤炭的广泛使用推动了蒸汽机和铁路的发展,极大地提高生产效率和运输能力,是工业化的加速器。石油为内燃机提供动力,推动汽车、飞机等交通工具的普及,加快了城市化和全球化进程。电网的出现让高密度能量跨越地理限制,促进生产在更广阔地域分布和集聚,是产业分工、产业内分工、产业链分工拾级而上的基础。每一次产业变革背后都有能源革命的驱动力量,并伴随着生产组织模式变革和社会体制变革。
人工智能发展产生大规模电力需求。据SemiAnalysis数据,2023年一季度以来,全球人工智能计算能力一直以50%-60%的季度环比增速快速提升。人工智能对电力的需求主要来自于数据中心。据国际能源署(IEA)数据,2023年全球数据中心消耗约460太瓦时的电量,相当于德国(484太瓦时)全年的全社会用电量。数据中心电力需求的主要来源是服务器、存储设备、通信设备等IT设备,以及照明、空调、冷却系统等配套设施。数据中心标准组织Uptime Institute的研究表明,2022年全球大型数据中心的平均能效比(PUE)约为1.55,即数据中心的IT设备每消耗1度电,其配套设施消耗0.55度电。
生成式人工智能的能耗分为训练和推理两个环节。每一轮训练任务持续数周至数月,而且相比普通数据处理具有更高的能耗强度。传统服务器的典型功耗约为1千瓦,但每台人工智能服务器的功耗现在已达数十千瓦。当前,人工智能还远未达到规模法则(Scaling Law)的顶峰,增加模型参数和训练数据量仍然是提升人工智能模型性能的主要路径。参数数量、数据规模和计算资源几何级数的上升,需要配之以更大规模的电力。斯坦福大学的一项研究显示,完成GPT-3训练的耗电量为128.7万度,而完成GPT-4训练的能耗是GPT-3的40倍以上,需要5177万至6232万度电。
未来人工智能推理阶段的用电总量比训练阶段高得多。不同于训练阶段,推理任务的需求和算力在地理分布上相对分散,单位时间的能耗强度低于训练阶段。但随着应用场景的快速扩张,未来推理阶段的用电量将大幅攀升。目前,人工智能的输入输出还主要是互联网的数字世界,尚处于信息智能阶段。当人工智能的触角借助各类传感器进入物理世界后,将进入物理智能阶段,所需要处理的数据量将出现跃升。根据市场调研机构Omdia估计,到2023年底,全球物联网设备安装量接近380亿台,每天产生约10亿GB的数据,这一规模可能还达不到全球物理设备的百万分之一。每一个生物体也是一个小宇宙,随着可穿戴设备和与之相关的智能健康行业的发展,未来生物智能阶段对生物信息的数据处理规模将提高到更高的量级,同时也意味着对电力需求的几何级数增长。
从动态来看,芯片技术创新和算法优化将不断提高人工智能在训练和推理时的用能效率,但这也将拓宽人工智能的应用场景并提升模型复杂度,推动算力需求的更快增长,不断增加总体用电压力。这一预判符合历史上屡屡出现的“杰文斯悖论”,即资源使用效率提高将刺激需求增长,最终提高总消耗量。
主权AI模式带来的重复训练和应用将进一步增加全球能耗。基于安全和效率的平衡,全球人工智能建设会保持一定的冗余。在联合国发布的《以人为本的人工智能治理》报告中,鼓励各国构建本土人工智能生态系统和适应本地需求的模型,促进人工智能初创企业在更多国家和地区进行测试和部署,以确保利益相关方和各国之间的资源平等获取和隐私数据保护。因此,各地区相应的基础设施建设、人工智能模型训练与推理会带来全球能源需求的额外增长。

问题三:如您所说,人工智能的发展需要巨量的能源支撑,而传统能源的储量是有限的,这将对人工智能发展产生怎样的影响?近年来,全球新能源发展快速扩容,是否能够满足人工智能发展的需求?
卓贤:传统化石能源储量无法支撑人工智能的后续发展。由于对自然资源矿产储量上限的评估不同,已有研究对地球上传统化石能源的可持续利用时间有较大的分歧,大致在50-150年之间。不过,已有的这些研究尚未将人工智能的普遍应用作为未来的分析情境。因此,仅依赖传统能源,人工智能可以成为社交媒体分享的流量,但无法成为改变世界发展的通用目的技术。
传统能源驱动的人工智能也不具排放意义上的可行性。从全球电力供给端看,碳排放强度较高的化石能源占比仍超过60%。在David Patterson等2021年发表的论文《碳排放和大型神经网络训练》中,根据人工智能数据中心所在地区电网的碳强度,估算出GPT-3训练产生588.9吨二氧化碳当量,相当于128辆乘用车年排放量,尚处于可接受范围。但后续更大模型将使得碳排放量指数级上升。GPT-4的模型参数约为1.8兆,并在13兆令牌(Tokens)上进行训练。而GPT-3的模型参数只有0.175兆,模型令牌规模在0.78-5兆之间。即将面世的GPT-5的参数规模或将达到数百兆,这意味着,如果数据中心供电结构不变,正在研发的GPT-5训练的碳排放可能接近十万量级的燃油车排放规模。
采用清洁能源驱动人工智能发展并非坦途。风电、光电等新能源具有间歇性、波动性和季节性,而人工智能则需要连续、稳定的电力供给。在现有技术条件下,两者之间的矛盾尚未有高性价比的能源解决方案可以调和。一些人工智能企业计划采用清洁能源自供电的方式,但目前还未能跨越储能技术成熟度和高成本的障碍,而试图采用核能技术的方案也不容易通过各国监管部门的审批。更为现实的方案,仍是依靠全国性或区域性电网为人工智能产业提供稳定电力。
全球电网吸纳新能源的扩容速度没有跟上人工智能发展步伐。在接入风光电等新能源过程中,电网局部承载能力、通道输送能力和系统调节能力均面临挑战,必须对输配电网进行大规模扩建和升级。根据IEA《电网与保障能源转型》报告,虽然可再生能源的年投资规模自2010年以来几乎翻了一番,但近十年来全球电网年投资额却仍保持在十年前的3000亿美元水平。2022年,全球至少有30亿千瓦的可再生能源发电项目正在排队等待并网,相当于当年光伏和风力发电新增装机容量的五倍。除了技术层面的原因,全球电网扩容还面临电力设备供应链紧张和资金投入增长缓慢等问题。
传统产业电气化的刚性需求与人工智能电力需求将产生竞争。2023年全球电力在最终能源消费中的份额仅是20%左右,传统产业电气化是全球减排的重要路径。为实现低碳转型目标,工业部门引导高碳排放行业实施电气化设备技术改造,交通部门推广电动化、燃料电池和新型电力基建,建筑部门运用电气设备解决日常用能需求。随着全球各产业部门电气化提速,预计到2030年电力在最终能源消费中的份额将接近30%。但过去十年全球发电量的年均增速维持在1.0-4.1%之间,很难同时支持传统产业电气化和人工智能电力需求的快速增长。
在用能竞争导致电价上涨的情况下,人工智能产业还会对一些国家的能源密集型产业和居民生活产生负面影响。2021-2022年间批发电价上涨之后,欧洲工业面临更高的能源成本,金属冶炼和化工等能源密集型产业的竞争力下降,出现了外迁的趋势。如果未来人工智能发展导致电力供需再度紧张,在电价上升的情况下,人工智能企业能以价高者得的优势保证业务运行,其他电价敏感行业的竞争力将受到削弱,居民用电成本也面临上升压力。

问题四:人工智能发展对能源的巨量需求,是否会挤占全球其它领域发展的能源需求?您认为,怎样才能更好地平衡与化解能源约束与人工智能发展的矛盾?
卓贤:在技术条件不变的假设下,人工智能短期内确实会挤占全球发展其他领域的能源需求。但通过技术创新解除既有条件束缚,一直是人类文明向前发展的主要路径。人工智能和能源约束之间的矛盾能否化解,取决于两场“竞赛”的结果。一方面,人工智能算力能效的提升速度能否超越应用场景的扩散速度,是破解上述“杰文斯悖论”的关键。另一条赛道则是能源转型的速度能否超越人工智能用电需求增长速度。如果不能在两场“竞赛”中至少取得一胜,人类就不得不在原子世界和比特世界之间作出两难取舍。
(一)人工智能的能耗强度赛道
芯片与服务器设计的优化。英伟达2024年发布的Blackwell系统可以训练比ChatGPT更大的模型,所用的电力大约是现有最佳处理器的四分之一。2023年Mohamad Hnayno的研究表明,采用高效率冷却系统有潜力将数据中心的电力需求减少10%,而液冷技术可减少20%。
需求响应的智能分散化。人工智能数据中心脱碳努力的另一条路线,是将人工智能训练等具有时空灵活性的工作任务转移至碳强度较低地区。同时,边缘计算和分布式人工智能处理方式,也能减少对长距离数据传输的能源消耗。
量子计算。量子计算具有高容量信息存储和高速并行化计算的特征,运算的能耗效率将远超经典的计算模式。当下量子计算的硬件技术路径还处于多路线试错中,超导、离子阱、光量子等方式各有优缺点,距实现大规模可容错通用量子计算还有较大距离。过去几年,量子计算公司与人工智能研究机构建立了众多合作关系,在资本的推动下,可纠错通用量子计算机的研制时间表可能会提前。
(二)能源转型的赛道
近中期看,储能技术是关键。储能是可再生能源跨时间配置的一种方式,是人工智能数据中心就近消纳新能源的基础设施,发展储能技术的重要性不亚于新能源产业本身。抽水蓄能技术比较成熟,适用于高海拔山脉和山谷地形地区大规模、集中式的能量储存和电网调峰,但也面临自然选址局限性、能量密度低等不足,存在规模天花板。推动氢储能等新型储能技术的多元化开发,提高储能的能量密度、充放电效率和响应速度,是将新能源潜力释放到人工智能产业上的关键。
中长期看,人工智能在新能源供需预测、电网运行和优化、能源需求管理以及新能源技术研发等领域将发挥重要作用。
人工智能加速电网智能化。在发电侧,人工智能通过学习历史气象数据、传感器数据、卫星云图等图像和视频数据,提升太阳能和风能设备发电量预测准确度。在电网侧,人工智能有助于提升输电和配电能力,优化电网设计和规划,协助维护人员保障电网安全稳定运行,如基于无人机拍摄的视频识别异常设备。在用电侧,人工智能可以帮助用户在电池供电、实地太阳能发电和电网供电之间择优进行切换,智能管理分布式可再生能源及相关设备。
人工智能推动可控核聚变技术研发。目前核能提供了全球约10%的电力供应,但人工智能行业目前关注的不是已成熟的核裂变技术,而是寄望于可控核聚变技术。可控核聚变的原料来源更丰富,能量密度是核裂变的4倍,且产生的放射性废物更少。当前,人工智能技术正推动可控核聚变技术研发加速。例如,2024年普林斯顿团队通过训练神经网络,提前300毫秒预测了核聚变中的等离子不稳定态。