25年华东电子峰会5 广告 第二十八届中国电源学会学术年会 广告

能耗问题成为人工智能(AI )发展的瓶颈

2025-09-22 16:56:46 来源:编译:深圳市连接器行业协会 李亦平 作者:Brian Bailey

人工智能是否使用了太多能量?有些人认为是这样,并且相信在降低功耗方面已经有收获。

当前业界对人工智能能耗问题的关注与日俱增,但这个问题并没有简单的解决方案。要解决它,需要从半导体和系统层面深入理解应用需求、软硬件架构设计及其具体实现方式。人工智能应用每个环节都会影响整体能耗和使用效率,这正是必须做出的终极权衡。

但首先要解决的是人工智能技术实用性问题。电力是否被浪费了?现为Synopsys(新思科技)旗下Ansys公司的产品营销总监Marc Swinnen(马克·斯温宁)表示:“我们正在用电力做有价值的事情,这不是浪费。这是电力的工业应用,就像钢铁和铜冶炼一样。”

在很多情况下,这种人工智能技术优势还能带来显著的节能效果。Microchip公司高级产品营销经理Diptesh Nandi(迪普特什·南迪)表示:“农民用人工智能操控自动驾驶拖拉机进行耕作,在喷洒农药和化肥时也运用AI进行智能判断。这不仅节省了时间,还减少了化学品使用量。毕竟这些化学品需要消耗电力,采用人工智能技术就能节约能源。我们注意到,特别是在农业领域,AI驱动的边缘设备正迎来爆发式增长。”

在今年的设计自动化大会上,多位学者声称功耗优化的改进已基本完成。“我并不认同这种说法,”Synopsys科技系统设计集团战略项目与系统解决方案执行总监 Frank Schirrmeister(弗兰克·席尔迈斯特)表示,“我们离人工智能技术全面优化还差得远呢。更何况应用需求增长如此迅猛,要跟上人工智能应用功耗优化的步伐简直难如登天。真正的问题在于:如何实现人工智能应用最低功耗方案?网络计算架构的影响、芯片分区策略的考量、针对人工智能工作负载的架构设计,以及对人工智能技术性能提升的追求,这本质上都是功耗优化的权衡取舍。”

有人将计算机的能耗与自然界的能量进行对比。“以鹦鹉为例,它们的大脑仅需20瓦电力就能完成飞行,”Cadence计算解决方案集团产品营销总监Jason Lawley(杰森·劳利)表示,“人工智能不仅能模仿语言,还能对环境进行复杂视觉分析、计算三维空间数据,甚至在树间自如穿梭。从这个角度看,人工智能技术的发展潜力可谓无穷无尽。关键在于我们何时能迎头赶上。我认为人工智能不会永远沿着现有路径发展,神经形态计算等新兴技术必将持续推动人类进步。”

许多头条新闻关注的数据中心训练问题,但从长远来看,这可能并非正确焦点。“传统上,训练始终主导着我们的计算需求,面对海量数据集和延长的周期,”Normal Computing公司高级AI工程师Doyun Kim(金多云)表示,“如今我们正见证根本性转变。测试时计算技术让模型能够执行多步骤推理链式思维、树状思维及代理工作流,每次查询可触发数十次推理操作,此时人工智能应用功耗已与训练强度不相上下。对芯片设计者和数据中心运营商而言,这标志着人工智能技术重大转型。推理运算正成为首要功耗考量因素。但如何应对这种功耗挑战?”

这可能迫使设计团队在人工智能应用功耗方面更加节俭。Cadence公司 Lawley说:“边缘AI的能耗会增加,但更多采用电池供电,它将更深入地融入我们的日常生活。相对而言,我们能注入电池的能量与数据中心本身的能耗相比微不足道,用户会要求更长的续航时间。”

现任职于Synopsys的Ansys公司总监Rich Goldman指出:“如果我们承认人工智能技术确实能创造价值,不妨换个角度思考。现有电网系统并非为人工智能设计,根本无法应对这种需求,要升级基础设施既耗时又烧钱。与其费力把能源从生产地运到需求地,不如直接在本地发电。未来将是小型核反应堆主导的时代。”

Ansys公司技术总监Swinnen补充道:“除了传统碳基能源,还有其它绿色能源的发电方式。数据中心的优势在于能部署在任何有电力供应的地方。以撒哈拉沙漠为例,那里不仅土地广阔、阳光充足,还能建设太阳能发电场。人工智能技术的魅力在于只需铺设光纤线路,就能实现数据的无缝传输,根本不需要大动干戈建设基础设施,既不需要港口也不需要道路。”

虽然这解决了数据中心的问题,但边缘计算同样需要重视。Normal Computing公司高级AI工程师Maxim Khomiakov表示:“在设备端运行大模型时,人工智能执行仍是一个极其耗能的过程,高效引导人工智能模型输出是个重大挑战。简单粗暴的人工智能应用解决方案能耗极高。已知人工智能技术之一是生成大量输出轨迹并同步筛选有效结果,优化提示词与答案。长远来看,发展方向是构建专为人工智能大模型和推理密集型工作负载优化的专用集成电路芯片。人工智能技术推理需求正呈指数级增长,这已赶上训练成本的增长速度。”

边缘计算的自主性正在不断提升。“使用边缘AI的客户最核心的需求就是降低延迟,”Microchip的Nandi表示,“将人工智能应用数据传输到数据中心再返回结果,既耗时又费电。人工智能应用解决方案之一是在边缘端完成部分计算后再传回云端。比如在高速公路上监控车牌时,75%的工作量是定位车牌位置并沿路追踪。一旦锁定目标位置,再将人工智能应用数据回传云端进行字符识别处理。”

模型创新

大型语言模型的规模持续扩大。“这些庞然大物的迭代速度仍在加快,直接推高了训练成本,”Lawley分析道,“虽然很难预测它们何时会陷入收益递减期,但目前看来还远未达到临界点。通过持续注入更多数据,人工智能模型性能不断提升。它们不仅采用不同的优化技术来打磨初始数据集,还通过二次训练等多样化方式来完善这些大型语言模型。”

当前的目标似乎是打造更大、更统一的模型。Synopsys的Schirrmeister说:“首先要优化的是人工智能模型本身,通过让人工智能模型更贴合具体需求,能获得显著提升。通过让人工智能模型更专注于特定应用,就能更好地约束其性能。运行在这些人工智能模型上的应用程序,那些消耗大量能源的系统,将变得更加优化,逐渐摆脱通用化设计的束缚。”

这或许能为人工智能技术发展开辟新路径。Normal公司的Kim表示:“就像硅产业通过引入多电压域、时钟门控和电源门控来节省能耗,我们也可以将类似理念应用到人工智能系统中。就像混合专业(MoE)架构避免同时运行完整人工智能模型那样,我们可以让人工智能系统更加模块化。通过实时预测所需人工智能模块并动态激活必要组件,类似于工作负载预测机制,借助智能系统级电源管理,我们有望实现显著的节能效果。”

某些优化需要协同设计。Expedera软件工程总监Prem Theivendran(普雷姆·泰文德兰)说:“软件堆栈中存在诸多改进机会,例如算子融合、布局转换和编译器感知调度等,这些人工智能技术能释放硬件的潜在效能,但前提是硬件必须开放相关接口。这就要求硬件能力与软件优化之间保持紧密协作。当模型、编译器和硬件实现协同人工智能技术优化时,即便在已高效运行的加速器上,也能获得显著提升。”

边缘计算领域正迎来更多发展机遇。Lawley认为:“量化技术是需要精准把握的关键要素之一。当前业界主要聚焦两大方向:其一是人工智能向更小规模演进。虽然目前多数厂商采用Int8架构,但Int4乃至Int1架构也逐渐进入视野。Int1架构能实现存储空间压缩、带宽缩减和运算量降低,这三大核心领域正是能耗的主要来源。我们观察到混合量化模式的研究热度持续升温,某些层级采用FP16架构(因其性能优势),其它层级则使用Int4架构。值得注意的是,业界正从整数运算回归浮点运算,甚至开始尝试FP16和FP8架构。研究发现,对于8位或16位的非线性运算模型,采用浮点表示能获得更优性能表现。这种浮点表示方式具备更高的精度控制能力。”

设计更好的硬件

目前主要有两种方法:第一种是设计更适合执行人工智能工作的架构,第二种则是提升现有架构的运行效率。Fraunhofer IIS自适应系统工程部经理Benjamin Prautsch(杰明·普劳奇)表示:“工程设计本质上是抽象化的过程,从这个角度看就是权衡取舍,因为设计层级中永远无法实现全面优化。我们试图通过尽可能多的抽象化来缩短时间、创造更大价值。但这种做法会牺牲局部性能,至少在特定用途上如此。我们永远无法找到完美方案,但人工智能优化始终是目标,这需要从顶层到底层的整个价值链进行整体优化。我们既需要全局视角,也需要能针对具体问题进行优化的工具。最大的挑战在于人工智能技术更新换代速度过快,这与制造业的时间线存在明显冲突。”

Cadence数字与信号处理事业部产品管理总监Jeff Roane(杰夫·罗恩)说:“在芯片设计的每个环节,功耗都可能被有效控制,但也存在浪费风险。虽然降低功耗看似简单,只需将P=fCv²中的参数最小化,但实际操作中却因功耗、性能与面积(PPA)之间的必要权衡而变得复杂。在AI芯片的数学运算功能中,由于难以测量和优化的额外功耗问题,这些复杂因素会成倍增加。因此,必须通过精准分析驱动,在每个设计虚拟层级实施有效优化:架构级优化可实现最高50%的能耗降低,工艺级优化可达20%,而从门电路到物理制造的优化则能提升10%。”

在每个设计阶段,准确把握工作负载都至关重要。“功耗主要由动态功耗主导,而动态功耗与数据向量密切相关,”Synopsys 研究员Godwin Maben(戈德温·马本)指出,“人工智能专用工作负载已明确界定,因此生成工作负载并非难题。功耗主要源于计算单元与存储器之间的数据传输。采用低功耗总线架构至关重要,就连压缩内存数据输入输出这类架构决策也举足轻重。功耗优化具有可扩展性,由于同一计算单元会被重复调用数千次,优化单个单元就能显著降低整体能耗。”

在所有讨论中,数据传输始终是能耗问题的首要考量。“人工智能工作负载涉及计算单元、内存和加速器之间的海量数据传输,”Arteris产品管理与营销副总裁 Andy Nightingale(安迪·奈特宁格尔)表示,“要降低单次运算能耗,必须采用局部化通信方案。相较于长距离传输,分块处理或空间聚类技术更具优势。我们预见未来,精妙的互连设计将成为系统级芯片(SoC )架构师突破人工智能应用能耗曲线的关键杠杆。”

处理器的其它部分对工作负载的依赖性较低。Lawley指出:“纵观历史,矩阵乘法始终是人工智能领域中唯一恒定不变的核心模块,这个核心功能从未改变。量化技术、激活函数、带宽配置以及各层架构设计都经历了变革。但矩阵乘法的核心功能始终如一。我们确保拥有极其稳健的矩阵乘法解决方案,同时在激活函数等具体实现层面,提供了更高的可编程性。”

关于架构重大变革的研究仍在持续推进。Schirrmeister表示:“内存计算的讨论远未结束。这种技术能显著提升性能和能效,无需跨边界传输数据,也不必移动计算所需的物理介质。这些潜力尚未被充分挖掘。其他研究者正认真探索神经形态计算。我认为von Neumann(冯·诺依曼)架构并非不可替代,只是现有人工智能技术体系已形成深厚根基。在人工智能应用加速领域,我们能否另辟蹊径?答案是肯定的。当前已有多种创新方案。究竟哪种技术会成为主流?对于降低能耗、优化功耗这类特定需求,或许会有突破性进展。”

要深入理解大脑的运作机制,模拟技术必须被纳入考量。Lawley说:“目前确实有一些非常有趣的模拟技术初创公司取得了显著成果。但遗憾的是,它们尚未能覆盖所需的各种人工智能应用场景。对于模拟加速器擅长的领域,它们确实表现出色且功耗极低。但在多数情况下,仍需依赖数字技术。模拟技术的制造工艺难度极高,要达到必要的控制精度,必须确保所有电流参数准确无误、电阻值精确、导线连接具备适当电容。这无疑是个更棘手的难题。或许未来能迎刃而解,但相关企业已为此努力了多年。”

EDA的角色

EDA在人工智能算力优化方面主要通过两大方式发挥作用。首先是提供人工智能应用支持决策的信息,其次是提供人工智能技术实现高效实施与优化的工具。“EDA能将过去靠猜测的设计转变为数据驱动的设计,从而塑造AI架构,”Expedera公司的Theivendran表示,“通过设计空间探索、工作负载分析和AI辅助调优,EDA帮助架构师打造的硬件不仅具备功能性,更能完美适配真实的人工智能工作负载。”

人工智能系统层面的变化程度才真正显现。Kim教授认为:“我们已进入一个新阶段,不能再局限于芯片级优化,必须从封装、板卡到机架层面全面考量整个技术栈。最关键的是工作负载感知型系统设计。无论是训练、推理还是新型测试时计算模式,不同人工智能工作负载的功耗和发热量差异悬殊。EDA工具需要与时俱进,基于实际工作负载特性分析并优化全系统交互。唯有如此,才能设计出真正实现硅片利用率最大化而非长期受热限制的系统。”

Arteris公司Nightingale表示:“硬件架构的快速迭代能提供更多可选方案。EDA需要整合高阶物理感知规划工具。自动化必须支持拓扑与布局图的快速迭代,模拟功耗性能之间的权衡关系。基于人工智能应用的设计空间探索技术,还能帮助实现最优的分区、布线和资源布局。”

工作负载、架构设计与内存存储事务之间的交互复杂度持续攀升。“这些交互关系已经变得过于错综复杂,难以预测,”Schirrmeister指出,“在某些领域,电子数据表仍能帮助我们评估缓存对芯片或微芯片边界流量的影响,这种流量可能消耗更多电力。虽然人们仍会采用粗略估算和随机模型,但交互关系的复杂程度已迫使开发者必须在目标架构上运行人工智能工作负载,才能确保人工智能应用从性能角度做出正确决策。”

人类创新仍有广阔空间。Fraunhofer研究所的Prautsch指出:“问题的复杂性往往超出预期,这直接导致人工智能应用设计过程中会产生大量无效方案。这种现象在将难题拆解为解决方案时并不罕见。决策总是需要权衡取舍且带有主观倾向。各利益相关方间保持有效沟通至关重要,这样才能快速排除冗余选项并锁定最优方案,但即便如此,真正理想的人工智能应用解决方案未必会浮出水面。”

结论

人工智能技术的能耗问题正引发警报,这绝非空穴来风。但这种情况与其它新兴产业的兴起并无二致,关键在于我们如何应对。是应该开发更多清洁能源,还是通过其他方式降低人工智能应用能耗?我们能否跳出半导体行业的舒适区进行创新设计,还是说这种突破会制约技术效益的实现速度?决策者们是否真能完全理解自己所作决定的深远影响?

人工智能应用解决方案需要众多利益相关方共同参与,这在过去一直是个难题。如今,软件的开发速度远远超过硬件响应速度,一些人希望人工智能技术能帮助加快这一进程。 Normal公司的Khomiakov表示:“终极目标是让人工智能完全自主设计芯片,从而提升自身效率。”

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请与我们联系,我们将及时更正、删除,谢谢。
Big-Bit 商务网
新连接器网站新闻详情页广告 广告

请使用微信扫码登陆