物理AI系统设计面临多重挑战

2025-11-27 13:46:34 来源:编译:深圳市连接器行业协会 李亦平 作者:ANN MUTSCHLER

从机器人到大量边缘设备,物理人工智能使一切变得更加交互和有用。它显著改变系统的设计、验证和监控方式。也打破那些使芯片设计与验证保持一致性和可靠性的限制。

c系统需要具备独立运作与协同工作的双重能力。它们需要能够快速做出本地决策,通常比其它类型AI能耗更低,且比当今多数大型AI系统更具专注性。与此同时,这些设备还需在必要时接入云端近乎无限的算力资源,并基于可能不足的数据实时做出概率性决策。此外,当与代理式AI结合使用时,这些设备还需能通过自然语言和手势指令与人类互动,尽管这些指令并不总是精准到位。

要实现这些过去大多各自为政的领域之间的融合,芯片设计团队将面临一系列全新挑战。他们需要全面掌握融入物理设计流程的人工智能算法,以及芯片架构特有的技术要求。同时,团队还需精通如何运用人工智能驱动工具。这些工具将用于优化布局、布线设计,从而满足更严格的功耗、性能和面积约束,同时应对极端MAC运算、大规模并行处理以及多种存储器的集成需求。

Cadence公司高级产品营销总监Mick Posner说:“过去几年我们听到了很多关于人工智能的讨论,这些讨论大多集中在数据中心层面,而我们深知这个问题存在两面性。一方面是模型训练,这属于NVIDIA领域的常规操作。另一方面是真正的应用价值在于推理环节。物理AI将AI处理能力转移到边缘设备,即实际运行的终端设备。物理AI的核心在于用户与AI的交互体验。它对延迟敏感,需要快速做出决策。因此,处理工作必须在设备端、在边缘完成。以自动驾驶汽车为例,其自动驾驶系统需要实时感知周围环境,没有时间说‘这玩意儿是什么?我要去数据中心查查’,必须在边缘即时决策。再比如无人机自主飞往用户住所,也需要实时做出导航决策。”

要实现物理人工智能,需要多种技术支撑。其中自然语言处理技术尤为关键。Posner解释道:“当你对机器人说‘帮我拿杯牛奶’时,系统需要理解这句话,这就需要大型语言模型来处理。而物理层面则需要执行动作。同样,在航空航天和国防领域,物体检测、目标获取等操作都需要实时处理。”

物理AI系统覆盖多个市场。来源:Cadence

图1:物理AI系统覆盖多个市场。来源:Cadence

在物理AI硬件领域,存在AI视角与通用硬件视角的双重考量。Synopsys移动、汽车及消费IP产品管理执行总监Hezi Saar指出:“物理AI硬件可以从两个维度理解。首先是适应AI算法或AI机器变更的能力。这包括设备上可能需要实现的所有学习机制,例如流水线的工作原理、数据预处理方式、资源优化配置方案,以及系统运行稳定性等关键要素。所有这些都需要经过周密规划。由于实施难度极高,因此需要预留充足余地,并提供多种灵活适配方案。”

物理人工智能常被视为边缘计算的子领域。Saar解释道:“与人类或环境的交互才是物理AI的独特之处.边缘AI连接云端,运行在设备端。而物理AI则直接部署在设备上,具备超越常规边缘AI的独特能力。如果我使用AGI(通用人工智能),比如最初在手机中作为AI助手,主要是通过软件功能实现交互。我们可以用语音与之对话,甚至通过文字获取助手的输出。说到物理AI,它能涵盖多种应用场景。这类AI具有实体组件,既能接收环境信息,也能影响环境。在物理领域,我们甚至可以将机器人出租车视为典型代表。机器人和无人机同样具备这类能力,通过环境输入或输出来驱动自身。我们开发的AI代理本质上是软件AI代理,而物理AI代理则能以实体形态为我们服务。真正的变革在于社会对这类技术的接受程度,人们将如何接纳这种新型交互方式。”

物理人工智能最初在工业应用领域崭露头角。Siemens EDA公司IC验证与EDA人工智能产品负责人Sathishkumar Balasubramanian说:“以工厂为例,假设有多台需要定期维护和监控的熔炉。传统做法是人工进入检查、爬梯子等。借助物理人工智能,我们能提前预测故障发生,或基于强化学习、历史经验及传感器监测数据来规划维护周期。通过分析数千种参数组合,我们能预判特定配置下的故障诱因,或确定预防性维护的最佳时机。借助实时监测和实时数据,结合熔炉A的运行模型,我们能精准预测:当熔炉因高温运行需要更换特定部件时,就能提前预警。可以说,物理人工智能几乎能预测所有情况。其核心理念在于提升用户体验,既优化终端产品性能,又保障操作人员安全。通过确保工厂预防性维护的无缝衔接,最终目标是减少高风险岗位人员的投入,避免他们需要临时介入排查故障或监控数据。这正是工业物联网与边缘AI技术的完美融合。”

系统级物理AI

物理AI还涉及系统层面的考量,因为它需要进行更多本地化边缘计算和通信。Arteris首席营销Michal Siwinski表示:“这不仅仅是往返数据中心的数据传输问题,这种通信与其它边缘设备并无二致。但这些系统将形成紧密互联。就像硬件版的智能AI,当处理这类系统时,它们不再孤立存在,而是成为边缘系统的一部分,自主运行并进行通信。此时需要巨大的带宽和海量通信量,还要处理各种不同的计算任务。物理AI本质上意味着系统具备智能,相当于在系统内部构建了一台巨型超级计算机,需要协调更多分布式计算。当我们深入分析这些要素时,仍会遇到汽车领域的难题,必须同时处理激光雷达、雷达和视觉系统。出于多种原因,你很可能需要同时部署这三者,因为很可能正在构建一个关键任务系统,责任和法规要求你必须尽早完成大量工作,特别是在那些可能影响生命安全的领域。因此必须妥善处理所有这些复杂问题。”

物理人工智能涉及运动控制,需要传感器、MEMS器件和模拟/混合信号系统等。Siwinski解释道:“这意味着我们必须讨论混合层级信号,并弄清楚这些信息如何流动。除此之外,还要统筹协调所有这些系统。它们可能是分布式或非分布式架构,但由于这些异构系统的存在,系统将拥有一个中央控制中枢。”

当然,绝不能放任其自生自灭,如果任其自行其是,很可能会失控,因此仍需进行协调与同步,这就像是一个移动的数据中心。那么问题来了:在电池和能源受限的边缘设备环境下,如何实现计算能力并可能进行训练而不仅仅是推理?我们希望这些系统不完全呆板,而是具备一定程度的自主性。因此必须赋予它们局部训练能力,这意味着除了连接工厂外,还需要使用TinyML这类软件,这样当设备接入电源时,就能与数据中心同步并更新最新固件等。实际上,在运行和充电过程中,系统必须持续运作而非突然中断。这与那些独立系统的整体情况完全不同。

要理解这一点,不妨从物理人工智能的融合特性入手。德州仪器高性能处理器总经理Artem Aginskiy指出:“过去,人工智能始终局限在数字领域。它只能收集信息、处理数据并输出答案,却无法在现实世界中进行推理或自主行动。而物理人工智能的突破在于,原本主要依赖远程服务器的数据处理现在实现了本地化,从而催生出机器人搬运货物、自动驾驶汽车自主停车等现实场景。这与边缘人工智能概念相似。后者通过MCU、MPU等嵌入式处理器和软件,使网络边缘的应用程序具备本地AI能力。但关键区别在于,物理人工智能不仅涉及感知处理,更延伸到应用程序的实际执行层面。无论是物理人工智能还是边缘人工智能,都在其最具影响力的应用场景中,为现实世界注入了更多智能与自动化。”

物理AI将人工智能直接应用于现实世界,机器必须感知、解释和在与人类共享的环境中行动,从而融合多模态感知、边缘计算和持续学习,使机器人、车辆或基础设施资产能够自主和安全地行动。

BrightAI创始人兼首席执行官Alex Hawkinson表示:“虽然大多数AI系统已无新数据可供学习,但物理AI才刚刚起步。它正从物理世界中挖掘出数十亿条未被开发的信号,并将其转化为可操作的洞见。物理AI是物理世界的实时操作系统,使管道、电线杆等实体资产完全可观察且数据驱动。”

不同数据,不同处理

边缘AI和物理/端点AI使用的数据是不同的,因此可以或需要对这些数据做什么也是不同的。

Ambiq公司人工智能副总裁Carlos Morales说:“在边缘部署AI时,能显著降低延迟,这意味着数据传输速率大幅下降,回传的数据量也随之减少。从功耗角度来看,由于需要进行射频传输,设备能耗会相应降低。虽然在这方面难以再有太大突破,但若采用预计算方案,传输的数据量就能大幅缩减。例如,传输心电图数据每分钟需要40兆字节,而传输心率数据只需40字节,因此在边缘部署AI技术能有效节省能耗。”

物理AI开发者迫切需要获取真实世界数据。Siemens EDA的Balasubramanian说:“我们注意到业界高度关注边缘计算的能效设计,以便实时监控数据。因为物理AI需要与现实世界及电子设备进行交互。这实际上取决于具体应用场景。比如工业机器人可能面临不同的场景需求,但核心在于能否高效获取真实数据并快速决策。因为在物理AI中,当我说‘机器人,去取这个’时,我不能等五分钟机器人理解并执行。它需要快速自主决策,这就要求我们在边缘设备、物理AI机器人系统中部署高效的专业模型和代码,确保行为和功能的即时响应。”

延迟控制是关键所在。“如今的物理AI机器人每个关节都配备了传感器,”Ambiq公司的Morales表示,“人工智能被部署在这些传感器上,并形成了闭环控制系统。与章鱼智脑通过大脑统一控制不同,每个机械臂都内置了独立智能单元。我们不希望单一大脑系统拖累整个系统的运行效率。这意味着传感器端的物理驱动功能(例如异常检测)至关重要。同时,根据实时事件动态切换不同模型也非常重要。以医疗监测系统为例,当检测到异常生物信号时,系统会每五分钟采集一次数据。当检测到跑步等特定活动时,系统会切换到高分辨率模式进行精准监测。由于这种模式不会持续运行,设备仍能保持低功耗。当系统确认用户未发生心脏病发作时,会自动切换回休眠模式。这种智能模式在智能音箱等设备中也得到了广泛应用。”

业内人士预计,未来机器人将在现实世界中大规模应用人工智能驱动的感知、规划与控制技术。ChipAgents公司首席执行官William Wang指出:“芯片制造商正面临对异构确定性边缘SoC(CPU/GPU/NPU/DSP)的需求,这些芯片需要在严格功率与安全约束下,满足传感器融合、策略制定和执行动作等环节的硬性端到端时限要求。”

William Wang进一步说明前端验证的重点已转向四大方向:(1)低延迟数据流(临时存储区、直接内存访问、服务质量、中断延迟);(2)混合关键性隔离(安全岛、同步控制、错误检测与纠正);(3)RTL阶段的实时特性(时限/吞吐量约束、WCET式验证);(4)闭环机器学习验证,即在控制器逻辑中同步建模感知误差。EDA必须通过物理/数字孪生仿真、场景化激励生成、控制不变量形式化验证,以及覆盖各类边界条件与RTL状态的测试,实现硬件、软件与机器学习的协同设计。

ChipAgents等厂商开发的智能体AI工具可统筹协调这些需求。这些工具能自动划分加速器与软件间的感知与控制功能,生成符合周期精度延迟预算的RTL代码,并通过模拟器(如动态遮挡、滑动、延迟等场景)生成测试套件,同时对接口和安全路径进行压力测试。此外,它们还能持续平衡PPA与闭环稳定性/吞吐量,从而缩短机器人芯片的迭代测试修复周期。

物理人工智能将部分验证工作从实验室转移到了实际应用领域。BrightAI公司的Hawkinson 表示:“模型和硬件不仅需要在模拟环境中验证,更要在真实环境条件下,比如天气变化、设备磨损和人为失误等条件下进行测试。这要求我们采用全新的设计流程并持续验证。这意味着要确保传感器、芯片和人工智能模型能协同运作,形成一个集成系统,实现最低限度的人工监控。”

在物理人工智能的诸多要求中,隐私保护尤为重要,特别是在需要监听的设备上。Ambiq公司的Morales说:“虽然设备无法听到你说的话,也不真正理解你的话语,但通过分析你的说话方式和声音特征,就能检测出早期痴呆症状。我不想让任何人知道这些信息,因此隐私保护和安全防护至关重要。开发者还特别看重低延迟特性,这既能保证即时响应,又能节省能耗。”

结论

即将迎来的物理AI设计浪潮将呈现多样化的设计起点。西门子EDA的Balasubramanian表示:“需求更加多元且差异显著,因此重点将放在针对不同垂直领域(从工业医疗到汽车消费)的定制化芯片开发上。终端需求和运行环境都将有所不同,因为一旦进入物理AI领域,就会比普通芯片更频繁地接触各种环境因素。由于不在受控环境中,设计出稳健的产品并充分理解终端产品的使用场景将成为关键。芯片与系统架构师需要深入思考,既要明确功耗、性能和面积的约束条件,也要考虑运行环境。这些约束部分由软件堆栈驱动,并指导整个芯片或系统的开发。在物理AI领域取得成功的关键在于避免试图全面覆盖所有领域。选择一个擅长的领域,然后将该用例推广到大量类似场景中。”

未来的挑战将更加艰巨。Cadence公司的Posner说:“这就像一个独立的巨型设计体系。如果只是进行简单的物体检测,比如安防摄像头,这样的设计就足够了。但当需要实现更复杂的功能时,就需要搭配AI加速器方案。这时候不仅需要CPU,还需要针对特定领域的专用芯片或多个这样的芯片。我们有客户打算开发五种不同的芯片,再基于这五种晶粒打造20款不同产品。因为他们可以灵活扩展CPU性能、AI运算能力以及系统处理能力。这就是未来设计的挑战,即如何将所有这些组件层层叠加。通过自主研发,由于我们拥有多个晶粒,我们不仅实现了跨晶粒的协同仿真,还实现了协同仿真。这些设计绝非小工程。系统芯片的面积为120平方毫米,AI芯片则达到200平方毫米。这些都是规模庞大的设计,上面运行着数百万行软件代码。”

要实现这一目标,EDA工具、验证与仿真都需要实现指数级扩展。因为原本单芯片难以管理的问题,如今多芯片架构下将变得更加棘手。工程师们必须全面掌握这些技术动态,通过分而治之的策略优化系统设计。既要确保系统能对不同传感器输入做出最佳响应,又要实现持续学习与进化,贯穿其整个生命周期。

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请与我们联系,我们将及时更正、删除,谢谢。
Big-Bit 商务网
新连接器网站新闻详情页广告 广告

请使用微信扫码登陆