电池寿命预测新突破:港科大与中南大学AI记忆宫殿研究
摘要
电池从封装完成那一刻起,就开始不可逆地走向衰老。手机续航骤降、电动车里程缩水、储
电池从封装完成那一刻起,就开始不可逆地走向衰老。手机续航骤降、电动车里程缩水、储能电站容量衰减,都是电池退化(Degradation)的直接体现。研究人员用SOH(State of Health,健康度)量化电池状态,出厂为100%,随充放电循环逐步下滑。当SOH跌破阈值(如80%),即判定“寿命终结”。预测电池从新生到报废的完整衰退曲线,就称为电池退化轨迹预测(Battery Degradation Trajectory Forecasting,BDTF)。
更关键的是,这支团队的目标并非事后复盘,而是“早期预测”——仅凭前100次充放电数据,推断未来数百甚至数千次循环的退化路径。这就像一位资深体检医师,仅依据你20岁时的体检报告,就能勾勒出未来数十年的大致健康曲线。
为何如此重要?2024年全球电池出货量已超过1545吉瓦时(GWh),预计2030年将突破4700吉瓦时。制造商需快速筛选优化电芯;电动汽车企业要基于寿命定价与制定保修;储能电站运营商则需预判退役时间以安排维护。精准的早期退化预测,背后是巨大的时间与成本效益。

这项研究由香港科技大学(广州)可持续能源与环境学域、数据科学与分析学域、上海大学材料基因组研究院以及中南大学计算机科学与工程学院联合完成。相关成果发表于2026年第32届ACM SIGKDD知识发现与数据挖掘国际会议(KDD '26),会议在韩国济州岛举行,DOI编号为10.1145/3770855.3818948,读者可通过该编号检索全文。
一、现有方法卡在哪儿:两块硬骨头啃不动
此前,科学家们为预测电池退化设计了多种方案,大致分两类。
一类是“手工特征工程”——专家基于电化学知识,从电压、电流数据中人工挑选代表性指标,如特定电压区间的容量变化,再用机器学习建模。该方法在特定场景有效,但致命缺陷在于:人工特征与具体充电协议绑定过紧,协议一变即失效,泛化能力极差。
另一类是“端到端学习”——将原始电压电流曲线或历史SOH序列直接输入神经网络,让其自主挖掘规律。最直觉的做法是将早期几十次循环的SOH值视为时间序列,用通用预测模型外推。但棘手的是,未来退化快与慢的电池,在前几十次循环的SOH数值几乎无差异。仅凭这段难以区分的早期数据预测截然不同的走势,如同只看20岁时的身高去猜50岁的体重,信息严重不足。
因此,越来越多研究者将精细的电压-电流时序数据纳入模型输入,这些数据中蕴藏着SOH无法显示的退化差异。但即便如此,现有模型仍面临两大挑战。
第一块硬骨头:缺乏在“批量层面”系统思考退化规律。现实中,电池退化存在明确的分层结构。在相同“老化条件”(如一致的正负极材料、充放电协议、工作温度)下,不同电池的退化轨迹高度相似。从更宏观视角看,退化曲线形态虽千变万化,但电化学专家指出,其整体形态仅包括几种基本类型:前期快后期慢的“次线性”、匀速下降的“线性”、前期慢后期骤降的“超线性”,以及“容量再生”(短暂恢复)或“初始容量上升”等特例。换言之,退化轨迹空间虽有复杂性,但内部存在“骨架”。遗憾的是,现有模型均在单电池层面各自为战,完全未利用这种多层次结构。
第二块硬骨头:退化信号在“荷电状态(SOC)”维度呈现局部化。SOC即电池当前剩余电量比例,范围0%(完全放电)至100%(满电)。研究表明,由退化引起的电压和电流变化,并非均匀分布于整个充放电过程,而是集中在特定SOC区间。这背后有深刻的电化学原因:例如,某些材料在特定电量区间发生相变,相变会在电压曲线上留下特征峰,电池老化后该峰的位置、宽度和高度均会变化。如同声纹专家能从语音特定频段识别情绪,我们应在SOC特定区间重点“捕捉”退化信号。然而,多数模型或仅关注时间维度,或对各SOC区间一视同仁,浪费了这些局部关键信息。
二、BatteryMFormer的核心思路:三件武器联手破局
面对这两大挑战,研究团队设计了BatteryMFormer(电池多层次Transformer),配备三件联动的核心武器。整个模型的运作逻辑,类似一个训练有素的分析师团队:一组人负责从原始数据中提炼信息,另一组人结合电池的“出身背景”对信息进行校准,还有一位“资深顾问”随时从过往案例库中检索最相似的退化模式作为参考。
第一件武器:双视角编码器
团队将每次充放电循环的数据统一重采样至300个数据点,包含电压、电流、容量和SOC四个变量,然后让模型同时从两个视角观察数据。
“时间视角”:将每个充放电循环视为独立“故事片段”,提取该循环的整体特征表示,再将前S次循环的特征序列排列,让模型感知“退化的时间流”。此外,注入易于计算的循环级指标,如库仑效率(充入与放出电量比值)与能量效率,丰富每个时间步的信息量。
“SOC视角”则截然不同:不再按时间顺序,而是锁定特定SOC区间,沿循环次数轴观察该区间在每次循环中的变化。具体操作:用一个一维卷积沿SOC轴滑动,将数据切割为若干SOC片段(每个对应一小段电量区间),再对各片段聚合所有早期循环的信息,生成“SOC局部退化令牌”。若退化信号集中在某个SOC区间,该视角能清晰捕捉,避免被其他区间的噪声稀释。
时间视角输出S个循环级令牌,SOC视角输出M个区间级令牌,二者合并后输入后续解码器。
第二件武器:老化条件感知解码器
每块电池均有一份“出身档案”:正极材料(磷酸铁锂还是钴酸锂)、负极材料、电解液配方、封装形式(圆柱、方形或软包)、额定容量、生产厂商、化成协议、充电协议、放电协议、工作温度等。这些因素共同决定了电池的基本退化“性格”。相同老化条件下的电池,退化曲线往往高度相似。
研究团队并未简单用编号表示这些信息,而是将参数编写成一段自然语言描述(例如:“这是一块方形磷酸铁锂电池,正极材料为……,采用的充电协议为……”),然后用Qwen3-Embedding语言模型转换为向量,作为“老化条件先验”。
该先验向量被注入解码器的两个位置。其一,解码器初始的“查询向量”会被它修正,使模型从一开始就带着对电池背景的判断去读取数据。其二,解码器在每一层进行注意力计算时,该先验向量都会叠加到查询端,强制每次“提问”都带上老化条件的色彩。这种设计使相同条件下的电池,在模型内部自然形成相似表示,避免将本质相似的电池当作毫无关联的个体处理。
第三件武器:元退化模式记忆
这是整个模型最精髓的部分。团队设计了一个可学习的“记忆库”,内含多个“记忆槽”,每个槽存储一个向量,代表一种原型退化模式。这些槽的内容不是人工预设,而是在模型训练过程中自动学习形成,最终每个槽“学会”代表一种或几种典型的退化轨迹形态。
当模型处理一块新电池时,它会根据解码器输出的状态,向记忆库发起“相似度查询”——用余弦相似度衡量当前电池特征与每个记忆槽的接近程度,选出最相似的两个槽,按相似度加权融合,得到一个“检索到的原型退化向量”。
该原型向量随后通过门控机制与解码器输出融合。所谓门控,就像一个“可调音量旋钮”:模型能学会在什么情况下多参考记忆中的原型(调大旋钮),什么情况下更依赖从数据中读取的信息(调小旋钮)。最后,融合后的表示经过一个线性投影层,输出长达5000个时间步的SOH预测序列,覆盖数据库中所有电池的寿命上限。
为确保记忆库存储有意义的退化模式,训练时引入两个附加学习目标:一是让检索到的原型向量尽量与真实轨迹的编码对齐;二是确保真实轨迹的编码向量本身包含足够的轨迹信息(通过能否重建原始轨迹来验证)。这两个目标与主预测损失一起,共同指导模型训练。
三、实验怎么做的:四种不同“脾气”的电池都得接受考验
研究团队在公开数据库BatteryLife上进行了测试,该库是目前最大的公开真实电池全寿命数据库。他们从中选取四个电池域评估模型。
锂离子电池域包含963块电池,数据整合自13个子数据集,涵盖466种不同老化条件、15种化学体系和8种工作温度,平均寿命863次循环,最长可达4904次——这是最复杂、多样性最强的域。
CALB域包含27块大型商业锂离子电池,来自生产线测试,仅有4种老化条件,但电池容量更大,平均寿命866次循环。
钠离子电池域包含31块商业钠离子电池,涵盖12种不同充放电协议,平均寿命185次循环,是四个域中最短的。
锌离子电池域包含95块锌离子电池,电解液配方和封装形式各异,工作温度也有差别,平均寿命410次循环,最长可达1652次。
评估指标采用平均绝对误差(MAE)和平均绝对百分比误差(MAPE),前者衡量预测值与真实值的平均偏差,后者衡量偏差的百分比,均越小越好。
特别关键的是,所有测试均采用“老化条件独占测试”设置:测试集中电池所属的老化条件,在训练和验证阶段完全未出现。这相当于让模型预测一种完全没见过的“电池品种”的退化轨迹,真正考验的是泛化能力,而非死记硬背。
对比基线涵盖两大类共11个模型。电池专用模型包括IC2ML、CPTransformer、CPMLP;通用时间序列预测模型包括TimeMixer++、TimeBridge、iTransformer、TimesFM、PatchTST、PatchMLP、DLinear、ConvTimeNet。所有基线输入相同格式的电压、电流、容量序列数据(IC2ML按原始设计输入容量增量序列,TimesFM仅输入历史SOH序列)。每个模型和每个域均测试至少10种超参数配置,取验证集表现最好的结果汇报。
四、成绩单:BatteryMFormer在四个考场都拿了第一
结果非常清晰。在四个域的所有指标上,BatteryMFormer均排名第一。与各域最佳基线相比,其在锂离子域将MAPE降低了11.07%、MAE降低了10.94%;在CALB域将MAPE降低了8.49%、MAE降低了10.83%;在钠离子域将MAPE降低了17.66%、MAE降低了17.65%;在锌离子域将MAPE降低了8.97%、MAE降低了11.83%。
一个耐人寻味的细节是:各域表现最好的基线并不相同。在锂离子、CALB和锌离子域,IC2ML是最强者;在钠离子域,TimeBridge拔得头筹。这说明不同电池域的退化规律各具特点,没有通用模型能在所有场景下稳居首位。更麻烦的是,一些基线表现波动很大——DLinear在钠离子域尚可,在CALB域误差暴涨至不可接受;TimesFM在钠离子域相对稳定,但在锂离子和锌离子域误差极高。相比之下,BatteryMFormer在四个域里始终保持最高准确性,表明其多层次学习策略能够适应不同域截然不同的退化规律。
团队还测试了另一个场景:当可用早期循环数量从1次增加到100次时,模型表现如何变化。BatteryMFormer在几乎所有早期循环数量设置下均持续优于其他模型,无论仅寥寥几次循环还是满100次,都能保持最强表现。
一个值得关注的现象:在锂离子和钠离子域,当早期循环数超过25次时,部分模型(包括BatteryMFormer和一些基线)的预测误差不降反升。原因在于:每次循环包含300个数据点,25次循环已是7500个输入点。相邻循环的变化极其微小,堆砌更多循环只会带来海量冗余信息,反而稀释了真正有价值的退化信号,同时增加模型优化难度。类似现象在其他长序列时间序列预测研究中也有报道。即便如此,BatteryMFormer整体上仍领先于基线,体现了多层次学习策略在处理长序列时的相对优势。
五、拆零件验证:每个部件都是必要的
为确认每个核心组件是否不可或缺,团队进行了一系列消融实验——逐一拆掉模型部件,观察性能变化,如同拆解一辆车,看哪个零件最关键。
拆掉SOC视角后,四个域的错误率均明显上升,锌离子域的MAPE从4.97%跃升至6.65%,升幅最为显著。这表明SOC局部化的退化信号确实携带独特预测价值,不能被时间视角单独替代。
拆掉元退化模式记忆后,性能同样在所有域下降,锌离子域的下降幅度尤其突出。证明对长期退化轨迹原型的显式记忆与检索,对长视野预测确有实质帮助。
拆掉老化条件感知解码器(同时移除老化条件告知查询和老化条件感知注意力),性能下降最为显著,在CALB和锌离子域尤其明显。仅拆掉老化条件感知注意力保留查询初始化,或仅拆掉查询初始化保留注意力调制,性能也均有不同程度下降,说明这两种注入老化条件信息的方式是互补的,缺一不可。
团队还测试了“用查表方式编码老化条件”的替代方案——将正极材料、负极材料、工作温度等离散参数分别用一个可学习的嵌入向量表示,然后加和投影。该方案存在硬伤:像“两段式充电协议”这种可变长文字描述根本无法用固定查表表示,因此只能使用其中几个简单参数。结果显示,该方案的误差和波动在CALB和锌离子域均明显更大,说明语言模型带来的语义化老化条件表示确实比简单查表更丰富。
另一个有趣的对照实验:团队给CPTransformer(一个表现不错的基线)喂入与BatteryMFormer完全相同的输入信息,包括电压、电流、容量、SOC、老化条件信息和循环级指标。结果,这种增强输入的CPTransformer和原版CPTransformer表现几乎一样差,仍然远不如BatteryMFormer。说明BatteryMFormer的优势来自其本身的多层次学习架构,而非仅仅因为使用了更多输入变量。
六、打开黑盒子:模型究竟在“看”哪里
团队进行了一些案例分析,试图理解模型内部运作机制。他们选取了三块分别呈现超线性、线性和次线性退化的测试电池,观察模型检索到的记忆原型以及注意力分布。
在记忆检索方面,三块电池各自检索到的前两个记忆槽,其解码出的原型曲线形状均与电池的实际退化模式高度吻合。超线性退化电池检索到的两个原型均带有明显的“膝点”(退化突然加速的拐点);线性退化电池检索到的原型基本是直线下降;次线性退化电池虽早期数据看起来退化较快,但检索到的原型显示出后期减速的趋势,帮助模型正确预测了长期走势。这说明记忆库中的原型确实学会了有意义的退化模式,而非随机向量。
在注意力分布方面,解码器的跨视角注意力显示:大部分注意力权重落在时间视角令牌上,但SOC视角令牌也占据了不可忽视的份额,且SOC视角的注意力高度集中在少数几个特定的SOC令牌上,其他大部分SOC区间的注意力权重近乎为零。这与研究预期完全一致——退化信号是SOC局部化的,模型通过注意力机制自动学会了聚焦最关键的区域。
团队还进行了额外验证:用电化学领域的差分电压分析(DVA)方法对一块测试电池的充放电曲线进行分析,找出SOC轴上电压变化最剧烈的几个峰值区间(对应电化学上最敏感的相变过程,被认为是退化信号最集中的地方)。结果发现,BatteryMFormer注意力权重排名前25%的SOC令牌,恰好集中在这几个DVA峰及其肩峰附近。也就是说,模型在没有任何电化学知识监督的情况下,自己学会了关注电化学专家认为最有价值的SOC区间,这一发现确实令人惊喜。
七、少数据也能打:节省一半训练成本依然领先
电池寿命测试极其昂贵:一块电池可能需要被充放电数百上千次,每次数小时,完整记录全寿命数据需要数月甚至数年。因此,在有限训练数据下仍能准确预测,具有很高的现实意义。
团队设计了一个“数据高效学习”实验:仅保留50%的训练电池,测试集和验证集不变,观察各模型在训练数据减半时的表现。BatteryMFormer依然在四个域全面领先。与各域最强基线相比,其在锂离子域进一步将MAPE降低了12.45%、MAE降低了12.17%;在CALB域将MAPE降低了2.81%、MAE降低了5.22%;在钠离子域将MAPE降低了15.23%、MAE降低了14.98%;在锌离子域将MAPE降低了17.69%、MAE降低了18.04%。
特别值得注意的是钠离子和锌离子域——这两个域本身训练数据就少、老化条件多样,在数据减半后差距反而拉大。这表明BatteryMFormer的多层次学习策略尤其擅长从有限数据中挖掘普遍性的退化模式,比单纯依赖数据量的方法更有优势。
八、研究的局限和未来方向
团队也坦率指出了当前工作的两个局限。
首先,当早期循环数较多(超过25次)时,输入序列很长(超过7500个点),可能导致模型性能反而下降。如何更好地处理长序列输入、去除冗余同时保留关键退化信号,是未来需要改进的方向。
其次,目前的实验均在实验室或标准化生产测试数据上进行,数据较为规整。在电动汽车实际运营中,充放电行为千差万别,数据记录可能不规整甚至带有噪声,将BatteryMFormer直接移植到这类“野外数据”可能需要额外的预处理和模型调整。
此外,该预测模型在高风险场景下(如决定是否退役电池、何时维护)使用时,预测误差可能带来错误决策,因此在正式部署前务必针对目标场景进行充分验证。
归根结底,BatteryMFormer这项研究的核心意义在于:它系统性地指出并验证了,电池退化数据天然具有多层次结构,而这种结构是可以被显式建模和利用的。老化条件层面的共性规律、跨电池共享的退化轨迹原型、SOC维度上局部化的退化信号——这三件事放在一起,构成了比任何单一层次都更丰富、更具预测力的信息体系。这个思路不仅对电池科学有价值,对其他存在类似多层次结构的时间序列预测问题,或许也能提供有益的启发。对完整技术细节感兴趣的读者,可通过DOI编号10.1145/3770855.3818948查阅原论文。
Q&A
Q1:BatteryMFormer是怎么利用电池的“出身背景”来预测退化的?
A:BatteryMFormer将电池的各种参数(正负极材料、充放电协议、工作温度等)拼接成一段自然语言描述,用语言模型转换为向量,再将该向量注入解码器的查询初始化和每一层的注意力计算中。这样一来,同一老化条件下的电池在模型内部自然形成相似的表示,让模型对“同类电池”的规律学得更准,对新出现的同类电池预测也更可靠。
Q2:元退化模式记忆里的“原型轨迹”是人工设定的还是自动学出来的?
A:完全是自动学出来的。记忆库里的槽位初始为随机向量,在训练过程中通过两个额外的学习目标不断调整:一是让检索到的原型向量尽量贴近真实轨迹的编码;二是确保轨迹编码包含足够信息以重建原始曲线。经过训练后,每个槽位自然而然地“聚合”成某一类典型退化形状的代表,无需人工干预。
Q3:BatteryMFormer能预测锂离子电池以外的电池类型吗?
A:可以。团队在锂离子电池、商业大容量锂离子电池、钠离子电池和锌离子电池四种类型上均进行了测试,BatteryMFormer在全部四种类型上都取得了最好成绩。尤其在钠离子和锌离子这类数据相对稀缺的领域,BatteryMFormer的优势更加突出,说明其多层次学习框架具备较好的跨化学体系泛化能力。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。