锂离子电池SOH估计及电池分选关键技术的研究pdf
新能源发电技术与新能源汽车都离不开锂离子电池的储能。大规模串并联的锂离子
电池组存在一致性问题。解决电池组不一致性问题需要从影响电池组一致性的外部因素
和内部因素入手。电池管理系统针对影响电池组一致性的外部因素,在准确估计电池状
态的前提下控制电池的充放电实现电池使用寿命、安全性和一致性的提高。电池分选技
术针对影响电池组一致性的内部因素,在电池成组时保证同一组内的电池单体高度相似,
进而提高电池组的一致性。本文从影响电池组一致性的内外部因素入手,分别提出了一
种电池管理系统中电池健康状态(StateofHealth,SOH)估计方法和一种电池分选方法。
本文首先对电池SOH估计技术和电池分选技术的研究现状进行了介绍。电池SOH
估计技术方面,基于增量容量(IncrementalCapacity,IC)曲线的估计具有老化特征明显、
可以清晰的分析电池老化机制等优点,但需要与其他估计方法结合才能实现高精度的
SOH估计。电池分选技术方面,基于电池特征的分类法综合考虑电池能获取的多项特性
针对电池SOH估计技术,本文提出一种基于IC曲线与BP神经网络的SOH在线
估计融合方法。该方法仅利用电池恒流充电阶段的IC曲线实现SOH估计,通过BP神
经网络学习IC曲线特征与SOH衰退的关系,实现高精度的SOH估计,具有易于嵌入
针对电池分选技术,本文提出一种基于IC曲线动态时间弯曲距离的自下而上的分
层聚类分选方法。该方法将恒流充电阶段的IC曲线作为分选依据,将IC曲线相似的电
池分选为同一类。动态时间弯曲距离的引入使得IC曲线相似度的量化比较成为可能。
最后基于自下而上的分层聚类方法,使相似的电池得到分选。本文提出的方法只需要利
用恒流充电阶段的电池电压数据即可实现电池的分选,大大缩短了电池分选中电池性能
本文对上述SOH估计方法和电池分选方法进行了估计原理和分选原理的分析,完
成了数学模型的推导和仿真验证,最后搭建实验平台进行了验证。实验结果与对比分析
关键词:锂离子电池;电池不一致性;电池管理系统;健康状态估计;电池分选技术
本章作为绪论,首先对新能源发电技术与新能源汽车的发展现状、存在的挑战进行
阐述。以新能源发电技术与新能源汽车的大规模串联电池组的一致性问题作为切入点,
引出解决锂离子电池组一致性问题的两个关键技术:电池管理系统(BatteryManagement
System,BMS)和电池分选技术。其次,介绍了锂离子电池组的BMS和电池分选技术对
推动新能源发电技术与新能源汽车进一步发展的重要意义。接着对锂离子电池组BMS
中的健康状态(StateofHealth,SOH)估计技术以及电池分选技术的国内外研究现状进行
随着人类社会的经济、科技的不断进步,能源作为推动社会发展的动力,在人类生
产生活中扮演不可或缺的角色,经济社会的快速发展也使人类对能源的需求越来越高。
化石燃料是人类使用最多的能源之一,人类生活水平的提高离不开化石燃料的开发利用,
但是大量地使用化石燃料也造成了严重的环境污染和能源短缺问题。研究表明,工业污
染、工业扬尘、燃煤燃油污染和机动车尾气等污染物的大量排放是我国各省各地频发雾
霾天气的根本原因。降低我国工业、发电和交通用能中化石燃料的比重,可以有效解决
发展新能源发电技术、新能源汽车是解决大量使用化石燃料带来的环境问题的一个
重要措施。新能源发电系统利用风能、太阳能、潮汐能等清洁能源发电,但由于风力、
光照的间歇性与波动性,新能源发电直接并网会对电网造成冲击,导致新能源发电得不
到大范围应用。为新能源发电系统配置电池储能装置,配合电力电子技术,可以提高
电能质量,实现“削峰填谷”,削弱新能源发电的间歇性与波动性的影响。由于成本和
性能等方面与传统燃油汽车的差距,电动汽车从20世纪20年代开始至今在市场中的竞
争一直处于劣势。随着电池技术与世界汽车工业的高速发展,伴随着全球环境的持续
恶化,电动汽车因为其“零”排放的特点,再一次引起人们和世界各国的关注。电动汽车
的核心装置是储能装置,动力电池作为最常用的储能装置,提高电池组可用容量、延长
使用寿命是新能源汽车实现技术突破和成本降低的最大瓶颈。相比于镍镉电池、镍氢电
池和铅酸电池,锂离子电池在循环寿命、质量比能量和体积比能量上有优势,因此锂离
子电池的应用开始从便携式电子产品、通讯设备和航天设备等领域逐渐拓展到储能电站、
无论是新能源发电系统中的储能装置,还是新能源电动汽车中的动力电池组,锂离
子电池作为蓄能设备都起到关键作用。锂离子电池组在使用的过程中,根据不同的负载
与应用场合,有不同的负载电流、负载电压和容量要求。单体电池的电压和容量较低,
以目前商用电池中,能量密度最高的NCA18650锂离子电池(LiNiCoAlO)为例,
该电池单体标称容量为3350mAh,电压范围为2.5V~4.2V。因此一般情况下,需要将电
池单体进行串并联组成电池组,以达到需要的电压等级和容量。例如:南方电网兆瓦级
电池储能站的容量为5MW*4h,接入广东深圳电网110kV变电站10kV侧;深圳宝清
18650型锂离子电池串并联组合成的电池包供能,可提供85kWh的电量,续航里程最高
为480km[9];比亚迪e6采用单个电池电压为3.3V的磷酸铁钴锂离子电池作为动力源,
在电池组的使用过程中,由于电池工作条件、电池制造工艺等的不同,锂离子电池
组内各电池单体存在容量不一致性、能量不一致性、参数不一致性等。不一致性是指同
一规格类型的蓄电池组成电池组后,随着电池的使用次数不断增加,各单体的电池电压、
阻及其变化率等参数不完全相同。锂离子电池单体之间的不一致性会使组合成电池
PACK后的整体性能下降,电池PACK中性能好的电池单体受限于性能差的电池单体,
无法达到单体电池的性能标准,出现“1+12”的现象。这无疑使锂离子电池的使用成本
造的过程中受限于制造工艺,同一型号的电池单体在容量、内阻变化率和自放电率等方
面存在差异;外部因素主要是电池组在工作时,由于电池单体的外部环境存在差异,如
管理。如图1-1所示,BMS具有若干功能,其中主要包括电池电压、电流、温度等数据
的采集、储存与通信、电池的SOC、SOH、SOP、SOE的估计、电池均衡管理、电池热
管理、电池充放电管理和电池安全保护管理。根据各功能的特点,可将BMS的功能分
为电池状态检测、电池状态估计和电池优化管理三个模块。可靠的BMS不仅可以有效
发挥串并联电池组的最大可用容量,准确估计电池组SOC、SOH、SOP、SOE等,还可
以延长电池的使用寿命,指导用户对电池的使用,保证其安全性,是电动汽车和新能源
发电系统的储能装置的重要部件。由此可见,研发高性能的BMS对于推动电动汽车的
电池组一致性问题除了需要BMS对电池进行实时管理,还需要在电池成组时从内
部因素中保证同一组内的电池单体高度相似。在电池电芯生产厂家无法继续提高生产过
程中电池的一致性时,就要求在电池成组前对电池进行分选,使性能相近的电池单体组
合成电池PACK。电池分选技术正是基于这样的情况下提出的。除了在新电池分选时的
应用,电池分选技术在指导电池组中电池单体的更换、退役电池的梯级利用等方面均有
重要作用。目前,对锂离子电池的筛选与优化再分选技术在动力电池领域的应用还处于
摸索阶段,虽然前景广阔,但是实践起来有一定难度,主要原因在于缺乏可靠的分选
本人所在的实验室承担一项广东省重点领域研发项目《分布式智能充电关键技术研
发及产业化》(项目编号:2019B090911001),内容包括优化锂离子电池组的关键技术研
锂离子电池的充电与放电过程并非完全可逆,每一次充放电的循环,都会导致锂离
子电池内部电极活性材料溶解及存量锂离子出现不可逆的消耗和损失,对外则表现为
电池有效容量的衰退。研究锂离子电池的SOH估计方法,可以为BMS电池优化管理模
块提供健康状态参考。当锂离子电池的SOH下降到一定程度时,为了保证电动汽车的
锂离子电池的SOH,表面是电池健康状况的综合表现,包括功率、内阻、有效容量
等参数,更多情况下特指电池的有效容量。通常SOH定义为测量容量与额定容量的比
值。但是由于电池的测量容量需要在标准放电条件下将满充状态的电池进行完全放电,
并测量该过程的放电容量,因此这种定义方法应用于电动汽车有不小的困难。由于在电
池老化的过程中,通常伴随着电池内阻的增大,因此不少研究也从锂离子电池内阻入手,
建立锂离子电池的内阻变化与SOH变化的映射。但是这种定义法的前提是对电池内阻
进行精确检测,而电池的内阻数值与电池端电压、开路电压(OpenCircuitVoltage,OCV)、
充放电电流等参数有关,且锂离子电池的SOC值不同时内阻值也会有区别。精确测量
电池内阻需要设计一套内阻测量系统,如文献[15]将脉冲电流施加在锂离子电池上,利
用锂离子电池极化过电压和弛豫时间计算电池内阻,进而用于估计电池SOH。此外,有
学者分别提出从电池剩余可循环次数或者峰值功率的角度计算SOH,将SOH定义为电
池当前剩余可循环次数与新电池剩余可循环次数的比值。这些定义方法虽然角度新颖,
目前锂离子电池SOH定义的数学表达式可以总结为以下四种方式[14-16]:
(1)基于容量的SOH:电池健康状态的原始含义就是反映电池当前的最大储存电量
能力,因此,基于容量的SOH将当前锂离子电池从100%SOC以一定倍率的电流放电
至0%SOC所放出的电量,或者将电池从充电上限截止电压以一定倍率的电流放电至放
其中,Cnew是新电池最大可用容量,通常为出厂标称容量,Cnow是电池当前最大可
用容量。SOHc以百分比的形式反映电池目前储存电量的能力,这种定义方法能最直观
的反映出电池的健康状态。就新电池而言,其一般等于或大于100%,伴随电池的使用
离子蓄电池行业标准第6.2.11款中指出,在电池容量降低到80%,即SOH80%时,电
SEI)的形成,电池的内阻会随着充放电次数的增加而增大。从电池内阻的角度出发,认
其中,Rnow为电池当前状态欧姆内阻,Rnew为电池出厂状态的欧姆内阻,Rold为电池
最大可用容量下降到80%时的欧姆内阻。根据电池内阻的变化,判断电池的健康状态,
检测电池的性能,进而预测电池的故障是非常有效的。以大量的试验结果为依据,关于
电池内阻和电池故障有这样的经验结论:当电池内阻值增大25%左右时,预示电池有潜
在的故障;当内阻值增大50%左右时,电池已有严重故障;当内阻值增大100%及以上
(3)基于峰值功率的SOH:电池在不同状态下能输出的最大功率不同,因此,SOH
反映电池在一定条件下能够输出的最大功率。在电动汽车用锂离子动力电池领域,有些
其中,Pmax为当前状态下,锂离子电池能够输出的最大功率,Pmin为新能源汽车在
标准条件下启动所需的最小功率,Pnew为锂离子电池出厂时,在满电量下能够输出的最
大功率。显然,锂离子电池在不同电量情况下峰值功率不同,用SOHp定义电池的健康
状态,会导致在相同的储存电量能力下,不同的电量情况得出不同的健康状态。这不符
(4)基于剩余循环次数的SOH:每个锂离子电池都有充放电循环次数的限制,通常
其中,T表示待估计电池当前可进行的最大循环次数,Tall表示新电池能够循环的总
次数。显然,影响电池寿命的因素很多,包括环境温度、震动、充放电电流倍率等,这
些因素也在时刻发生变化,无法预测电池未来的使用环境,更无法预测电池的剩余循环
次数。此外,不同的放电深度(DepthofDischarge,DOD)对剩余循环次数的影响也是不同
由上述理论归纳可知,基于容量的SOH更适合用于衡量电池储存电量的能力,被
广泛使用于电池健康状态的衡量。因此,如无特别说明,后文的SOH均指代基于容量
如图1-2所示,目前锂离子电池SOH诊断方法主要有:实验测量法[19-23]、模型驱动
实验测量法是指在特定条件下,利用特定的实验测试装置,分析锂离子电池内部的
电化学特性,直接对锂离子电池的健康状态进行测试。实验测量法可以直接获得与电池
老化状态相关的参数,如电池内阻、电解液浓度、电极活性、固体电解质界面厚度等,
分析电池的衰减程度及老化机制,诊断电池当前的健康状态。实验测量法可以分为破
破坏性检测法,也称为有损检测法,主要是对锂离子电池进行拆解分析,分别对锂
离子电池的正负电极、电解液、隔膜或产气进行测试,获得锂离子电池的健康状态信息
[19]。将锂离子电池拆解后,常用的分析方法或检测装置有扫描电镜(ScanningElectron
对老化的锂离子电池进行了全面的分析,从锂离子电池的正负极材料、电解液等切入,
对锂离子电池的老化机理给出了电化学领域的解释。破坏性检测法能获得最准确的电池
老化信息,但是,对锂离子电池进行拆解分析后,也意味着被拆解的锂离子电池无法再
进行使用。通过对锂离子电池的拆解,文献[21]总结了造成锂离子电池SOH衰退、寿命
受损、可用容量下降的原因,主要包括锂离子电池电极材料的溶解、电解液发生还原反
非破坏性检测法,也称为无损检测法,是在不破坏锂离子电池物理结构的前提下,
采用特定的测试手段,分析锂离子电池的衰减程度,进行电池健康状态诊断的方法。
电池进行特定条件的全充放电测试,分析锂离子电池的衰减程度,进行SOH诊断。
综合上述分析可知,基于实验测量的锂离子电池SOH诊断方法,一方面具备其他
方法所不具备的优势,即可以分析锂离子电池老化的具体机制,SOH诊断结果最可靠。
另一方面,实验测量法也具有一些不可避免的弊端,即破坏性实验会破坏锂离子电池的
物理结构,使被测试的电池损坏,无法继续使用;而非破坏性实验对测试数据的精度要
求较高,对测试环境的要求也很高。同时,不论是破坏性实验还是非破坏性实验,都需
要特定的高精度测试设备,在特定的环境下诊断锂离子电池SOH,研究成本高、周期长。
因此,通过实验测量法的进行SOH诊断的方法更适合于电池产品的研发和实验室研究,
或为模型驱动法和数据驱动法提供SOH真实值,实现工程在线SOH估计的难度较大。
模型驱动法通过建立锂离子电池的等效模型,模拟锂离子电池内部结构及材料之间
的相互作用关系,或模拟电池充放电时的端电压、端电流关系,也被称为等效模型法。
电池内部的电化学微观机理十分复杂,而SOH作为电池内部特性的特征参数,无法通
过测量直接获得。建立等效模型,通过模拟锂离子电池容量衰退趋势,或模拟锂离子电
池的充放电行为,可以分析电池外特性参数与电池内部机理之间的关系。结合拟合算法
或参数辨识算法,建立电池外特性参数与锂离子电池容量衰退之间的映射关系,是模型
学机理模型从机理层面描述锂离子电池的充放电过程的特性,包括基于SEI的模型、基
于单因素电化学机理模型、多因素复杂电化学机理模型。等效电路模型属于经验模型,
主要以多阶RC等效电路为主。不同于电化学模型研究电池内部微观反应,等效电路模
相比于电化学机理模型,等效电路模型只需要少量的输入,就能获得很好的参数回
归性能。因此在电气工程领域,等效电路模型被广泛用于模拟锂离子电池的充放电特性。
F.Sun、R.Xiong等人基于一阶RC电路构建了锂离子电池的等效电路模型,并利用
单的电路拓扑模拟锂离子电池的主要动力学效应,具有易于收敛的优点,是目前使用
最多的锂离子电池等效电路模型。然而,D.V.Do等人研究指出,锂离子电池一阶RC
等效电路模型不能反映电池的低频响应、扩散现象以及其他一些动态效应,这会导致模
型的输出和参数识别结果产生误差。因此,有学者提出了锂离子电池多阶RC等效电路
模型[30-31]。多阶RC等效电路模型在模拟电池充放电行为方面比简单的一阶RC等效电
路模型具有更好的性能。然而,RC阶数的增加使得有更多的参数需要识别,导致计算
模型驱动法具有结构简单、动态响应特性良好、便于嵌入电池管理系统等优点。但
是,模型驱动法的估计误差很大程度上取决于模型结构。为了实现高精度的SOH估计,
模型驱动法需要不断增加模型参数,这使得计算量大大增加,且模型参数误差会不断累
数据驱动法将锂离子电池看作一个黑箱子,仅从端口观察电池数据。不同于模型驱
动法需要精确的建模,数据驱动法不需要了解锂离子电池的内部化学反应和容量衰退机
制,因此数据驱动法成为一个研究热点。数据驱动法通常先构建一个粗糙的模型,随机
初始化各项参数,然后通过大量数据训练使各项参数与训练数据逐渐一致,并利用训练
迭代好的参数进行SOH估计。数据驱动法的输入通常为锂离子电池在实际运行过程中
能直接测得的端电流、端电压、外壳温度以及BMS提供的电池初始容量、SOC、等效
阻抗等数据。根据采用的智能学习算法的原理,又可以将数据驱动法分为基于人工智能
的方法、基于滤波器的方法、基于统计数据的方法和基于时间序列的方法[32-38]:基于人
Yang等人以一阶RC等效电路模型的参数和SOC作为输入,提出了一种基于误
人研究发现锂离子电池在不同老化状态下,电压平台起始时间、电压平台持续时间、
电压快速抬升点和充放电曲线长度等特性不同,因此将恒流充电过程中的电池端电压作
作为输出。此外,许多研究人员着眼于改进人工神经网络,提出了许多其他类型的神经
网络,或从神经网络的输入数据入手,提出了许多精度更高的SOH估计方法。这些研
究的输入数据包括平均充放电电压、总充电时间、电压峰值、电池阻抗相的零交叉频率、
温度、恒流充电时间、放电开始时的瞬时电压降、开路电压等中的一项或几项[41-44],辅
LSTMNN)[47]等,进行SOH估计。这些方法都取得了不错的估计精度,但是这些方法使
用的输入数据,如总充电时间、电池阻抗相的零交叉频率、恒流充电时间、放电开始时
数据驱动法估计SOH的优势在于不需要了解分析电池内部的老化机制,易于使用
的同时能获得不错的SOH估计精度。但是,数据驱动法使用的输入数据通常难以获得。
除了实验测量法、模型驱动法和数据驱动法,近年来,基于增量容量分析(Incremental
池SOH的方法引起研究者的重视。增量容量分析法通过差分将锂离子电池恒流充电阶
段低维的电压-容量曲线转化为高维的IC曲线,然后根据特征点估计SOH[48]。IC曲线
能将恒流充电过程的电压平台阶段以清晰可见的峰的形式呈现,将电压快速上升的阶段
以低谷的形式呈现,而DV曲线是IC的倒数。TANG、Li等人[49-50]证明了恒流充电阶段
的IC曲线的峰值位置和强度与锂离子电池SOH的衰退存在紧密联系。然而,将IC曲
线的峰值位置和强度作为健康因子估计SOH容易受到放电深度(DOD)的干扰。用以估
计SOH的IC曲线电压范围内至少需要存在一个峰。这也限制了增量容量分析法和差分
锂离子电池的老化是限制电动汽车使用寿命的一个不可避免的必然因素。准确预测
SOH可以提高电池的整体寿命,并支持电动汽车的安全驾驶。目前,虽然SOH的预测
目前,锂离子电池SOH的衡量指标主要有四种,分别为基于容量的SOH、基于内
阻的SOH、基于峰值功率的SOH和基于剩余循环次数的SOH。其中,基于容量的
SOHc能直接反映电池的容量状态,最符合锂离子电池老化状态的定义,被广泛使用于
在SOH估计方法方面,根据各方法的原理,可以将这些方法归类为实验测量法、
模型驱动法、数据驱动法以及其它估计法。不同的SOH估计方法各有优缺点,表1-1总
(1)实验时间受限。不同品牌、不同类型的锂离子电池容量衰退机理不同,如对所有
(2)在线估计数据获取难。锂离子电池SOH在线估计属于BMS的子功能,SOH在
线估计算法的输入数据全部来源于BMS,因此实现锂离子电池SOH在线估计需考虑实
际运行中BMS能采集的数据类型。对于需要获得复杂健康因子进行SOH估计的算法难
以实现在线)电池运行环境多变。目前锂离子电池SOH估计的研究大多基于实验环境,电池
运行环境稳定可控。而实际工况中,锂离子电池的充放电情况、环境温度、震动等情况
(4)电池历史数据丢失。实验环境下,锂离子电池全寿命周期的运行数据得以记录,
而实际工况下,电池BMS的内存容量有限,通常需要丢弃较早保存的数据,增大了SOH
另外,文献[51]中指出,锂离子电池的不同充放电环境也会影响锂离子电池SOH估
计的准确性:对于实验测量法,锂离子电池不同的充放电环境对SOH估计的影响不大,
因为实验测量法要求在特定条件下对电池进行充放电实验,可以得到最准确的SOH值;
对于模型驱动法,通常所建立的模型只对应特定条件下的电池,当电池外部环境改变,
如温度变化、受到机械振动等,会使模型参数改变,进而使SOH估计出现偏差;对于
数据驱动法,当外部环境改变后,如果训练数据包含相应环境情况下的电池数据,数据
综上所述,在研究锂离子电池SOH衰退机理的基础上,选择合适的健康因子与健
康因子提取方法、建立健康因子与SOH衰退机制的拟合模型,建立锂离子电池大数据
电池分选技术是指利用一定的技术手段,根据一定的电池特征参数,将大量电池中
性能与其它电池单体差异过大的电池单体筛选出来,将性能相似、特性相近的电池单体
分选为一组,为后续电池单体组合成PACK提供依据。目前,实现电池分选主要需要解
决两个问题:一是确定用于度量电池相似度的特征参数;二是基于电池特征参数选择分
锂离子电池的电性能参数主要包括开路电压(OpenCircuitVoltage,OCV)、工作电压、
(1)OCV:锂离子电池的开路电动势是指外电路电流为0时,经过足够长时间的静置
后测得的电池正负极之间的电位差。锂离子电池的OCV与电池的SOC有关:SOC越
大,OCV越高,但二者并非线)工作电压:锂离子电池的工作电压包括充电电压和放电电压。充电(放电)电压是
指当电流从锂离子电池正极流入(流出)从负极流出(流入)时,电池正负极之间的电位差。
充电(放电)电压通常高(低)于OCV,即电池充电(放电)时存在电压“虚高(虚低)”现象,电
池停止充电(放电)后会出现电压“回落(回弹)”现象。充电(放电)电压的“虚高(虚低)”现象
与充电(放电)电流大小有关:充电(放电)电流越大,“虚高(虚低)”现象越严重。
(3)电池内阻:电池内阻是反映电池性能好坏最重要的参数之一。电池内阻过大除了
会导致电池工作电压的“虚高(虚低)”更严重以外,也是电池工作时发热的主要来源。
(4)比容量:电池在一定条件下能储存的总电量与电池质量或体积的比值。用于反映
(5)比功率:电池在一定条件下单位时间能输出的能量与电池质量或体积的比值。
(6)库伦效率:电池在一定条件下放出的电量与充入的电量的比值,也叫充放电效率。
库伦效率除了能作为反映电池寿命的重要参数以外,还能反映其充放电的可逆性。
(7)自放电率:自放电是指电池外电路开路时,在一定条件下储存一段时间后储存的
除了上述描述电池常用的参数以外,电池的充放电曲线、电压平台、增量容量曲线
目前锂离子电池的分选方法根据选择的特征可分为单一特征分类法、多特征分类法。
单一特征分类法只采用单一特征作为电池分选依据,通常为电池容量或内阻等。由
于使用单一特征进行分类难以全面反映电池特征,其分类结果可靠性不高,因此研究者
多特征分类法综合考虑电池能获取的多项特性参数进行分类。文献[55]基于电池充
放电曲线的电压、电池容量、充放电时间实现了快速分类。文献[56]根据电池充放电的
电压均值和容量,结合电池的概率密度函数和阈值准则实现了电池分类。但是上述方法
通常需要基于专家库进行分类阈值的设定。当阈值的设置太小时,会导致电池分选种类
增多,间接导致电池组合成电池PACK的成本增加;而过大的阈值无法达到提高电池一
致性的目的。为了改进上述缺点,文献[57-58]等以充电电压曲线的相似度、电池健康状
态等参数,结合神经网络或支持向量机实现电池分类。基于机器学习的方法比传统的人
为设定分类阈值的方法具有更高的精度,但是基于机器学习的方法需要提前对模型进行
近年来,基于无监督聚类的电池分选方法得到高度关注。无监督聚类的算法无需提
前知道样本的分类类别,也无需对样本进行标记,算法通过自学习自动挖掘出样本的类
别特征。常见的无监督聚类算法包括K-means聚类、层次聚类、高斯混合模型聚类等。
文献[59]利用最小二乘算法辨识电池的动态特征阻抗、静态特征开路电压和极化电阻,
基于高斯混合模型对电池实现了无监督分类。文献[60]对比了主成分分析法(Principal
和随机森林(RandomForest,RF)三种无监督聚类方法在锂离子电池分类中的应用。结果
目前,锂离子电池分选技术仍处于探索阶段,现有分类方法存在以下问题需要解决:
(2)机器学习算法需要对训练样本进行标签,人为标定样本类别的准确性将大大影响
(4)分选时为了获得电池特征,通常需要进行多次完整的充放电,耗时长且对能量的
针对锂离子电池SOH估计领域,提出一种基于增量容量曲线与BP神经网络的SOH
在线估计算法。该算法考虑到了实际工况下BMS可获取的电池数据有限的问题,仅利
针对锂离子电池分选技术领域,研究一种基于电池充电曲线特征的无监督分选方法。
为了实现这一目的,将锂离子电池的恒流充电阶段的增量容量曲线作为分选特征。通过
度量曲线之间一致性的依据。最后利用自下而上的层次聚类法将DTW距离相近的电池
曲线分为一类。该方法将所有电池曲线利用树状结构进行分类,无需提前确定最终的种
第一章从环境问题入手,引出发展电动汽车和新能源发电技术的重要性。阐述了锂
离子电池组作为电动汽车的动力源,目前存在的一致性差的问题。之后分别介绍了影响
电池组一致性的外部因素和内部因素,引出改善电池组一致性的锂离子电池SOH估计
技术与锂离子电池分选技术。然后对锂离子电池SOH估计技术与锂离子电池分选技术
第二章提出了一种基于增量容量曲线与BP神经网络的SOH估计融合算法。首先
对增量容量曲线的计算、高斯滤波的原理和BP神经网络的相关公式进行推导。然后介
绍了所提出的SOH估计算法的流程。最后利用NASA开源电池数据集进行仿真验证。
第三章提出了一种基于层次聚类的电池分选方法。首先对动态时间弯曲距离的计算
方法和自下而上的层次聚类方法的原理进行介绍。然后对提出的电池分选方法的流程进
第四章对第二章提出的SOH估计方法和第三章提出的电池分选方法分别进行实验
验证。首先,本章介绍了电池实验平台以及实验中使用的电池信息。其次,对电池SOH
估计算法验证实验和电池分选方法验证实验进行展开。在电池SOH估计方法验证实验
中,首先介绍了电池老化实验的方法。然后对实验结果及SOH估计结果进行讨论。在
电池分选方法验证实验中,首先介绍了分选实验流程,然后讨论分选结果,验证所提出
本章首先介绍了SOH估计的基本情况,然后提出一种基于增量容量曲线与BP神
经网络的SOH估计算法。接着介绍了IC曲线的获得方法,并引入高斯滤波消除噪声。
然后介绍了BP神经网络的结构与相关公式。最后介绍了算法流程,并利用NASA实验
本章的研究目标是提出一种适用于锂离子电池在线估计SOH的算法。在第一章中
对锂离子电池SOH估计算法进行了综述。目前已有的研究成果大多使用低维健康因子
估计SOH。低维健康因子包括锂离子电池的历史充放电电压、充放电电流、充放电时间
和温度等。虽然低维健康因子在实际电池系统中很容易获得,但是低维健康因子很难与
锂电池SOH的变化趋势建立联系,且容易受测量误差的影响。此外,低维健康因子,
如锂离子电池恒流充电时长,要求完整的充电过程,即从0%SOC经过恒流恒压过程充
电至100%SOC,并计算恒流充电持续时间。然而,由于电动汽车车主的“电量焦虑”现
象,实际充电既不会从0%SOC开始,也不会充电至100%SOC结束。此外,也有研
究以复杂健康因子作为估计SOH的依据。复杂健康因子主要指锂离子电池等效电路参
数。通过建立锂离子电池等效电路参数与电池老化状态的映射进行SOH估计,但是复
杂健康因子需要在特定的充放电条件下进行参数辨识,或使用特定的仪器设备测得。因
此,使用低维健康因子或复杂健康因子进行SOH估计的方法无法应用于SOH在线估
在电动汽车的实际使用过程中,电池的放电行为与汽车的启动、加速、减速、平缓
行驶密切有关。当电动汽车刚起步或者加速时,需要电池提供更大的功率和更大的电流
驱动电机以输出更大的驱动力。当汽车减速时,电池会回收一部分能量。而当汽车平缓
行驶时,电池只需要提供很小的电流就足以维持电动汽车的运行。这些行为出现的频率
很大程度上取决于驾驶者的驾驶习惯以及路况,充满不确定性。但是,电动汽车电池的
充电行为通常是稳定的,即都以恒流恒压模式或者恒功率模式充电。因此,相比放电过
上文中提到,基于ICA估计锂离子电池SOH是目前较热门的方法。相比于低维的
充电曲线,ICA通过差分将充电曲线转化为峰谷特征明显的IC曲线]将IC曲
线分段,并计算各段IC曲线与坐标轴所围的面积大小,并将该面积映射到各SOH值,
将SOH估计误差控制在±2.5%以内。但是,当分段数量较少时,该方法会损失较多IC
曲线的峰谷信息进而导致误差增大;当分段数量较多时,该方法无法同时协调各分段间
的SOH关系。以IC曲线的峰谷位置和强度估计锂离子电池SOH要求一定的放电深度,
然而由于“电量焦虑”现象,用户的充电习惯会影响充电的起始SOC或者起始电压,即使
是相对稳定的充电过程,充电过程的SOC区间或者电压区间仍存在差异,实际放电深
度并不一定能达到可以估计SOH的要求。这是利用充电过程估计SOH需要解决的问
为了克服这一缺点,本章提出一种基于增量容量曲线与BP神经网络的SOH估计
融合算法。本章提出的SOH估计算法将IC曲线根据电压进行分段,将分段后的IC曲
线分别作为BP神经网络的输入进行SOH估计,并取分段后最完整的IC曲线的SOH估
本节首先介绍IC曲线的获取方法,然后对比不同SOH下的IC曲线获得的电池老
IC曲线通过对电池容量的变化和电池端电压的变化进行差分计算获得。IC曲线的
其中,Q、V和t分别表示第k个采样点的电池电量、电池端电压和时刻。N表示
差分窗口。i表示充电电流。当采用恒流充电阶段计算IC曲线且采样频率固定时,公式
其中,I表示恒流充电电流。Δt表示采样间隔。I和Δt都是定值。从公式(2-2)可以
看出,恒流充电阶段的IC曲线的形状只与充电电压曲线的斜率的倒数有关。当电压变
化较缓慢时,反映在IC曲线上即为峰。当电压快速上升时,反映在IC曲线上即为谷。
而电压变化的特征与SOH的变化紧密相关,因此,IC曲线比电压曲线更能反映电压变
差分窗口N的取值会影响IC曲线的获得。当N很小时,第k个采样点和第k-N个
采样点的电压差值会很小,进而导致IC曲线的变化很大,会出现很多噪声,不便于观
察IC曲线的特征。而当N很大时,虽然IC曲线更平滑,但是损失了IC曲线的特征。
为了兼顾保留特征和消除噪声,本研究首先取一适当小的N值计算IC曲线,再利用高
其中,μ是平均值,σ是标准偏差,控制滤波窗口大小。由于越靠近中心的点贡献
人工神经网络是一种模仿人神经元传递信息,使计算机能像人一样思考的人工智能
算法。BP神经网络通常分为三层,如图2-1所示,分别为输入层、隐藏层和输出层。其
在训练时,BP神经网络根据权重系数逐层向前推进,并根据误差反向传播算法动
态调整各层的权值和偏置。通过不断的训练,使神经网络各层参数逐渐收敛。BP神经
其中,a表示第m层的输出矩阵。W表示第m层对第m-1层的权重矩阵。b表示
第m层的偏置矩阵。σ(·)表示激活函数。激活函数可选择Sigmoid函数、tanh函数、relu
函数等。为了方便后文求取损失函数的梯度,综合考虑数据特点后,本研究选择tanh函
其中,aL表示第L层,即最后一层的输出。y为样本标签。S为S的L2范数。求
接着依次反向求解损失函数对第L-1层、L-2层的梯度。对任意第m层,有如下递
有了公式(2-8)、(2-9)所表示的递推公式,再通过公式(2-6)、(2-7)求出第L层的梯度,
即可反向求解各层的梯度。对第m层利用梯度下降法更新b和W,即完成一次训练过
程。通过迭代更新各层的权值矩阵W和偏差矩阵b,不断提高神经网络的预测精度。当
训练次数达到设定的阈值,或预测精度达到设定的阈值时,停止训练过程。这表示该BP
BP神经网络的输入层和输出层的节点数由输入数据和输出结果的维数决定,通常
不能改变。而隐藏层节点数对SOH估计结果有很大影响。隐藏层中节点数量过多不仅
会增加计算复杂度,还可能导致BP神经网络的过度拟合。然而,如果隐藏层节点数量
太少,会使得BP神经网络无法建立IC曲线变化与SOH下降之间的关系。因此,确定
合适的隐藏层节点数对提高SOH估计的精度具有重要意义。目前,对于BP神经网络隐
其中,n表示隐藏层中的节点数。n表示输入层中的节点数。n表示输出层中的节
点数。α是一个介于1到10之间的常数。为了确保后续比较的公平性,本研究后续部分
本研究提出基于增量容量曲线与BP神经网络的SOH估计融合算法流程如图2-2所
示。SOH估计算法分为两个部分,一是BP神经网络的训练,二是SOH估计。
在BP神经网络的训练部分,首先获取IC曲线并进行高斯滤波。由于实际电动汽车
的使用中,锂离子电池的放电深度不同,因此恒流充电的起始电压不同。以美国国家航
空航天局(NASA)[62]的公开电池实验数据为例,该数据集一共有12节电池共1500余条
充放电循环数据,剔除无效循环后,有效循环数据为825条。这12节电池的放电条件
在放电截止电压、放电电流、放电温度等方面均不同,其中,放电截止电压设置了2.0V、
2.2V、2.5V和2.7V四个等级。由于数据集中大部分数据均包含3.8V至4.2V电压区间
的恒流充电数据,为了克服放电截止电压和充电起始电压不同的问题,本研究提出的算
信息如表2-1所示。后文将讨论不同分段的IC曲线对SOH估计的误差的影响。
对IC曲线分段后,分别将每段IC曲线作为BP神经网络的输入。为了防止BP神
经网络在训练时出现过拟合,网络的输入层不能设置过多节点。因此,需要将每段IC曲
梯形近似代替。再将这四个面积作为BP神经网络的输入层数据,进行BP神经网络的
训练或SOH的估计。在本例中为了方便描述,将采样间隔取为0.05V。在实际操作中,
为了尽可能保留IC曲线的信息,应将采样间隔取得更小。但是采样间隔的缩小会导致
神经网络的输入层节点数增加,如同样是电压范围3.80V至4.00V的IC曲线V时,神经网络的输入层节点数分别为4、10、20。输入
层节点数过多会导致神经网络训练困难,甚至出现过拟合。因此后文将讨论采样间隔对
当BP神经网络的训练误差小于设置的误差阈值时,表示该网络训练结束并保存神
在SOH估计部分,IC曲线的获取、高斯滤波、分段、标准化方法与训练流程相同。
然后根据分段信息,将IC曲线输入对应的分段训练好的BP神经网络,并输出SOH估
本章以NASA的公开电池实验数据集作为仿真数据,验证本研究提出的基于增量容
表2-2为NASA电池实验数据集各电池的实验条件信息,其中方波电流指50%占空
比、0.05Hz的方波电流。该数据集的电池充放电条件涵盖了2.0V、2.2V、2.5V、2.7V的
放电截止电压,2A、4A恒流以及方波形式的放电电流,24℃和43℃的实验温度等条件。
该数据集使用的电池容量为2Ah。利用该数据集可以模拟电池在多种充放电条件下的老
以看出,SOH值越大,恒流充电曲线越靠近右下方,且充电起始电压越高。因此,对于
SOH较差的电池而言,如果要求作为输入的IC曲线包含低电压区间的信息时,会导致
信息缺失。因此,2.3节提出的处理方法能有效避免低SOH电池IC曲线信息缺失的问
图2-5不同SOH时的恒流充电曲线还可以发现,SOH值越大的充电曲线,进入电压上升缓慢的电压平台期
对应的电压转折点越低,且恒流充电阶段持续的时间更长。当SOH分别为100%、95%、
3.85V、3.87V和3.90V。这说明健康情况越好的锂离子电池在恒流充电时充入相同电量
的情况下,电压上升越慢。也就是说,SOH越好的电池,能储存的能量越多,这一结论
图2-6不同SOH时的未滤波的IC曲线的恒流充电曲线)进行计算,得到各充电曲线对应的IC曲线节分析的,dQ/dU值越大,表示电压上升越快。从IC曲线
SOH分别为100%、95%、90%、85%、80%和75%的电池的IC曲线V时开始增大,与进入电压平台的电压基本一致。
也即说明,SOH越好的电池,进入电压上升缓慢的电压平台对应的电压越低。此外,在
3.8V-4.2V电压区间,SOH越差的电池,IC曲线和横坐标所围的面积越小。因此,不论
是IC曲线的峰谷特征还是IC曲线与横坐标包围的面积,均包含了SOH老化信息,可
以用IC曲线可以看出,虽然IC曲线在电池不同健康状态下的特征不同,但是未滤波
的IC曲线存在许多高频噪声,不能直接用于估计SOH。将图2-6的IC曲线进行高斯滤
图2-7对比了不同高斯滤波标准差对滤波结果的影响。高斯滤波标准差用于控制滤
波窗口的大小,σ越大,则滤波窗口越大,滤波窗口中心的点贡献越小,曲线越平滑,
是许多峰谷特征也随之丢失。因此,综合考虑滤波效果与信息保留,如无特别说明,本
从图2-7(c)可以清楚地看到,当锂离子电池SOH为100%时,IC曲线V处各有一个峰。随着SOH的衰退,IC曲线的峰的强度逐渐降低,
直至消失。此外SOH从100%衰退到75%时,IC曲线与横坐标包围的曲线的面积也逐
从前一小节的讨论可知,经过高斯滤波后的IC曲线包含了锂离子电池SOH衰退的
用训练好的BP神经网络进行SOH估计。本小节对比不同电压段的输入对SOH估计结
果的影响。在第2.3节的表2-1中介绍了3.8V至4.2V的IC曲线的分段信息。
其中,n表示样本数量,表示第i个样本的SOH估计值,y表示第i个样本的SOH
计的总体平均相对误差最小的电压区间为3.85V至4.05V,为1.75%。而IC曲线
范围为4.00V至4.20V时,SOH估计误差最大,因此4.20V附近的IC曲线不适合用于
此外,从表2-3还可以看出当IC曲线的区间长度越长,SOH的估计误差越小。这
说明电池充电持续时间越长,充电曲线越完整,越有利于SOH的估计。因此在实际应
用时,应根据充电曲线包含的电压范围,尽可能选取更大的电压范围的IC曲线进行SOH
估计。而当电池充电持续时间较短时,选择电压范围较窄的IC曲线进行SOH估计,其
总体估计误差也在可接受范围内。本研究提出的SOH在线估计算法正是基于这样的思
0.02V时,不同实验条件下各电池的估计结果平均相对误差。可以看出,不论IC曲线的
电压范围是多少,第一组电池中的电池Cell2的估计误差最大。原因在于,第一组电池
中的Cell2的放电电流为2A,放电截止电压为2.0V。相比于放电截止电压为2.2V、
2.5V、2.7V的电池,该电池的放电深度最大。放电深度大导致了电池SOH迅速下降,
因此放电深度大的电池数据占比较少,进而导致了估计误差的增大。此外,由于放电电
流为2A,相比于同样放电截止电压为2.0V的第二组电池的Cell1和第三组电池的Cell
1,电池#1-2需要放出更多电量。如图2-9为电池#1-2、#2-1、#3-1第一次放电时的电压
曲线,三个电池单体的放电容量分别为1.8808Ah、1.8470Ah、1.8013Ah。由于电池在放
电时存在端电压“虚低”的现象,如图2-9的放大框图所示,因此电池#2-1在放电电流方
波的高电平期间,存在电压骤降,在低电平期间电压得到恢复。由于端电压“虚低”现象,
同样是放电至2.0V,大电流放电时的电压“虚低”现象更严重,这导致了电池#3-1放电容
量更少,即电池#1-2的放电深度最深,因此电池#1-2的老化速度更快,SOH估计的误
图2-9电池放电电压曲线节电池单体在电压采样间隔0.02V、IC曲线V时的SOH估计结果。其中,横坐标表示充放电循环次数,纵坐标表示
SOH值;蓝色实线表示SOH真实值,红色“*”表示SOH估计值。可以看出,对于第一
组实验条件下的电池在全生命周期内,本研究提出的SOH估计方法能大致地跟踪SOH
的衰退,仅有个别循环下的SOH估计值严重偏离其真实值。由于第二组和第三组实验
的电池在容量未衰退至80%以下时便停止了实验,因此无法给出电池全生命周期内的
SOH估计值对比。但是,在第二组和第三组实验的电池已有的数据下,仍能看出,本研
上一小节讨论了IC曲线的电压区间和电压区间长度对本研究提出的SOH估计方法
的影响,得出的结论为IC曲线的电压区间长度越长,SOH的估计效果越好。因此本节
以3.8V至4.2V区间的IC曲线作为研究对象,探索采样间隔分别为0.01V、0.02V和
图2-11展示了三种采样间隔下的SOH估计结果。表2-4总结了三种采样间隔下的
当采样间隔为0.01V时,SOH估计误差最小,所有电池平均相对误差为1.50%。而
当电压采样间隔分别为0.02V和0.05V时,所有电池平均相对误差分别为1.58%和1.70%。
可以看出,电压采样间隔越小,SOH估计误差越小。这是因为,电压采样间隔越小,在
以看出,当采样间隔为0.05V时,由于相比于采样间隔为0.01V和0.02V时丢失了更多
虽然较小的采样间隔能获得更高的SOH估计精度,但是采样间隔太小,会导致输
入神经网络的采样点太多,使算法计算量增加,具体表现为程序运行时间增加:当IC曲
秒和14.974秒。由于SOH估计算法需嵌入车载锂离子电池组的BMS中,因此,在实
本章提出了一种适用于锂离子电池的基于增量容量曲线与BP神经网络的SOH在
线估计融合算法。该算法利用恒流充电阶段的电压曲线计算得到的IC曲线作为SOH估
计的特征曲线,结合BP神经网络拟合IC曲线变化与电池SOH衰退的非线性关系。对
IC曲线的分段处理解决了由于用户使用电池行为的随机性而导致的电池数据不完整的
本章首先介绍了IC曲线的计算方法,并引入高斯滤波消除原始IC曲线的噪声。然
后介绍了BP神经网络的结构与相关公式。接着给出了本章提出的算法的工作流程。最
首先介绍了数据集的实验条件信息。然后对比了不同SOH时的恒流充电曲线与IC曲
线,得出IC曲线包含了电池SOH衰退信息的结论。在高斯滤波效果的仿真中,对比了
不同高斯滤波窗口对IC曲线噪声消除效果的影响,并确定了以高斯滤波标准差σ=10的
情况下,能在保留IC曲线信息和曲线平滑效果之间取得较好的平衡。最后,对本章提
下,不同电压分段的IC曲线对SOH估计结果的影响。结果表明,IC曲线的电压区间长
度越长,SOH估计精度越高。而当IC曲线的电压区间宽度不够时,利用较窄电压范围
的IC曲线进行SOH估计也能取得不错的SOH估计精度。第二组仿线V时,不同采样间隔对SOH估计的影响。从仿真结果中可以得出
的结论为:采样间隔越小,IC曲线的电压区间长度越长,SOH估计精度越高,但也会
带来计算量增大的问题。因此,在实际应用中,需根据具体情况选择合适的采样间隔与
本章首先对锂离子电池分选技术的基本情况进行概述,并提出一种基于分层聚类的
锂离子电池分选方法。然后对所提出的分选方法中用到的动态时间弯曲距离和分层聚类
由于锂离子电池在生产过程中不可避免的制造公差,即使是同一型号同一批次生产
的锂离子电池单体之间在某些特性上也会存在差异,也即电池的内部因素导致了不可避
免的不一致性。电池分选技术可以帮助改善因电池内部因素而产生的不一致性。除了新
生产的锂离子电池单体,电池分选技术还可以用于改善从电动汽车上退役后梯级再利用
的锂离子电池的不一致性。锂离子电池在电动汽车上服役一定时间后,经过不停的充放
电,其不一致性往往更严重,各电池的老化状态、各项特性参数等的差异逐渐加大。而
当电池的容量衰退至出厂时的额定容量的80%以后,必须将锂离子电池从电动汽车上退
役。但此时锂离子电池只是不再适合用于电动汽车上,在储能电站等领域还能发挥余热。
电池分选技术在梯级利用的锂离子电池上能发挥更重要的作用,对提高梯级利用锂离子
为了使分选后的锂离子电池一致性良好,关键是选择正确的一致性判断指标。目前,
有许多学者提出了以锂离子电池的OCV、工作电压、内阻、比容量、比功率、库伦效率
和自放电率等参数中的一项或多项作为锂离子电池一致性的指标。这些分选方法操
作简单,但是上述锂离子电池参数均属于静态参量,仅仅使用静态参量作为一致性指标
无法考虑电池在实际使用中的动态特性,如电压变化率、内阻变化率等。因此,这些方
法的分选结果往往在电池没有实际投入充放电时效果良好,而当电池实际投入运行以后,
理想情况下,当锂离子电池组内各电池单体的内部各项电化学参数一致时,其外部
特性也一致,具体表现为各电池单体SOC或电量相同时电池的单体两端电压相同,即
充放电电压曲线的形状与趋势一致。而当锂离子电池单体的不一致性随着充放电的进
行而增大时,其外在表现为充放电曲线的形状、趋势、位置等的差异越来越大。因此,
以锂离子电池单体的充电或放电曲线作为电池分选依据,将充放电曲线相似的锂离子电
池单体分选为同一类,能达到分选后同一类电池一致性良好的目的。正如第二章所言,
电池恒流充电阶段的增量容量曲线一方面包含了锂离子电池的SOH信息,另一方面体
现了充电过程中电池电压变化的趋势。换言之,如果两个电池在某一电压处的增量容量
曲线的值相等,即表明两个电池在该电压处具有相似的电压变化趋势。如果两个电池的
增量容量曲线处处相等,或有极高的相似度,即表明两个电池具有极高的电压变化相似
度。因此相比充电曲线,将增量容量曲线作为分选依据,更能体现锂离子电池的相似性。
利用电池的增量容量曲线作为分选电池的依据,需要将曲线之间的相似度进行量化。
目前,度量曲线相似度的方法有欧式距离(EuclidDistance)、动态时间弯曲距离(Dynamic
弦相似度等。其中,欧式距离、明氏距离、夹角余弦相似度等计算曲线相似度的方法
属于静态距离。电池的增量容量曲线属于时间序列,而实际中的任意两条电池充电曲线,
无论是在充电曲线的长度还是采样点的数量上都存在不同,即存在平移、伸缩等变形。
而静态距离在计算时间序列的相似度时,需使时间序列在横坐标的时间轴上对齐,无法
应对时间序列的平移、伸缩等变形。DTW距离最初是用于语音识别研究时间序列相似
性的,其最大的优点在于无需将两个时间序列在时间上进行一一对齐。当时间序列出现
伸缩、弯曲或线性漂移时,DTW距离通过错位对齐,依次寻找相似度最高的错位对齐
方式并计算相似度。因此,采用DTW距离计算电池增量容量曲线的相似度具有更好的
电池分选技术的最终目的是为电芯生产者或梯次利用电芯再组装提供分组依据,以
使分组后的电池一致性良好。因此,除了判断电池充电或放电曲线的相似度以外,还需
基于相似度进行分组。正如第一章中综述的已有的电池分选方法,无监督聚类算法无需
人为划定分类阈值,更适合用于电池的分选。在无监督聚类算法中,分层聚类法是一种
以树形状进行聚类的方法。分层聚类法通常有两种类型:一是自下向上的聚合分层聚类,
二是自上向下的分解分层聚类。其中,自下向上的聚合分层聚类先将每个聚类单体视为
一个种类,然后将相似度最接近的两个单体聚合为同一个种类,并将聚合后的两个单体
看作一个单体,重新计算新生成的单体之间的相似度。自上向下的分解分层聚类与自下
向上的聚合分层聚类相反,该方法先将所有聚类单体看作同一个种类,然后将相似度与
所有集群相比最差的一个单体或由多个单体组合成的集群分裂出去,通过不断的迭代最
终将每个单体分为不同的种类。与分解分层聚类相比,聚合分层聚类更容易实现。通过
不断的迭代,分层聚类将生成一个“树状”结构,如图3-1所示。在树状结构中,距离“树
根部”越远的“树枝”,其分类的类别越细,同一“树枝”下的单体之间相似度越高。“树状”
结构可以在任意层次剪开,即进行“剪枝”,可以得到不同数量的分类类别。如在图3-1
的3层处剪开,则能得到3个分类类别,其中a、b为一组,c、d、e为一组,f、g、h为
综上所述,本章提出一种基于电池充电数据分层聚类的电池分选方法。该方法首先
利用锂离子电池恒流充电期间的端电压数据计算获得增量容量曲线,然后计算各增量容
量曲线之间的动态时间弯曲距离,将该距离作为电池充电曲线之间的相似度,最后基于
增量容量曲线之间的动态时间弯曲距离,采用自下而上的聚合分层聚类算法,实现电池
分选,提高分选后在同一组内电池恒流曲线的一致性。由于恒流充电阶段的增量容量曲
本节首先介绍动态时间弯曲距离的原理,然后介绍动态时间弯曲距离的计算流程与
在现实生活中,有许多需要对比相似度的场景,如手势识别、语音识别等,这些手
势、语音表现在数字信号处理领域中就是时间上离散的序列。为了实现手势或语音等的
识别,使计算机能读懂人的手势或语音,需要将这些时间序列与打好标签的序列进行相
似度的对比,通常以两个序列之间的距离作为相似度的指标,欧式距离是最常用的一种
距离计算方式。但是,对于时间序列而言,欧式距离存在明显的缺陷。以两个简单时间
则序列A和序列B之间的欧式距离为117,这显然是一个相对而言较大的距离,
即欧式距离的计算结果表明序列A和序列B不相似。然而,两个序列不论在形状还是趋
势上均有很大程度的相似,如图3-2(a)所示。这种情况在语音识别或手势识别中非常常
见,如同一个字母,由不同的人进行发音,不论在发音长短还是发音时间上均不同,即
时间上对不齐,但是传达的却是同一个信息。动态时间弯曲距离正是为了解决欧式距离
动态时间弯曲距离在计算时将时间序列进行时间上的伸缩、平移等弯曲,使两个时
间序列的形态尽可能一致,以获得最大的可能相似度。同样以上文的序列A和序列B为
例,倘若将序列A在第三位的10与序列B在第四位的10对齐,将序列A在第2位的1
与序列B在第三位的3对齐,并在序列A的最左端补0,序列B的最右端补0,如图3-
2(b)所示。此时根据公式(3-1)计算出来的欧式距离为13,这一距离远远小于传统的欧
式距离。上述的例子体现了对时间序列信号进行时间上的扭曲,使时间序列在最佳的对
齐位置上获得最大可能的相似度的思想,即动态时间弯曲。由此可以看出,动态时间弯
动态时间弯曲距离的计算流程如下,假设序列A=[a(1),a(2),……,a(m)],序列
②根据公式(3-1)计算序列A的第i个点和序列B的第j个点之间的距离d(a(i),b(j)),
并更新矩阵W的第i行第j列的元素w(i,j)为d(a(i),b(j)),直至矩阵W的所有元素更新完
⑤寻找数值和最小的路径,该数值和即为序列A和序列B的动态时间弯曲距离,对
其中,从元素w(1,1)通往元素w(m,n)的路径需满足以下三个约束条件:
①边界性:以w(1,1)为起点,以w(m,n)为终点。由于时间序列的先后次序不可改变,
因此,所选择的路径必须从左上角的w(1,1)出发,结束于右下角的w(m,n)。
②连续性:如果最优路径此时位于w(i,j),则对于路径的下一个点w(i,j),需满足i-
③单调性:如果最优路径此时位于w(i,j),则对于路径的下一个点w(i,j),需满足i-
综合连续性约束和单调性约束,对于路径上的点要前进只有三个方向:如果最优路
满足上面这些约束条件的路径可以有指数个,然而我们感兴趣的是最优路径,即使
铜负载不锈钢阴极电芬顿--铁碳微电解耦合系统降解喹啉和2--萘酚.pdf
部编版八年级道德与法治上册2.2《合理利用网络》同步练习题(含答案).doc
建设工程标准化协会标准:TCECS544-2018 室内真空排水系统工程技术规程.pdf
原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者